在上一篇文章“主流公有云产品功能性分析”中,我们对这些云主机厂商自身发布的功能性指标进行了一次简单的分析对比。而公有云主机的实际应用性能,还是无法从中进行体现。为此至顶网又策划了本次国内主流公有云主机的网络应用性能测试活动。在本次活动中,至顶网同样选择的是对阿里云、百度云、腾讯云和青云这几家主流云计算厂商的公有云产品进行评测。
网络应用性能测试,是通过模拟真实的网络应用请求,对网络产品的实际网络应用处理能力进行评测。通过网络应用测试,应该可以完全真实的评估出网络产品在现实应用中的实际应用情况。当前全球主流的网络应用性能测试仪表提供商,有思博伦和IXIA两家。
早在十几年前,这两个厂商就开始向网络及网络安全厂商提供网络应用性能的测试解决方案。当云计算、SDN/NFV技术兴起后,思博伦和IXIA公司也相应推出了针对虚拟化产品的网络应用性能测试产品。
在本次测试初期,也曾规划将他们推出的虚拟化网络应用测试工具安装到本次测试的云主机之中。(可参见“公有云主机网络应用性能公开测试方案”)从而可以对“应用请求处理速率”、“应用请求响应时延”、“并发用户数”、“应用流量”这些应用性能评估的关键指标进行最直接的评测。
然而理想很丰满,现实太骨感。在经过了多次尝试之后,这两款软件在云主机上的安装还是以失败告终。无奈之下,只能退而求其次,采用在Linux上使用的Netperf工具完成本次测试工作。
好文章,需要你的鼓励
Carma Technology 针对 Uber 提起专利侵权诉讼,称其侵犯了涉及拼车系统的五项专利。案情回溯至十年前,凸显专利保护对创新者的重要性,可能对 Uber 及其他公司带来巨大影响。
东京大学研究团队开发的WebChoreArena是一个全新的网页代理评估基准,它包含532个精心设计的任务,专注于测试AI代理处理繁琐、复杂网页任务的能力。研究结果显示,即使是最先进的语言模型(如Gemini 2.5 Pro)在这些挑战性任务上的表现也比常规任务降低了约14个百分点,证明了这一基准有效区分了不同模型的能力。WebChoreArena通过设计海量记忆、计算、长期记忆等类型的任务,为评估AI代理在实际应用场景中的表现提供了更严格的标准。
经过暂停战略调整,Automattic 宣布重返 WordPress 开发,包括核心、Gutenberg、Playground 等模块,计划今年推出 6.9 版本,并涉及与 WP Engine 的法律争端。
这项研究提出了一种名为LIFT的新型微调方法,通过在低秩近似后识别大语言模型中的主要权重进行稀疏微调。研究表明,仅更新5%的主要权重就能在推理任务上超越全参数微调,同时保持与LoRA相当的内存效率。LIFT在常识推理、算术推理等多项任务上表现优异,还能更好地平衡学习新知识与保留原有能力。这一方法揭示了大语言模型中关键参数的重要性,为资源高效的模型定制提供了新思路。