当前云计算应用日趋火热,云计算所提供的大数据分析、人工智能,乃至于物联网等全新的应用也已经成为用户所关注的热点。但是云计算的基础——计算能力,却长期受到忽视。
在云计算的虚拟系统中,网络的数据转发、存储的数据传输乃至于整套云计算系统的管理控制,均需要依靠CPU的运算处理能力进行支撑。这些运算资源的消耗,都会对云计算系统的计算能力产生影响。然而在云计算的IaaS层,计算、存储、网络又是决定上层各类新兴云服务和客户业务稳定、高效运营的基石,是一个云计算系统的核心竞争力。因此,云计算系统的计算能力也成为了云能力评估小组所关注的重点项目之一。
借着华为云近期推出新一代采用Xeon SkyLake CPU C3系列云主机产品的机会,云能力评估小组展开了“新一代至强处理器在云计算系统中运算处理能力”的评测活动。下面我们就来看一下,在传统网络、计算、存储上均有扎实技术积累的华为,在虚拟化的云计算系统中是否会有同样的技术实力展现。
在本次华为云C3云主机测试项目上,除了云计算IaaS层最主要的计算、存储和网络性能之外,还对云主机的内存带宽同样进行了测试。在计算性能方面,我们选择用的是可以跨平台使用的性能测试软件Geekbench来对CPU的整数、浮点运算处理能力进行测试。在存储性能方面,通过fio对存储产品的传输速率(IOPS)和带宽进行测试。在内存性能方面利用stream对内存带宽进行测试。在网络性能测试中,我们还继续沿用Netperf对网络带宽和网络连接处理性能进行测试,并利用Iperf对网络的数据包转发性能进行测试。具体测试结果如下:
提起云主机的计算性能,现在谈的最多的是Scale Up、Scale Out的横、纵向扩展和计算资源的灵活复用,单台云主机的计算能力却少有人去进行了解。从系统架构的角度去看,这样做是没有问题的,单台云主机的计算资源毕竟是有限度的,要满足多变的应用需求,必须要有灵活的资源调度能力。
但是从用户使用的角度讲,多购买一台云主机就要多增加一份成本投入,提升虚机配置的成本因素也需要去进行考虑。因此,单台云主机计算性能的“含金量”问题,开始显现出来了。
下面我们就来看一下,华为云C3云主机的计算性能:
由于云主机大多采用的是Linux操作系统,因此在本次测试中,选用的是可以跨平台使用的Geekbench测试工具来对华为云C3云主机进行测试。华为云C3云主机采用的是Intel 全新一代Xeon SkyLake CPU,CPU型号为6151、(为Intel的定制型号)。在云主机配置上,我们选用的是4核16G内存。Geekbench测试结果如下:
Geekbench是通过一系列数据加密、数据压缩、图像压缩、图形计算、脚本处理和路径计算的方式,对CPU的整数类型计算能力进行测试,并通过期权价格模似、图像的生成、锐化和模糊以及物理仿真、3D几何场景描述类的浮点计算功能对CPU的浮点计算能力进行测试。并将各个测试结果综合后,统一对CPU的整数计算和浮点计算能力进行打分。
考虑到单一的测试打分结果并不好对云主机的计算能力进行分析。因此我们选用Geekbench网站上公布的,采用同版本测试软件测试并与本次测试云主机配置相近的至强E3-1270 v5的测试结果和另一相同配置的主流云主机进行Geekbench测试后结果进行综合对比。
通过CPU综合性能对比我们可以了解,虽然Xeon E3-1270 v5主频高达4.0GHz,并且还有超线程技术助力,但也只是在单核CPU的整数性能上略胜华为云C3云主机一筹,在单核CPU浮点性能上和多核CPU整数、浮点性能上均被华为云的C3云主机超出。华为云C3云主机和参与对比的,同样采用Xeon SkyLake CPU的同配置云主机相对比时,更有着14.8%的性能优势。而我们在对比中,也并未选用多核CPU处理性能过低的云主机来进行对比。
Geekbench整数测试分类线图
Geekbench浮点测试分类线图
为了对Geekbench的测试结果进行核验,我们对Geekbench的整数和浮点测试分类细项测试结果也进行了整理对比。在对比结果线图上,也基本上呈现出和综合性能打分相近的结果——三者的测试结果比较相近,华为云C3云主机与Xeon E3-1270 v5的单项测试结果互有胜出,单核结果Xeon E3-1270 v5比较有优势,多核结果则是华为云C3云主机更加出色。
由此可知,在计算性能方面,华为云C3云主机不但具备出色的云主机计算性能,甚至与物理服务器相对比,也有着不凡的性能表现。
除了CPU计算能力之外,在应用处理时,需要调用的数据信息大多需要在内存中进行缓存。内存带宽不足,数据传输不能尽快向多核CPU上进行分发,也会对多核处理器的计算能力产生影响。因此内存的调用和数据处理性能,也是云计算处理能力的一个重要测试指标。
在内存测试中,云能力评估小组选用了测试工具Stream,并利用64M的大页面来对华为云C3云主机和对比公有云主机进行了测试,测试公有云平台依然选用的是四核16G云主机。
Stream在对内存带宽进行测试的时候会进行四种操作:Copy、Scale、Add、Triad。
Copy,先访问一个内存单元读出其中的值,再将值写入到另一个内存单元。
Scale,从内存单元读出其中的值,作一个乘法运算,再将结果写入到另一个内存单元。
Add,从内存单元读出两个值,做加法运算,再将结果写入到另一个内存单元。
Triad,是将上面三个操作组合起来。
从内存带宽性能对比的柱状图我们可以看出,华为云C3云主机的存储带宽性能最好,参与对比的云主机为次,双方有大约5%左右的性能差距。
系统内存的容量毕竟有限,对于数据的存储还是要依靠硬盘或者SSD来进行支持。接下来云能力评估小组采用现在比较成熟的fio测试工具,利用4K块大小和1M块大小对华为云C3云主机和对照平台大小为800G的SSD云盘、高效云盘和普通云盘的IOPS和带宽进行了测试。测试结果表格统计如下:
为了便于用户查看,我们将各项测试的高、低测试结果,在表格中以不同颜色进行区分。从中不难看出,在存储性能中,华为云各项测试成绩依然领先。参与对比的云主机无论在带宽性能还是IOPS方面与华为云相对比,均有一定的性能差距。
但这里需要说明的是,从存储测试结果来看,参与对照平台有明显的限速情况。对云计算资源的合理控制,云能力评估小组始终是抱以一种支持的态度的。云计算系统虽然可以组建的非常庞大,但其内部每个节点可提供的资源毕竟是有限制的,合理对内部资源进行控制比如当前存储的IO传输速率和存储带宽,有利于云计算整体稳定性和可靠性的提升。但是由于目前尚缺乏统一的存储数据传输性能评估标准,因此尚无法对云存储性能限速进行合理评判。以后有机会云能力评估小组也会再尝试与相关厂商进行进一步沟通,力争进早对云存储应用性能整理出一个合理的判断基准。
去年虽然我们已经进行过了一次公有云主机的网络和网络应用性能评测,但是对华为云有所疏忽。这次借着对新CPU处理能力评测的机会,也重新对华为云C3云主机的网络和网络应用性能进行了一次测试。并且还是选择上面测试中同一公有云厂商产品进行性能对比。
从网络性能的测试成绩来看,华为云C3云主机充分继承了其网络技术起家的优良传统。不但为被测云计机分配了近2Gbps的内部传输网络带宽,在网络的数据包转发能力上,居然还达到了接近小包线速的超高转发性能。而且在TCP_RR和TCP_CRR的测试中测试成绩也是大幅度的领先。但是正如上次网络和网络应用测试中所分析的一样,在正常网络应用中很少会出现如此高的网络应用需求,如此高的网络性能配置是否会带来云计算系统资源的浪费还有待去更深入的进行了解。通常网络应用中的数据包转发速率在每10Mbps带宽下提供2KPPS左右的数据包转发速率基本上就可以满足绝大部分的应用需求了。因此参与对比的云主机在网络层的转发性能目前是完全可以满足正常网络的应用,并留有了一定的转发性能余量了。当然对于云主机的用户而言,同样的价格区间内,更高更好的网络性能也完全是喜闻乐见的一个事情,同时随着高并发应用的增加,对网络层的转发性能的要求也在不断提升。目前看来华为云同配置的云主机价格还是这三个公有云中最有优势的一个,这就不得不让人由衷的佩服了,希望在今后这种优势依然可以得到保持。
通过这次云主机基础性能测试,我们可以看到华为云可谓“后来者居上”,无论是在计算性能、内存性能、存储性能还是网络性能上,均以十分明显的优势领先于其它相对比产品。但是在网络性能方面,过高的性能配置是否会造成整体资源的浪费还有待进一步了解。
当然,在网络和存储方面,我们一直在孜孜不倦的追求更大的带宽和更高的处理性能,但在云计算领域,统筹的规划来确保整个云系统的有效运营同样重要。在这方面,经验弥足珍贵,而这无法依靠性能指标进行评判。选购云服务的小伙伴需要参照数据再进行综合考虑。
虽然云计算已经有了十多年的技术发展,但是新硬件、新技术、新应用依然是层出不穷。一时的领先但疏忽了对新技术的掌握,可能瞬间就被超越。只有在不断的应用技术积累的情况下,不停夯实自身的技术基础,才可以走的更远。目前领先者也不能骄傲,云计算的技术征程才是刚刚起行,只有在实际的用户应用中不断的摔打,最后站立着的才能笑傲群雄。
云能力评估小组也将再接再厉,继续将用户所关注的各类云计算应用项目,通过产品测试的形式更多的向大家进行展示。
HUAWEI CONNECT 2018作为华为自办的面向ICT产业的全球性年度旗舰大会,将于2018年10月10日-12日在上海隆重举行。本届大会以“+智能,见未来”为主题,旨在搭建一个开放、合作、共享的平台,与客户伙伴一起共同探讨如何把握新机遇创造智能未来。欲了解更多详情,请参阅:
https://www.huawei.com/cn/press-events/events/huaweiconnect2018
好文章,需要你的鼓励
尽管全球企业AI投资在2024年达到2523亿美元,但MIT研究显示95%的企业仍未从生成式AI投资中获得回报。专家预测2026年将成为转折点,企业将从试点阶段转向实际部署。关键在于CEO精准识别高影响领域,推进AI代理技术应用,并加强员工AI能力培训。Forrester预测30%大型企业将实施强制AI培训,而Gartner预计到2028年15%日常工作决策将由AI自主完成。
这项由北京大学等机构联合完成的研究,开发了名为GraphLocator的智能软件问题诊断系统,通过构建代码依赖图和因果问题图,能够像医生诊断疾病一样精确定位软件问题的根源。在三个大型数据集的测试中,该系统比现有方法平均提高了19.49%的召回率和11.89%的精确率,特别在处理复杂的跨模块问题时表现优异,为软件维护效率的提升开辟了新路径。
2026年软件行业将迎来定价模式的根本性变革,从传统按席位收费转向基于结果的付费模式。AI正在重塑整个软件经济学,企业IT预算的12-15%已投入AI领域。这一转变要求建立明确的成功衡量指标,如Zendesk以"自动化解决方案"为标准。未来将出现更精简的工程团队,80%的工程师需要为AI驱动的角色提升技能,同时需要重新设计软件开发和部署流程以适应AI优先的工作流程。
这项由德国达姆施塔特工业大学领导的国际研究团队首次发现,当前最先进的专家混合模型AI系统存在严重安全漏洞。通过开发GateBreaker攻击框架,研究人员证明仅需关闭约3%的特定神经元,就能让AI的攻击成功率从7.4%暴增至64.9%。该研究揭示了专家混合模型安全机制过度集中的根本缺陷,为AI安全领域敲响了警钟。