至顶网网络频道 11月07日 综合消息:Mellanox公司的下一代Innova网络适配器不仅将整合强制性高速接口,同时亦将嵌入一块Xilinx FPGA芯片。
分流工作负载已经成为Mellanox适配器发展策略中的一项重要组成部分,而这显然也迎合了一部分客户的需求——正因为如此,FPGA的加入也变得顺理成章。
该公司高级营销主管Bob Doud在接受采访时解释称,即将推出的这款Innova-2适配器进一步扩展了“将对主机CPU不友好的软件负载的分流能力,通过在FPGA内加速不同功能实现网络功能提速。”
这款全新适配器将Mellanox ConnectX-5与Xilinx Kintex超大规模FPGA加以结合,且提供配置选项以加速主机应用或者网络应用。
通过配置,各板载连接机制——包括网络接口、RDMA以及PCIe——将能够实现主机加速(‘旁观’)或网络加速(‘线路内对冲’)等效果。
在线路内对冲场景下,来自以太网接口的流量将被传递至FPGA以实现网络分流,而后被交付至ConnectX-5系统芯片处,最后才抵达主机。在旁观配置下,流量则首先由该系统芯片处理,随后主机加速工作负载流量被进一步传递至FPGA处。
网上上的PCI交换机同样可以进行两路拆分。
另外,这款设备还支持OpenCAPI(即连续加速器处理器接口),Doud解释称这是为了获得IBM等行业领先厂商的支持。
“OpenCAPI是一种直接接入处理器的处理方式——能够对接IBM的Power9计算架构。这是一种经过改进的总线,类似于PCI Express——但PCIe并不属于连续接口。”
“我们的连接运行有8条通道,每条通道提供25 Gbps速率,因此其峰值数据吞吐量为200 Gbps。除去性能损耗,我们由处理器到FPGA的传输能力在160到170 Gbps之间……这意味着用户能够将一些非常重要的负载分流至FPGA处。”
这款网卡将提供两个版本,分别支持双25 Gbps以太网接口或双100 Gbps接口配置——后者可体现为200 Gbps纯以太网接口或100 Gbps以太网接口加100 Gbps Infiniband接口的形式。
Doud同时指出,以太网加Infiniband的组合也意味着用户可以对这款网卡进行编程,从而在企业内部的以太网与Infiniband存储基础设施之间提供高效桥接。
IPSec与TLS等安全应用对于内联处理体系而言必不可少,亦可用于处理DDoS以及防火墙工作负载。Mellanox公司已经将这类需求纳入发展路线图,而FPGA则能够在未来提供更显著的速度表现与编程性水平。
在旁观类工作负载方面,该公司希望能够在市场上建立起明确的客户吸引力。根据Doud的说法,其中主要包括机器学习、刚刚起步的FPGA即服务业务、区块链加速、搜索优化以及分析等等。
Innova-2网卡还将适用于存储加速场景,Doud指出其将在NVMe架构当中处理压缩与重复数据删除等常见工作负载。
当然,将FPGA引入网卡还能够帮助用户省去构建超大规模环境时所必要的时间投入。
FPGA编程
Doud表示,虽然Mellanox公司目前正在提供一系列FPGA应用以作为预设定功能(例如安全加速),但该公司亦希望拥有FPGA技术能力的客户自己动手以发挥更大的“魔力”。
Xilinx的工具包与开发套件将随这款适配器一同提供,客户亦可联系Xilinx公司生态系统内各合作伙伴以寻求更为广阔的施展空间。
根据Doud的解释,一部分Mellanox知识产权将以“垫片”的方式交付给开发人员。
“以以太网端口为例。大家可以从Xilinx处获得PHY与MAC层,而Mellanox公司则在此之后提供知识产权以实现您在ConnectX中能够找到的各类功能,具体包括负载分流以及数据包处理等等。”
同样的,PCIe MAC层将由Xilinx公司提供,而Mellanox方面则提供部分DMA引擎(例如处理数据移动),“这样客户将无需重新实现基础传输管道。”
尽管该公司并没有转型为服务厂商的雄心壮志,但其仍然组建起一支由FPGA工程师构成的团队,负责帮助客户“掌握电路板与系统相关专业知识”。
好文章,需要你的鼓励
五家光学存储初创公司正在开发长期存储技术,旨在用超过100年寿命的光学介质替代只有5-7年寿命的磁带。这些公司包括Cerabyte、Ewigbyte、HoloMem、Optera和SPhotonix,它们的技术类似微软Project Silica项目。光学存储介质具有更强的化学、冲击、辐射、水和热抗性,同时保持低能耗和高容量特性。
卡内基梅隆大学团队提出DistCA技术,通过分离AI模型中的注意力计算解决长文本训练负载不平衡问题。该技术将计算密集的注意力任务独立调度到专门服务器,配合乒乓执行机制隐藏通信开销,在512个GPU的大规模实验中实现35%的训练加速,为高效长文本AI模型训练提供了新方案。
Nutanix发布分布式主权云产品组合更新,为多云环境提供更安全的运营和管理功能。该解决方案支持企业在分布式环境中灵活部署和治理基础设施,运行传统虚拟机、现代云原生和AI应用。新功能包括支持完全断网环境的暗站点管理、政府云集群正式发布、Kubernetes平台增强安全合规性、企业AI平台集成NVIDIA微服务,以及云平台新增跨站点灾难恢复能力,为用户提供统一管理和运营简化体验。
清华大学研究团队提出3DThinker框架,首次让AI具备类似人类的三维空间想象能力。该系统在推理过程中插入特殊的三维想象符号,不依赖外部工具或大量标注数据,就能从有限的二维图像中构建三维心理模型。在多个空间推理基准测试中,3DThinker相比传统方法性能提升达50-100%,为自动驾驶、机器人导航、虚拟现实等领域的AI应用开辟了新路径。