ZD至顶网网络频道 07月01日 综合消息:Mellanox今天宣布,用于数据中心型应用程序和HPC应用程序的Mellanox HPC-X可扩展框架已经能够支持网络内计算(in-Network Computing),这将显著提高HPC应用程序的性能。Mellanox HPC-X可扩展框架是一种全面的软件套装,包括适用于高性能计算环境的消息传送界面(MPI)、共享内存(SHMEM)和分布式全局地址空间(PGAS)通信库,并提供多种增强功能,可以提高网络中消息通信的可扩展性和性能。
Mellanox一直以来在技术创新领域不断加大投入,使得 HPC软件生态环境在协同设计(Co-Design)的背景下持续发展,进而去适应 “网络协同处理” 的新潮流。
最近,Mellanox推出了SwitchIB-2 ——世界上首款InfiniBand EDR 100 Gb/s智能交换机,能够在网络中管理和执行MPI算法。这样,网络就能够在数据传输过程中处理和聚合数据。这种能力被称为“SHArP” ,即Mellanox的 “可扩展分层聚合协议” (Scalable Hierarchical Aggregation Protocol)的简称。HPC-X现在可以为SwitchIB-2提供强大的软件支持,并实现与现有应用程序的无缝集成。
“HPC 能够轻松享受现有网络内计算能力带来的优势,” Mellanox公司HPC技术总监Scot Schultz表示, “通过支持SHArP技术的HPC-X,集合通信操作的性能可以提高至少十倍。从本质上说,随着系统规模的扩大,性能优势也会随之提高。”
HPC-X还提供了多种增强功能,以支持另一种革命性进步——InfiniBand路由。Mellanox提供的最新型SB7780 InfiniBand路由器能够将数据中心网络分隔为数个子网,从而提高网络弹性。这反过来又可以为数据中心网络带来近乎无限的扩展能力。HPC-X现在可以让应用程序超越本地集群资源进行扩展,并跨HPC集群的独有子网运行。此外,InfiniBand路由可以支持任意类型的网络拓扑,从而能将系统资源整合为复杂的数据工作流。
“HPC组织工作目标是解决重大的科学、商业和研究问题,因此高密度系统能够不间断的帮助他们快速的进行计算,以获得竞争优势。” 惠普企业计算的高性能计算副总裁兼总经理Scott Misage表示,“借助Mellanox的EDR网络,我们获得了一套可靠的网络解决方案,能够帮助客户最大限度提高系统效率,并消除瓶颈,从而更快的解决问题。”
HPC-X不但能够提供完整的通信库以支持MPI、SHMEM和PGAS编程语言,而且能够支持Mellanox可扩展智能互连解决方案的高性能加速器,从而优化性能,提升管理便捷性。此外,HPC-X可快速部署和交付最佳应用程序性能,而不会像购买第三方工具和库授权那样复杂并耗费巨资。
好文章,需要你的鼓励
微软宣布未来四年将在阿联酋投资152亿美元,包括首次向该国运输最先进的英伟达GPU芯片。美国已授权微软向阿联酋出口英伟达芯片,使该国成为美国出口管制外交的试验场和地区AI影响力锚点。这笔投资包括2023年以来的73亿美元支出和2026-2029年的79亿美元计划投入,涵盖数据中心建设、人才培训和AI基础设施扩展,目标到2027年培训100万当地居民。
NVIDIA联合多伦多大学开发的ChronoEdit系统通过将图像编辑重新定义为视频生成问题,让AI具备了物理常识。该系统引入时间推理机制,能够想象编辑的完整变化过程,确保结果符合物理规律。在专业测试中,ChronoEdit超越了所有开源竞争对手,特别在需要物理一致性的场景中表现突出,为自动驾驶、机器人等领域的应用提供了重要技术突破。
OpenAI与亚马逊云服务签署七年380亿美元协议,在微软Azure之外增加另一个超大规模云服务商来满足其不断增长的AI计算需求。该协议将让OpenAI立即获得AWS EC2 UltraServers访问权限,计算能力将在未来七年内扩展至数千万个CPU。AWS还将为OpenAI构建基于英伟达Blackwell芯片的定制基础设施。尽管签署了这一大额协议,OpenAI仍将继续依赖微软Azure作为其主要云计算合作伙伴。
这项研究提出了MITS框架,使用信息论中的点互信息指导AI推理过程,解决了传统树搜索方法计算成本高、评估标准模糊的问题。通过动态采样和加权投票机制,MITS在多个推理数据集上显著超越现有方法,同时保持高效的计算性能,为AI推理技术开辟了新方向。