从越来越多的数据产生自网络边缘的那一刻起,意味着就近提供边缘智能服务的边缘计算将发挥巨大的作用。简单地理解边缘计算的涵义,就是将集中式的数据存储、处理模式下沉到网络边缘,它和云计算的概念相对,当然并不是取代关系。
近两年来,边缘计算这个词频繁被提及,得益于前期ETSI、3GPP等国际标准组织的推动,2016年在国内成立的边缘计算产业联盟(ECC)也致力于推动边缘计算在行业数字化转型中发挥作用,近期OpenStack基金会甚至也成立了专门的工作组以关注OpenStack对边缘计算平台的支持。
当然,除了标准组织和机构对边缘计算的推动,包括全球各大通信服务提供商、ICT设备提供商、芯片厂商、解决方案提供商、内容提供商等都加入了对边缘计算的探索,甚至推出了相应的产品解决方案以及试点案例。
产业各方都在提边缘计算,但你知道它该如何进行部署,又该需要一个什么样的“芯”?要知道边缘计算部署并不是将云计算挪个位置那么简单。
“边缘”的限制
在边缘计算产业发展进程中,通信服务提供商无疑是比较积极的,以其对边缘DC的改造来说就面临诸多瓶颈。和核心机房不同,一般来说边缘DC部署的位置、空间、供电都有其特有的限制,所以硬件设备架构上就需要个性化的开发和配置来适配边缘计算平台的需求。
以刀片式服务器举例,动辄10U的起步安装高度以及超过5kw的功耗需求,这往往是大多边缘侧机房不能满足的,尤其是散热和承重方面,对边缘DC改造挑战巨大。
当然,支撑边缘业务的基础平台还有很多,例如存储、边缘计算网关、特定边缘应用设备等。以功能来说,数据面的下沉意味着它需要流量的快速卸载能力、图像快速识别能力、易扩展能力、甚至人工智能等。所以,整体看来,边缘计算平台所要求的硬件设备架构,如本地计算、存储、平衡I/O、硬件加速、高集成度、设备能效比都会成为需要考虑的关键因素之一。
所以,从芯片的角度,它也要适用于边缘设备在性能、能耗与尺寸之间进行平衡。
一颗将智能扩展至边缘应用的“芯”
如果观察边缘计算的发展进程,可以发现英特尔一直是其技术创新和产业协作的重要参与者和推动者。1个月前,英特尔推出了全新的至强D-2100处理器,它是一个专用于传统数据中心之外进行计算的新型芯片系列。
英特尔至强D-2100处理器是首个可满足低功耗、高密度边缘计算需求的处理器产品。该系统芯片(SoC)处理器旨在满足受限于空间和功率的边缘应用、其他数据中心或网络应用的需求。
如上提到,边缘计算设备在性能、能耗、集成度、硬件加速等方面提出特别需求,毫无疑问,至强D-2100满足了这一需求。在拥有4到18个核心、多至512GB的可寻址内存的同时,此系统芯片还拥有集成的平台控制器中心(PCH)、集成高速I/O、最多4个集成10 Gb英特尔以太网端口,以及一个60-100瓦的热功耗设计点(TDP)。它与英特尔至强可扩展处理器运行着相同的指令集,提供软件运行的一致性并可其从数据中心扩展至边缘。
英特尔至强D-2100处理器的集成功能还包括:硬件增强的虚拟化技术、16个SATA接口、英特尔高级矢量扩展指令集512(英特尔AVX-512),以及可实现高达100 Gbps的编码、加密和解密加速的增强版英特尔 QuickAssist技术(英特尔QAT)等。
与上一代英特尔至强D-1500处理器相比,至强D-2100提供高达1.6倍的通用计算性能、高达2.9倍的网络性能,和高达2.8倍的存储性能。毫无疑问,在边缘计算受限于运行空间和更低的低功率需求时,至强D-2100所具备的可扩展、紧凑、节能的特性是那些寻求最高每瓦特性能的设备制造商的理想解决方案。
英特尔至强D-2100加速边缘应用
英特尔至强D-2100处理器将英特尔至强可扩展平台架构级别的创新带入了单个可用于低功耗、高密度解决方案的系统芯片,并整合了网络、安全和加速能力。如果问它适用的使用场景有哪些?面对通信服务提供商加速网络变革的迫切需求,至强D-2100首先满足了通信服务提供商对于边缘DC改造的需求,即其能 够在一个功耗和空间限制的商用服务器中满足具有增强分析功能的多接入边缘计算(MEC)的低延迟和高带宽应用需求,例如VR/AR和自动驾驶等。
除了支持通信服务提供商提供强大的边缘计算能力,它还非常适合其它功率和空间受限的使用场景,例如:
• 存储:英特尔至强D-2100处理器可用于针对密度优化的、轻型超大规模云工作负载任务,例如动态Web服务、内存缓存、专用主机和温存储。
• 内容分发网络:该处理器可以为网络边缘的内容分发提供更高的性能,这对于确保视频直播以及处理大规模媒体文件时实现低延迟至关重要。
• 企业网络:该处理器系列还适用于入门级企业SAN和NAS存储、中端路由器、网络设备、安全设备、无线基站和中端嵌入式物联网等应用。
总结起来说,业界虽然已经出现了一些边缘计算相关部署的案例,但大多是POC和试点,产业界各方仍然在积极探索其成熟的商用部署模式。英特尔至强D-2100处理器的面世毫无疑问提供了一个适用于边缘计算应用的最佳平台,从而加速其商用进程。
好文章,需要你的鼓励
一项调查显示,31%的美国技术领导者表示,由于AI转型的紧迫性,CEO与CIO的合作比一年前更加密切。79%的技术领导者认为企业对AI的关注提升了他们在董事会层面的地位。数据分析和AI成为企业未来12个月的重点投资领域,37%的受访者将其列为优先事项。虽然28%的技术领导者预测首席AI官将承担CIO职责,但86%的企业尚未设立该职位。
ETH苏黎世大学研究团队提出OBR(最优脑重建)框架,创新性解决了大语言模型压缩中量化与剪枝方法的根本冲突。通过"分组错误补偿"机制,OBR实现了W4A4KV4+50%稀疏性的极端压缩,在保持优秀性能的同时获得4.72倍速度提升和6.4倍内存节省,为边缘设备部署大模型开辟新道路。
答案引擎优化(AEO)正在重新定义真相的标准。与传统搜索引擎优化不同,AEO让AI系统直接生成答案,而非提供链接。研究显示70%的人会直接接受机器提供的信息,不加质疑。当资本主义与此结合,真相本身变得可以被购买和优化。AEO实质上是一种设计性审查,通过专有数据和封闭算法隐藏推理过程。我们需要重新引入摩擦和质疑机制,要求算法透明度和可追溯性,否则现实本身将成为可以随意调节的设置。
斯坦福大学研究团队开发出概念组合学习框架,让AI系统像人类一样学会"举一反三"。该技术将复杂学习任务分解为基础概念模块,通过灵活组合处理新任务,学习效率比传统方法提高10倍。实验显示在多概念组合任务中准确率达78%,并具备跨领域迁移能力。这项突破为通用人工智能发展奠定重要基础,预计将在医疗、教育、自动驾驶等领域率先应用。