“SDN不是某个固定的解决方案或成熟的网络模式。它是通过从传统网络剥离出控制平面,从而实现集中管理,让硬件资源的傻瓜化,进而实现资源的池化。来提升运维能力,转换后台网络服务为前台产品,推动业务变革,实现传统IT人/组织的业务突破。”阿里巴巴网络架构师陈源说。
陈源介绍阿里巴巴的SDN实践时指出,一是来自传统运维的推动力、二是来自集团业务的推动力。
以运维来说,第一要要在很短的时间内实现网络的快速交付,第二是大量的网络变更需要自动化的工具做ACL,三是怎么让网络故障处理对业务的影响降到最低,四是千差万别CLI版本及设备型号的差异,有没有一种方式做集中管控,五是网络规划赶不上业务变化,六是网络流量的无序,这些推动SDN的阿里的应用。
陈源讲到了SDN在阿里巴巴的三个实践,第一个实践在阿里内部称作“一带一路”,主要是基于BGP flowspec/bmp/evpn/调度的海外骨干网。“阿里巴巴在海外有很多线下的商家,线下的企业都可以通过它本地的网络接入。目前在四个地方已经打通了,法兰克福、香港、圣何塞和杭州,这是我们SDN在阿里做的第一个案例。”
第二个实践是Vxlan in IDC,“这个网络架构,做网络的应该都非常熟悉上面是核心,核心是八台。所有的接入的服务器都是定制的服务器,接入到万兆接入交换机上来。四个端口做一个捆绑,上面到分布层,这里放了两个,一共44个,八台乘以44,最后针对八个核心下面,能够承载的服务器规模大概是16800台左右。这16800台物理服务器,大概会承载二十到三十个虚拟机,所以最终的计算规模大概是有40万。虚拟机上,虚拟机和虚拟机之间在数据中心内部,有很灵活的迁移的需求,今天我这一百台虚拟机可能在这个业务平台上用。”
第三个SDN的实践是在WIFI这个层面。“我们网络的触角现在不 仅仅是在我们的办公网,还下沉到我们商家,大型的像银泰,我们接管它的网络设备。”
陈源指出,“有的商户可能非常小,AP的漫游在一个二层的环境里面它可以很频繁的去切换。如果在一个大型的面积可能上万平方的一个购物中心里面,网络在一个大二层的话,会非常差。我们的控制器在云上这个云和它的下面这一端网络环境特差,这个漫游必须用AB和AP之间做决策。”在这样一个控制平面下实现用户的跳转,最终整个系统的管制是在阿里云,是在线上的虚拟机上,后面网络平台搭好之后,网管监控统一认证也是在阿里云。这个是由数据平台事业部实现的,它的整个的计算和处理也都是在阿里云,后台会对接阿里巴巴的广告推送系统,如果某个用户在淘宝上看了一双鞋你没有买,假如某天到印象城打开的WIFI的时候,会发现马上会看到没有买的鞋,这就是阿里巴巴要做的事情。
另外,要对人员实时定位和轨迹记录,当把车停在停车场的时候,只需要掏出手机,把APP打开它可以进入你当前的位置,自动告诉你这个路径要怎么走。无论是阿里妈妈的精准广告推送系统,还是人员实时定位和轨迹记录,或者应用分发,都是阿里云CloudWiFi系统调度中枢实现的。
总体看,无论是配置推送和管理、流量调度、自动化测试、流量可视化和统一监控,都进行了一定程度上的落地。
好文章,需要你的鼓励
2025年人工智能在企业中实现突破性应用,从实验阶段转向实用阶段。八位代表性CIO分享核心经验:AI工具快速进化、需保持快节奏实验思维、重视工作流程而非组织架构、数据质量成为新挑战、采用前瞻性指标管理项目、无需等待完美时机、AI既是技术也是社会文化现象、需严格项目管理、变革重在人员而非技术、多智能体架构成未来趋势。
NVIDIA研究团队构建了迄今最大的数学推理数据集Nemotron-Math,包含7500万条推理轨迹,通过多模式推理和工具集成让AI在数学竞赛中达到100%满分。该研究还提出了创新的分桶训练策略,将超长文本训练效率提升2-3倍,为AI数学推理能力的突破和实际应用奠定了重要基础。
日本科技投资巨头软银需要在年底前筹集225亿美元,以履行对AI合作伙伴OpenAI的资金承诺。软银是OpenAI价值5000亿美元Stargate数据中心计划的主要资助者之一。为筹集资金,软银CEO孙正义可能动用多种手段,包括利用其持有的英国芯片设计公司Arm股份作为抵押贷款。软银已清仓英伟达股份为该项目提供资金,目前可通过Arm股份借贷115亿美元,还持有价值110亿美元的T-Mobile股份及270亿美元现金储备。
清华大学研究团队提出JustRL方法,用单阶段训练和固定参数的简单强化学习配方训练15亿参数AI模型,在九个数学基准测试中达到54.9%和64.3%的平均准确率,性能匹配或超越复杂多阶段方法,同时计算资源减半。研究挑战了AI训练中的复杂化趋势,证明简单方法的有效性。