2017年10月12日,北京 —作为阿里云十月在杭州云栖大会的合作伙伴,思科与阿里巴巴集团(以下简称阿里巴巴)展开深入合作,凭借其新一代数据中心交换网络的创新科技,助力阿里巴巴成功打造性能卓越、业界领先的新一代数据中心,有效推动网络可视化和智能化发展。这一不断更新迭代的数据中心将成为中国互联网行业平台的典范,并且持续释放云计算与大数据的无限潜能,赋能互联网经济的极速发展。
云和产业数字化是打造科技和生态相结合的智能社会的基础。阿里巴巴集团旗下的阿里云作为全球领先的云计算及人工智能科技公司之一,为200多个国家和地区的企业、开发者和政府机构提供服务。阿里云致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力,让计算和人工智能成为普惠科技。
安全的网络云架构是互联网经济生成和成长的摇篮,互联网时代数据的计算、存储、应用正在改变商业的发展模式和人们的日常生活。计算正逐步渗透到各行各业,与数据一起为各个产业提供巨大的引擎动力。随着众多客户、以及各种规模和要求的业务迁移到阿里巴巴的云平台上,作为云平台支撑的数据中心网络成为了万众瞩目的关注点,数据中心的网络运维能力则成为云平台竞争力的一个重要组成部分。在安全的云网络架构上,如何实现阿里巴巴所有商业活动中计算的经济价值,已经成为企业发展的首要任务和构建不断扩大的商务生态系统的关键。
思科作为全球科技领导者,凭借对未来数据中心发展趋势的领先洞察以及优质可靠的科技创新产品,为阿里巴巴深度定制了数据中心架构。经过全面考虑,阿里巴巴选择思科作为其数据中心架构的主要供应商之一,双方携手开启了合作之旅。
思科通过架构灵活性,助力阿里巴巴数据中心提高敏捷性并简化运营。思科为阿里巴巴25G数据中心架构部署了Nexus 9000系列交换机,以多种规格提供历经验证的高性能、高密度、低延迟和出色的能效。Nexus 9000系列交换机采用突破性的Cloud Scale ASIC技术,在思科NX-OS软件或以应用为中心的基础设施模式下运行,符合传统或全自动数据中心网络的部署需求。目前,阿里巴巴25G数据中心已经完成了规模部署,思科长期研发投入带来的价值显而易见。
在现有数据中心架构基础之上,在国内外顶尖技术研发人员的支持下,阿里巴巴数据中心目前已经快速迭代到25G/100G第二代的架构。作为阿里巴巴新一代数据中心交换网络的技术合作伙伴,思科在技术上采用16nm FF+工艺的第二代CloudScale芯片,紧密配合阿里巴巴技术迭代,3.6T和6.4T单芯片数据中心定制交换机在提高性能的同时,能够逐步降低能耗,实现性价比的线性提高。此外,随着业务的多元、热点的不同、以及底层支撑系统的演进,流经阿里巴巴新一代数据中心的海量数据给相对静态的物理网络带来了新的挑战。在思科的技术支持下,阿里巴巴的网络规划运维部门结合大数据和人工智能的技术,对网络流量、网络性能指数的数据进行实时采集和分析,通过算法来发现、处理和优化网络,真正赋予了前沿技术崭新的内涵和外延。
思科全球副总裁,大中华区首席技术官曹图强表示:“在全数字化转型浪潮中,思科始终把握着技术更新迭代的脉搏,帮助企业通过科技创新获取发展源动力。此次,思科非常高兴能够与阿里巴巴集团携手,共同进行中国互联网行业数据中心的创新尝试。未来,双方将继续在数据中心互联、流量可视化、网络感知等方面通力合作,不断为全球互联网经济发展赋能。”
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。