今年5月, 国务院办公厅印发《关于加快高速宽带网络建设推进网络提速降费的指导意见》,提出加快基础设施建设,大幅提高网络速率,包括高速宽带网络建设和提升骨干网络容量及网间互通能力。
此次宽带提速在技术演进上有如下几个特点:以接入网来看,PON将是主要的接入网技术,10GPON、10GEPON设备成熟。中长期来看,还需要其他PON技术,目前主流的研究方向有TWDM-PON、WDM-PON和OFDM-PON等,WIFI接入也会从802.11n逐步过渡到802.11ac。骨干网方面,随着全球100G系统的规模部署,业界的关注点开始转向400G和1T两个超100G速率。
无论是接入网还是骨干网的建设,网络全面升级的同时,也带来更大的测试需求,包括性能和稳定性测试,这也是宽带网络最基本的要求,另外还有应用层真实业务模型测试等。
思博伦大中华区总经理谭昊
面对高速宽带网络建设的庞大需求,助力宽带提速降费,思博伦做好了准备。思博伦大中华区总经理谭昊接受媒体采访时表示,“思博伦拥有从骨干到接入,从高端到便携,从物理到虚拟,完整的测试解决方案,为中国的高速宽带网络建设提供全面、完整的测试解决方案。”包括了骨干网的40G/100G/400G测试方案;接入网的PON测试方案, Wi-Fi测试方案, 10G/1G双速卡, 2.5G等;云/数据中心方面的10G/25G/40G/50G/100G, 虚拟化测试方案;以及便携式测试平台Spirent TestCenter C1,C50等。
核心网上,服务提供商希望升级到100G以太网交换和25G服务器连接。从测试角度看,发展趋势主要是高密度和多速率。
谭昊指出,在400G测试领域,今年6月,业界首个单端口400GE互通性公开演示亮相Interop东京展会,思博伦携手华为展示了路由器单端口400GE互通性。并且,思博伦400G以太网测试系统荣获了东京Interop展会Best of Interop金奖。 测试方案可以验证400G以太网的性能、功能和互通性,推动高速IP网络的发展。而早在2014年,思博伦通信、赛灵思携手华为在北京举行新闻发布会,发布了全球首个路由器单端口400GE及测试平台,并进行联合验证。
在100G测试领域,思博伦拥有全系列的产品。2009年思博伦推出业内第一张100G测试模块,占据2个槽位的空间,1个端口;2014年推出的测试模块占据1个槽位的空间,拥有4个端口,密度提高8倍;2015年最新推出的测试模块占据1个槽位的空间,拥有8个端口,密度再次提升。该8端口100Gb测试模块,支持native QSFP28和CFP4接口。
接入网络方面,性能是当前宽带接入网络最重要的关注点。
思博伦通信宽带网络测试解决方案,从2006年起一直广泛应用于包括中国电信,中国联通,中国移动和广电在内的整个宽带接入网络Eco-System的选型测试,研发测试和运维测试中。解决方案包括Spirent Testcenter数据网络测试仪产品,DLS线路仿真仪和Attero网络损伤仿真仪。在硬件上提供从千兆到100G各种速率的以太网接口,软件上支持L2-L7测试功能。
最近,针对宽带接入测试,思博伦更是新推便携式入门级测试平台C50以及10G/1G双速卡。C50是便携式测试平台,支持全2-7层测试,支持10G/1G接口组合,支持时钟同步选项,可级联,操作简单。
Wi-Fi测试方面,思博伦方案可验证Wi-Fi语音到VoLTE的无缝切换。Spirent Landslide将通过RF接口支持对Wi-Fi AP的测试,全新的Wi-Fi RF接口模块将实现Wi-Fi网络上语音等移动服务的端到端验证。Spirent Landslide原本便已具备从核心网络到Wi-Fi分流网关的测试能力,现在又扩展到支持AP的测试,这将确保移动运营商在满负载条件下能为用户提供可靠且无缝的服务。移动运营商和设备厂商可验证用户在各国移动网络、运营商Wi-Fi热点和专有无线网络之间漫游时的体验。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。