新一代ICT技术的驱动下,上演着一个又一个的“跨界融合”,可穿戴智能设备、物联网、车联网等出现,使得人们将身处无所不在的联接之中。
无处不在的联网和应用,需要强大的网络支撑,也需要保证应用的QoE。身处在网络测试领域的前沿,思博伦通信副总裁兼大中华区总经理谭昊道出了新ICT时代网络测试变化中的感受。
思博伦通信副总裁兼大中华区总经理谭昊
高速以太网:服务提供商希望升级到100G以太网交换和25G服务器连接。从测试角度看,高密度和高速率以太网测试要加速到来。
虚拟化:虚拟化已经扩展到数据中心、运营商网络以及企业网络的每一个组成部分,其背后的推动力量正是SDN/NFV的快速发展。
VoLTE、RCS测试:VoLTE时代已经到来,还伴随着VoWi-Fi以及RCS的部署。然而,VoLTE新服务的交付将是一项极具挑战性的任务。
Wi-Fi offload是大势所趋,网络负载,需要将部分业务流量分流到WIFI网络。然而,实现从移动网络到Wi-Fi无缝且安全的服务切换是关键。
思博伦在过去一两年里产生了一系列收购,谭昊谈到这些收购增强了思博伦应对新ICT时代测试的需求。
“为加强VoLTE/RCS测试方案,2014年收购Radvision技术业务部,VoLTE测试已成为思博伦许多测试解决方案的关键组成要素。在提升客户体验管理上,思博伦2014年分别收购Mobilethink及其全资子公司Tweakker,以及收购DAX Technologies,一是为帮助运营商和虚拟移动运营商(MVNO)改善用户的服务体验,二是提供大数据分析。”
Wi-Fi以及Wi-Fi offload是大势所趋
Wi-Fi每个人都很熟悉,不过如今的Wi-Fi可谓焕发新生。无处不在且易于访问的特点使Wi-Fi在运营商扩展用户体验的战略中发挥着至关重要的作用,因为运营商可以利用它将VoLTE体验拓展到蜂窝覆盖质量较差或容量有限的地区中,尤其是在室内。
另外,现在智能移动设备普及,使得解决当前网络负载过重的方案出现,就是WIFI OFFLOAD,就是分流部分业务流量到WIFI网络上。
从网络角度看,要实现从移动网络到Wi-Fi无缝且安全的服务切换,Wi-Fi AP和分流网关都至关重要。AP使无线设备能够连接至有线网络,而分流网关提供到移动分组核心网的桥接,并且是认证以及运营商服务的中继点。
谭昊介绍到,在终端测试方面,思博伦3月全新推出的方案,可在单个测试平台上实现Wi-Fi语音和Wi-Fi分流的移动性和端到端互操作性测试。
网络测试方面,验证Wi-Fi语音到VoLTE的无缝切换。Spirent Landslide原本便已具备从核心网络到Wi-Fi分流网关的测试能力,现在又扩展到支持AP的测试,这将确保移动运营商在满负载条件下能为用户提供可靠且无缝的服务。
网络测试的新兴市场——车联网
思博伦现在将网络测试的触角渗透到新兴市场。通过收购德国的企业,推出业界第一种汽车以太网测试解决方案,实现联网汽车创新。
为什么进入这一市场,谭昊举例到,宝马最新SUV X5在监控汽车周围情况的摄像头系统的影像传输中使用了车载以太网。宝马还在研究如何在进行提高车载以太网的最大数据传输速度,计划2018年将它的速度提高至1Gbps,而现在的速度仅仅为100Mbps。
车联网测试被提上日程,凭借在固定网络中以太网测试,以及无线和GPS测试领域的经验,思博伦正在与汽车行业合作,帮助其成功地实施汽车以太网。
谭昊指出,主要包括以下测试:
·用户体验:确保车载电话呼叫、应用和媒体流中实现消费级的蜂窝网络质量。
·汽车以太网:测试互用性、功能和性能。简化网络协议方面的一致性。
·车对车:通过全面测试车载数据、蜂窝、无线电和卫星信号,实现安全、强健的车对车通信。
·卫星定位系统和无线连接性等。
今年,思博伦将Spirent Day 2015的主题定为“ICT时代未来网络测试技术与实践”,的确,以移动宽带、虚拟化、云计算和大数据为代表的ICT正在进入最快的改变周期,思博伦也正引领网络测试的技术前沿。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。