近年来,尽管4G依然有很大的发展空间,但各大企业有关5G的研发始终未曾放松。综合来看,除此前国际电信联盟确定了5G发展路线图外,全球范围内地区和国家级的相关规划并不多。不过这种情况在最近一段时间似乎有了改变——美国高调宣布开放高频频段用于5G,开全球之先河,并将启动国家级5G研发; 在欧盟,以运营商为主体的17家企业联合发布“5G宣言”,从民间向政府传达压力,欧盟随即发声将大力支持区内5G发展,大规模规划箭在弦上。此番,两大 曾经的技术高地同时发力,不难看出是要在即将到来的5G领域重夺优势,其决心之巨从举措细则一看便知。
美国:率先开放高频频谱
全面启动5G研发
7月14日,在美国联邦通信委员会(FCC)主席汤姆·惠勒眼中是“一个大日子”。这一天,FCC投票同意开放大量24 GHz以上高频频谱用于5G,使美国成为全球首个为5G开放高频频谱的国家。
FCC表示,新的规则实现了不同频谱接入方式的平衡,包括独家使用许可、共享接入和未授权接入,以满足各种不同的需求和使用案例。FCC还通过了其 他灵活的服务和技术法规,使新技术和创新能够在排除不必要的规定性管制的前提下演进。此外,FCC还在新的无线服务、当前和未来固定卫星服务运行和联邦政 府使用之间达成了平衡。该项目采用了有效的共享计划来确保不同的用户(包括联邦和非联邦、卫星和地面、固定和移动)可以共存和发展。
虽然5G技术仍在开发阶段,但FCC这一最新的法令,将为美国5G领域的商业投资提供至关重要的方向指导。汤姆·惠勒在会议上表示:“今天是我们国 家的一个大日子,也是FCC的大日子。我认为,这一法令将会是FCC今年作出的最重要的一个决定。通过成为首个确定(5G)高频段频谱的国家,美国正在领 航高容量、高速和低延迟无线网络5G时代的发展。”
据专业人士介绍,事实上,国际上对于5G已有规划,目前是暂时使用6GHz以下的频段进行标准设计。对于更高频段的使用,会在2019年的世界无线 电大会上确定并通过,预计到2025年前后运营商才会将其投入使用。但显然美国并不想等那么久。据悉,惠勒今年6月首度提出重新分配高频频段,仅一个月就 出台了相关规划可谓迅速。但对于美国来说,最先启动也有风险。美国要保证其所分配的5G频段规划能成为国际通行标准,否则届时设备兼容互通都会成为问题。
美国宣布开放高频频段仅仅过了一天,白宫即宣布将投资4亿美元支持5G无线技术研究,以保持美国在无线技术领域的领先地位。按照这项“先进无线研究计划”,美国将在未来7年建设4个小城市规模的5G无线技术测试平台。
欧盟:年底出台行动计划
网络中立仍是变数
近日,欧盟内有关5G的最大动作莫过于17家企业的联合表态。包括德国电信、意大利电信、沃达丰在内的17家欧洲电信运营商本月初发布了“5G宣 言”,承诺将于2020年前在欧洲每个国家的至少一座城市推出5G网络,但前提是各国政府必须弱化于今年4月30日生效的“网络中立性”规则。
“5G宣言”是一份长达7页的文件,详细描述了这些公司如何于未来几年内在整个欧洲部署5G网络。同时也警告欧盟监管部门,必须确保一个开放的互联 网,鼓励各国政府弱化监管规定。欧盟的“网络中立”规则对不公平的封锁、连接速率的限制以及付费购买Web流量的优先使用等作出了限制。欧洲电信运营商在 “5G 宣言”中指出,“目前的网络中立性指导方针给围绕5G的投资回报带来显著不确定性”,“因此投资可能推迟,除非监管机构采取积极态度对此规则进行更新并坚 持到底”。这些电信运营商还再次呼吁对Skype和WhatsApp等OTT通信服务,按照对电信运营商同样的规则进行管制。
该“5G宣言”指出:“除了资助5GPPP(5G公私合作)的研究和创新项目,欧盟委员会应该考虑拨款,围绕5G技术进行试验和大规模演示,并建立一个5G风险投资基金以便促进新型创业和创新。”此外,还有许多关于共同标准、生态系统以及共识的讨论。
对此,欧盟主管数字经济的委员奥廷格也表示欢迎。奥廷格称“5G宣言”是5G行动计划的重要纲领。他表示“5G行动计划”将“带来动力,确保各成员 国朝着一个共同的目标努力:于2020年部署5G并打造世界一流的连接基础设施用于提供如汽车、医疗、能源、媒体和制造业等数字业务”。
除欧美外,5G在亚洲的发展也值得关注。目前看来,各国和地区普遍将2020年作为5G商用的节点,但韩国运营商已明确表示将在2018年平昌冬奥 会时试商用5G业务。专业分析公司Ovum近日预测,全球5G用户将在2021年年底达到2400万,届时全球将有20个市场商用5G,其中北美和亚洲各 占 40%的用户,主要集中在美国、日本、中国和韩国等几个国家。而欧洲届时会占到全球5G用户的10%。相比之下,爱立信的预测则更为乐观,该公司预计同期 全球5G用户将达1.5亿。Ovum称,主要原因是其预测中仅考虑了5G宽带连接订户,而未将窄带物联网等用户计入。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。