华为资助美国大学进行基础研究,研究成果将造福大众,不会对美国构成威胁。
——徐直军
不久前,几名美国国会议员严厉地批评了华为,还要求美国教育部长调查华为与美国大学的基础科研合作项目是否会对美国国家安全构成威胁。我认为这些行为显示了他们对科学的无知。最近在接受媒体采访时,我提到这些批评是“无知的”。
我并不想进行人身攻击。相反,我只是希望强调学术自由的重要性。学术自由是现代大学的基本属性,是一切科技进步的基石,有助于培养下一代科研人才。
学术自由是高等教育的基石。正是由于美国大学能保持学术自由,不受政治和外部因素干扰,才吸纳了全球最优秀的人才到美国学习和研究,成就了美国的全球技术领导者地位。
我是一位从事过基础研究的工学博士。根据美国国家科学基金会的定义,“基础研究”是指“致力于获取新知识或理念,但不考虑具体流程或产品应用的活动”。
企业的研发活动主要聚焦商业应用,而大学则关注数学、算法、材料科学等不太可能创造收益的应用。即使某个研究项目最终会产生回报,从理论研究到商业化可能需要花费数十年时间。
大学与企业的合作能够有效缩短这个过程。企业、学术界和研究机构之间的知识和资源交换(也称“知识转移”)已经成为推动科技进步的关键动力。
然而,过去十年间,美国联邦政府向大学研究项目提供的资金在持续下降,如今占大学总研究资金的比例低于50%。
余下的大部分资金来自华为等企业提供的赞助。华为向美国大学提供的研究资金相对有限,去年约为1,000万美元。但我们提供的支持正是大学所需要的,包括资金、场地和实验设备等支持。同时,我们也为在校研究生、大学生们创造了丰富的培训和实践机会。在提供这些支持的时候,我们并不期望能获得直接商业回报。
华为资助美国大学进行基础研究,研究成果将造福大众,并不会像外界批评所说的那样会对美国构成威胁。
我们与大学的研究成果通过教授、博士和研究生们的论文形式公开发布。
2017年,华为在研发领域投入138亿美元,过去十年华为的全球研发总投入超过600亿美元。华为在全球各国已经有近8万件专利获得授权,其中在美国授权专利近一万件,许多还是电信业的基本专利,这对数字经济发展也是一个贡献。
任何基础研究项目要造福社会是一个艰辛而且漫长的过程,需要大学与企业紧密合作,需要无数科学家、工程师们长期艰苦奋斗,他们的努力和贡献应该受到尊重,而不是肆意指责。
一个开放的政治领袖,应该要致力于维护美国大学的学术自由,才能推动美国的科技进步。同时,政治领袖要像全球领先科学家一样具备深度洞察力、好奇心和实事求是精神。
本文来自于英国<金融时报>
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。