Dream 是一家为政府和关键基础设施提供网络安全服务的人工智能创业公司。该公司今日宣布在由 Bain Capital Ventures 领投的早期融资轮中筹集了 1 亿美元资金,公司估值达到 11 亿美元。
参与此轮 B 轮融资的其他投资方包括 Group 11、Tru Arrow、Tau Capital 和 Aleph。
Dream 由现任 CEO Shalev Hulio 于 2023 年联合创立。Hulio 此前是备受争议的 NSO Group 的联合创始人兼 CEO,该公司开发了可秘密监控移动设备的间谍软件 Pegasus。Hulio 与奥地利前总理 Sebastian Kurz 共同创立了 Dream。在离开 NSO 和政府职位后,二人利用各自在企业和国家安全需求方面的专业知识创建了这家公司。
Kurz 表示:"针对我们关键基础设施的复杂网络攻击正在变得越来越普遍和复杂。在我担任总理期间,我亲眼目睹了这些攻击如何造成实际的人员伤害,以及如何可能扰乱整个社会。"
为了防止这些攻击,该公司开发了一系列 AI 模型,包括经过历史网络攻击训练的大语言模型和异常检测模型。Hulio 表示,公司计划利用这笔资金开发更先进的模型来保护关键基础设施,并改进现有的基础模型系列。
该公司称其开发了首创的"网络安全语言模型"系列,专门针对网络安全操作进行训练。这是因为针对政府、医院、能源基础设施等目标的网络安全威胁日益复杂。自动化安全需要特殊的复杂安全任务,这些任务无法由通用 AI 处理,需要基于实际攻击数据、网络知识以及对黑客操作方式的深入理解进行训练。
Dream 表示,通过同时对防御网络架构和黑客行为进行建模,可以使用预测性 AI 建模来应对新出现的已知威胁,并为未知威胁做好准备。
Hulio 说:"我们创立 Dream 是为了给各国提供一个真正有效的解决方案,因为它是基于他们的需求而设计的。"
过去,黑客曾使用勒索软件关闭美国主要燃料管道,如 2021 年 Colonial Pipeline Co. 遭受的攻击。最近,黑客窃取了 AT&T Inc. 的客户数据,并入侵了负责审查外国投资国家安全风险的美国政府机构外国投资委员会 (CFIUS)。
据路透社报道,许多这样的攻击被认为是由国家支持的攻击者发起的,如 AT&T 遭受的攻击据称是中国黑客所为。此外,其他电信网络也遭到攻击,包括 Charter Communications、Consolidated Communications Inc.、Windstream Holdings Inc.、Verizon Communications Inc.、Lumen Technologies Inc. 和 T-Mobile US Inc.。对 CFIUS 的攻击也被认为是由中国支持的黑客组织发起的。
尽管针对电信网络的攻击主要涉及客户数据,但这类入侵是探测其他可能导致服务中断、通信被监听和更广泛国家安全影响的漏洞的一部分。
该公司表示计划通过在美国和南美等新地区开设办事处来扩大运营。Dream 总部位于以色列,在特拉维夫、维也纳和阿布扎比设有办事处。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。