谷歌推出实验性开源模型DiffusionGemma,基于Gemma 4家族构建,采用扩散技术替代传统逐词元处理方式,可同时生成整段文本,推理速度比自回归模型快4倍。该模型为26B混合专家架构,推理时仅激活3.8B参数,量化后可在18GB显存的消费级GPU上运行。它支持双向注意力机制,尤其适用于代码补全、数学推理及实时编辑等非线性任务场景,并以Apache 2.0协议开源发布。
Google Cloud在伦敦峰会上全面推进其智能体(Agentic)AI战略,宣布多项工具与平台,助力企业构建可自主执行复杂业务流程的多智能体系统。核心发布包括:Gemini 3.5 Flash/Pro及多模态Gemini Omni模型、低代码Agent Designer v2、企业级Gemini Enterprise Agent Platform、个人助手Gemini Spark,以及第八代TPU和AI威胁防御方案。联合利华已率先部署该平台用于品牌营销。Google还宣布在英国投资50亿英镑,并计划至2030年为10万名公务员提供AI技能培训。
IBM、英伟达和红帽联合创立DocLang工作组,并由Linux基金会LF AI & Data项目托管,旨在开发一种开放、通用、AI原生的文档格式标准。现有PDF、JPEG等文档格式主要面向人类阅读,难以被AI高效解析。DocLang参照JSON的设计理念,为各类文档定义结构化、机器可读的格式,助力企业更可靠、透明地为AI系统准备和交换文档数据。ABBYY和Human Signal也将参与其开发。
曾以环保鞋履著称的Allbirds已将鞋业务以4300万美元出售,并通过股市融资1亿美元,完成品牌更名为Smartbird。新任CEO Nadia Carlsten拥有AWS高管背景及工程学博士学位,正着手组建全新团队。Smartbird定位为AI基础设施提供商,专注于数据主权和私有化部署,目标客户涵盖制药、能源、金融及公共部门,与超大规模云服务商差异化竞争。
亚马逊首席UX音效设计师分享了参与家用机器人Astro开发的经验。文章指出,机器人的"角色性格"并非附加功能,而是产品设计的核心。Astro团队通过声音、动作与表情三者协同,构建出具有情感一致性的机器人角色。文章强调,角色设计应先于交互设计,且需贯穿整个研发流程,否则产品会让用户感到困惑甚至缺乏信任感。随着具身AI的发展,这一设计理念将更具现实意义。
Pixi正式在App Store推出一款基于iMessage的AR消息应用,用户可发送由设备端AI驱动的AR角色。这些角色能通过iPhone摄像头感知周围环境,实时与人互动,例如虚拟猫会对真实路过的狗做出反应,且所有视觉与音频处理均在本地完成以保护隐私。应用目前提供机器人、猫和动态信封等角色,未来计划开放创作者市场及用户自定义角色功能,并将扩展至Android及WhatsApp等平台。
OpenAI宣布收购拥有79人团队的云开发环境提供商Ona(前身为Gitpod),以加速推动智能体AI的企业级落地。Ona的技术可为AI智能体提供安全、持久的云端运行环境,支持跨设备持续工作、访问控制、日志管理和凭证管理等企业级治理能力。分析人士认为,此次收购是OpenAI应对Anthropic Claude Code竞争压力的战略举措,同时也填补了Codex在企业安全部署方面的短板。IDC估计此次收购价格约为4.5亿至5亿美元。
英国竞争与市场管理局(CMA)依据数字市场竞争机制,正式认定谷歌具有"战略市场地位",并对其提出公平排名要求。谷歌须以客观、非歧视性标准对自然搜索结果及AI摘要进行排名,提前告知重大算法变更,并建立企业投诉渠道。同时,CMA要求谷歌通过数据可携带API向第三方开放用户搜索数据,支持个性化推荐、旅行建议及购物优惠等创新服务的开发,以促进市场公平竞争与技术创新。
根据劳埃德银行连续10年开展的金融机构情绪调查,新兴技术投资首次成为英国金融机构的首要增长优先项。调查显示,77%的受访者将新兴技术投资视为增长重点,远高于去年的41%;93%的受访者认为AI是未来五年影响最大的技术。劳埃德银行正大力推进AI布局,计划今年内通过其AI学院对全体6.7万名员工开展AI培训。
软件提供商Graitec推出针对建筑、工程、施工与运营(AECO)行业的三阶段AI战略。该路线图分别聚焦AI辅助工作流、工作流自动化及自动生成符合规范的设计方案。公司强调,AI生成内容的可信度与可审计性才是行业核心挑战,并将AI直接嵌入工程与制造流程中,结合确定性计算引擎确保设计符合标准法规。Graitec拥有40年领域积累,计划通过"左移"策略让AI更早介入项目生命周期,从而减少返工与制造错误。
两项发表于《自然》期刊的研究显示,德国学术团队开发的MIRA与谷歌的AMIE两款AI智能体,在虚拟测试中已能媲美甚至超越医生的临床决策能力。MIRA在胰腺炎等多项诊断任务及手术流程管理上表现突出,99.8%的用药建议被评为正确;AMIE生成的治疗方案在多项指标上优于初级保健医生。但研究人员强调,两者目前仍需在前瞻性研究中进一步验证,尚不具备真实临床应用条件。
混合键合技术可在单个封装中实现数十亿乃至数万亿个连接点。以1μm节距为例,一个典型处理器封装的连接总数可超过267亿个。面对如此规模,逐一检测已不现实,良率管控依赖极高的工艺一致性。介电材料选择、铜扩散控制、晶圆厚度均匀性等均是关键挑战。内建自测试(BiST)机制与冗余修复架构成为保障可靠性的核心手段,集群化I/O设计可实现键合前后的独立电气测试。
随着AI从云端洞察向真实世界行动演进,企业正面临如何在物理环境中规模化部署智能的挑战。物理AI不同于纯软件AI,需在安全关键、高度监管的复杂环境中可靠运行,容错率极低。规模化落地的最大障碍往往不是模型本身,而是数据质量、遗留系统集成与基础设施。边缘AI、生成式AI与自主智能体的融合正成为趋势,但成功的关键在于可重复架构、全栈工程能力与清晰的安全边界。
氮化镓(GaN)在高压功率应用中理论性能优越,但受限于衬底材料质量,商业化进展缓慢。高压应用需要垂直器件设计,而这依赖高质量GaN同质衬底或工程衬底。近年来,GaN外延生长技术取得进展,QST等工程衬底显著改善了材料质量。在掺杂与栅介质工艺上,研究人员也取得突破,沟槽栅MOSFET等垂直器件设计已验证千伏级击穿电压。但整体工艺成熟度尚不足以挑战硅和碳化硅的市场地位。
随着GitHub、Zendesk、Workday等主流SaaS厂商将定价模式从按用户席位收费转向基于Token消耗的用量计费,CIO们正面临预算规划的全新挑战。超过半数科技高管预计到2027年使用量计费将成主流。CIO需建立Token用量基线与预测模型,结合季节性波动灵活调整预算,同时平衡AI嵌入式功能带来的效率收益与成本上升之间的关系,避免因预期过高而陷入决策误区。
美国北卡罗来纳州软件开发者Erin Maus以宗教信仰为由,向雇主申请豁免使用AI编程工具,并获批准。她并非天主教徒,而是一神普救派信徒,但援引教皇利奥十四世在通谕《Magnifica Humanitas》中关于AI部署需保持警惕的论述支持其立场。她还咨询了劳动律师及教会牧师。此案引发外界关注:这究竟是个例,还是将掀起更多类似宗教豁免申请的浪潮?
OpenAI与Visa签署合作协议,允许旗下AI智能体使用Visa卡完成电商交易。用户无需手动输入大量信息,即可通过AI代理购买杂货、日用品乃至机票等商品。Visa首席产品与战略官Jack Forestell表示,随着AI智能体成为经济活动的参与者,Visa致力于确保交易的可靠性、安全性与便捷性。依据协议,AI智能体可代替用户在几乎所有接受Visa的商户完成购买,但具体财务条款尚未披露。
斯坦福研究团队对六款主流AI聊天机器人进行测评,针对6个地区2100个当日新闻问题生成12600条回答。结果显示,顶级模型准确率超90%,但印地语表现最差,仅79.3%,比其他地区低约10%。错误主要源于检索失败(38.8%)和来源偏差(32.7%),且模型普遍依赖英语资源回答非英语问题。在对抗性测试中,准确率最低骤降至19%,暴露出模型在处理不完整或错误前提时的脆弱性。
斯坦福、范德堡等高校研究团队联合开发了PsychAdapter,这一轻量级模块可将性别、年龄、大五人格、抑郁程度、生活满意度等心理特征直接嵌入大语言模型的处理层,生成反映特定心理画像的文本。该系统在人格维度准确率达87%,心理健康维度达97%。训练数据来自约50万条推文及70万篇博客。研究人员表示,该工具可用于训练危机干预人员、个性化教育内容生成等场景,但同时警示需防范其被用于精准操控与影响行动。
亚马逊AGI实验室宣布开源感知智能体工具链的两项核心原语——注释(Annotation)与验证(Verification)。注释功能允许用户通过点击、圈画、划叉等可视化操作直接向智能体传达修改意图,替代繁琐的文字描述;验证功能则让智能体在代码生成后自动渲染页面并执行确定性与行为双重检查,实现生成与验证的闭环。两项工具均已在GitHub开放,旨在提升人机协作效率。