加拿大AI公司Cohere推出名为North的AI智能体平台,承诺通过私有部署确保企业和政府数据安全。该平台可在客户自有基础设施上运行,包括本地环境、混合云或离线环境,最少仅需两个GPU。North具备聊天搜索功能,支持客服查询、会议记录总结等,并集成Gmail、Slack等办公工具,符合GDPR等国际合规标准。
谷歌搜索负责人莉兹·里德发表博文回应外界质疑,声称AI搜索功能并未减少网站流量。她表示总体有机点击量同比保持稳定,同时谷歌搜索次数在增加。这似乎是对皮尤研究中心分析的回应,该研究显示AI概览功能降低了点击率。不过谷歌并未提供具体数据支撑其说法,且承认用户有时仅从AI答案中获取所需信息而不再点击。
微软发布了名为Project Ire的自主AI代理,声称可在无人协助下检测恶意软件。该原型使用大语言模型和二进制分析工具对软件进行逆向工程,判断代码是否恶意。在约4000个"困难目标"文件的实际测试中,该AI代理标记为恶意的文件中89%确实是恶意的,但仅检测出所有恶意软件的26%。微软计划将其集成到Defender安全工具套件中,作为威胁检测的二进制分析器。
随着新学年临近,Google在Gemini中推出"引导学习"工具,旨在像AI导师一样帮助用户深入理解概念而非简单获取答案。该功能通过图像、图表、视频和互动测验逐步分解问题,适应用户需求。此举紧随OpenAI推出ChatGPT学习模式一周后,两家公司都试图解决AI聊天机器人可能削弱学习过程的担忧。Google还宣布为美国、日本、印尼、韩国和巴西学生提供免费一年AI Pro订阅。
支付平台Lava Payments获得580万美元种子轮融资,由Lerer Hippeau领投。该公司致力于为AI代理经济构建数字钱包解决方案,允许用户使用统一积分在多个商户和服务间进行交易,无需人工干预。创始人Mitchell Jones发现在使用AI工具时需要重复订阅和认证,因此开发了这一平台。用户可一次性购买使用积分,AI代理可在执行任务时自动扣费,简化了支付流程。
AWS将自动推理检查功能正式推向市场,旨在为企业和监管行业提供更安全、可解释的AI应用部署。该功能利用数学验证方法确定真实性,能够验证AI响应准确性并检测模型幻觉问题,声称可捕获近100%的幻觉现象。神经符号AI结合了神经网络的模式识别与符号AI的逻辑推理,通过数学证明方法解决企业对生成式AI不确定性的担忧,为金融审计等应用场景提供可验证的正确性保障。
人工智能初创公司Cohere今日正式发布North生产力平台。该平台提供聊天机器人界面,帮助员工查询组织记录,从文档和云应用中检索数据。平台还能自动化内容创建,生成财务数据可视化和竞品研究报告等。North使用AI代理集合来自动化多步骤业务流程,支持与主流云应用集成。平台基于Cohere旗舰Command大语言模型变体,仅需两块显卡即可运行。
谷歌研究人员开发了新型AI研究智能体框架TTD-DR,在关键基准测试中超越OpenAI等竞争对手。该系统模拟人类写作过程,采用起草、搜索信息、迭代修订的方式,运用扩散机制和进化算法生成更全面准确的复杂主题研究。与传统线性处理方式不同,TTD-DR将研究报告创建视为扩散过程,从初始草稿逐步完善为高质量最终报告,为企业提供专业研究助手解决方案。
马来亚银行与微软签署为期五年、价值约十亿林吉特的合作协议,旨在推动其业务运营中的数字化和人工智能创新。该协议将使这家马来西亚领先的金融集团采用微软Azure作为主要云平台之一,用于战略性系统、功能和数据工作负载。银行还将为44000名员工部署Microsoft 365 Copilot智能助手,并使用微软先进的安全工具加强网络防御。
智能体AI系统正在企业环境中广泛部署,以最少的人工监督进行决策和操作,但这种自主性带来了新的风险类别。56%的企业高管将安全列为首要关注点。传统安全框架无法应对机器速度运行的智能体。微软推出AI安全副驾驶,谷歌云强调可追溯性,思科推出AgenticOps策略,将实时可观测性、零信任框架和AI原生运营整合。企业需要建立专用框架,结合安全性、跨域环境和持续监督,而非简单的附加控制。
自主AI系统正在医疗领域快速发展,从辅助工具转变为能够独立决策和执行任务的智能代理。这些系统承诺简化诊断流程、减轻医生负担、提供个性化治疗方案,但同时也带来数据完整性、公平性风险、过度依赖和隐私安全等挑战。成功部署需要在医学教育、医院管理和治理框架方面进行系统性变革,建立监督机制和问责制度,确保人类判断的主导地位得以保持。
AI编程工具正在改变开发模式,从简单的自动补全发展为"氛围编程"。文章介绍了18款主流工具,包括GitHub Copilot、Cursor等IDE助手,Lovable、V0等一键应用构建器,以及Continue.dev等开源工具。这些工具能够搭建后端、连接前端、生成测试数据并推送代码。虽然提高了开发效率,但也存在成本控制和代码质量风险,需要建立适当的防护机制来平衡自主性与可控性。
Endava研究显示,商业领袖在私人生活中日益采用AI技术,这让他们对AI商业应用更有信心。三分之二的商业领袖愿意信任全自动AI为其做出生活决策,同样比例的人认为AI访问权与电力、水等基础设施同样重要。尽管AI应用是企业首要战略,但近一半受访者认为组织未投资正确的AI技术。研究发现高管层对AI转型更乐观,而中层管理者信心不足,主要因担心被AI取代。
Anthropic周一发布旗舰AI模型升级版Claude Opus 4.1,在SWE-bench Verified基准测试中获得74.5%成绩,超越OpenAI o3模型的69.1%和谷歌Gemini 2.5 Pro的67.2%。该公司年收入从10亿美元增至50亿美元,但近一半API收入依赖Cursor和GitHub Copilot两大客户。新模型采用最严格ASL-3安全协议,在多文件代码重构方面表现突出,但面临GPT-5竞争威胁。
IBM年度数据泄露报告显示,16%的数据泄露事件涉及AI工具使用,20%的组织因员工使用未授权AI工具而遭受泄露。97%的相关组织缺乏访问控制,63%没有AI治理政策。美国数据泄露平均成本达1022万美元创纪录新高。同时,求职者清理社交媒体可能适得其反,因为雇主正使用AI工具筛选社交媒体以识别真实身份。
OpenAI宣布推出两款开放权重推理模型,性能媲美o系列,亚马逊同时宣布这些新模型将于周二在AWS上线。这是OpenAI模型首次在AWS平台提供服务,将通过Amazon Bedrock和SageMaker AI服务提供。此举对两家公司都具有重要竞争意义,AWS终于与最大的模型制造商OpenAI建立合作关系,而OpenAI也在与微软关系紧张的情况下,通过与最大云服务商合作来加强自身地位。
OpenAI发布两款开源推理模型gpt-oss-120b和gpt-oss-20b,分别具有1170亿和210亿参数,可运行代码并与外部系统交互。其中20b版本仅需16GB显存,适合设备端部署。同时Anthropic推出Claude Opus 4.1升级版,在编程能力测试中得分提升至74.5%,并改进了研究和数据分析功能。
谷歌DeepMind发布Genie 3人工智能模型,可基于自然语言提示生成交互式虚拟世界。该模型是Genie系列第三代产品,能够模拟森林、高山景观等室内外环境,支持用户通过指令修改天气、调整视角或添加物体。相比前代产品,Genie 3可持续渲染数分钟,分辨率提升至720p,并具备视觉记忆功能。该模型可用于训练具身智能体,为自主系统如工业机器人提供更高质量的训练环境。目前仅向有限测试者开放研究预览版。
闪迪在FMS 2025展会上发布了256TB容量的UltraQLC SN670固态硬盘,计划于2026年上半年出货。该产品采用BiCS 218层3D NAND闪存技术和PCIe Gen5接口,专为AI驱动的数据密集型工作负载设计。硬盘配备定制控制器和先进优化技术,具备动态频率调节功能,可在给定功耗下提升10%性能表现,并通过数据保持配置减少33%的数据回收循环。
OpenAI发布gpt-oss-120b和gpt-oss-20b两款开源模型,这是自2019年GPT-2以来首次发布开放权重模型。用户可下载到本地硬件运行,支持模拟推理、工具使用和深度定制。小模型需16GB内存,大模型需80GB内存。两款模型均采用混合专家架构,支持可配置的思维链,上下文窗口为128000个token。性能接近专有云模型,但仅支持文本处理。