MLPerf存储基准测试第二版显示,测试系统服务的加速器数量比2023年1.0版本增加约一倍。MLCommons表示本轮测试参与度大幅提高,提交机构地域代表性更强,系统多样性更丰富。该基准测试评估存储系统在Unet3D、Cosmoflow和Resnet50 AI训练任务中的性能,以及Llama 3训练中的检查点性能。随着AI训练集群GPU数量增加,故障率上升,检查点技术成为标准做法。
谷歌DeepMind发布新一代世界模型Genie 3,相比前代产品实现多项关键提升。新模型支持720p分辨率输出,可持续运行数分钟而不产生伪影,并首次支持实时交互和文本提示功能,用户可通过文本指令动态改变模拟世界状态。DeepMind将其定位为AI智能体训练工具,可用于自动驾驶等场景的"假如"情况训练,提高模型可靠性。
Aquant公司推出智能体AI平台,专为复杂设备服务组织打造。该平台允许服务团队创建、集成和部署定制AI代理,提供故障排除、知识搜索、零件识别等预构建代理。用户可利用专业工具构建定制代理或集成自有代理,支持多渠道部署和企业系统集成。平台内置服务专业知识,提供检索增强对话层,确保响应与业务指标对齐,助力服务团队提升效率。
谷歌DeepMind发布了Genie 3基础世界模型,该实验室称其为通向通用人工智能的重要里程碑。Genie 3是首个实时交互的通用世界模型,能够生成照片级逼真和想象世界。该模型可通过文本提示生成数分钟的多样化3D环境,分辨率达720p,帧率24fps。最重要的是,Genie 3的模拟在时间上保持物理一致性,因为模型能够记住先前生成的内容。研究人员认为世界模型是实现AGI的关键,特别是对于具身智能体的训练。
Meta CEO扎克伯格宣称未来的设备是AI智能眼镜,焦点正从VR头显转向面部眼镜。苹果、谷歌、三星等巨头都看好AR未来。作为AR/VR设备评测师,作者认为目前Meta Quest系列仍是最佳选择,但2025年硬件格局将发生巨变。三星谷歌的Project Moohan混合现实设备即将发布,Meta可能推出带显示屏的高端智能眼镜和神经输入腕带,苹果Vision Pro将升级M芯片并支持控制器,Valve传闻中的新VR头显可能重新定义游戏空间。
随着AI技术快速发展,IT职业格局正在重塑。热门趋势包括:专注人类优势的工作、设计智能适应系统、网络安全混合方法、跨领域技术通才和AI产品开发。而传统的代码维护、手动威胁检测、追求所有技术技能、某些认证以及与业务目标脱节的技术技能正在降温。专家建议IT专业人员应将技术流利性与创造力、好奇心结合,重点发展监督和协调AI系统的能力。
谷歌DeepMind推出Genie 3"世界模型",仅需提示词或图像即可创建交互式世界。该模型支持720p分辨率24帧每秒的实时渲染,相比前代产品显著提升了视觉保真度和记忆能力,可保持数分钟的视觉一致性。用户能够实时修改环境、添加对象、改变天气或插入新角色。DeepMind将其视为AI研究工具,用于训练embodied agents并生成合成训练数据。尽管仍存在局限性如无法模拟真实地点、易产生AI幻觉等,但该技术为游戏开发和AGI研究提供了新可能性。
博通推出Jericho4网络芯片,能够连接超过100万个处理器跨越多个数据中心,数据处理能力是前代产品的四倍。该芯片可连接距离超过100公里的设施,帮助云公司将较小的数据中心连接成大型AI系统。随着GPU集群功耗增大,单一建筑难以容纳,新芯片为分布式部署提供解决方案。
Google的AI学习工具NotebookLM现已面向13岁及以上用户开放,并作为Google Workspace for Education套件的核心服务提供给所有年龄段用户。这款基于Gemini技术的工具能够上传文档、PDF、网站或Google文档,快速生成数字笔记本,提供问答、摘要、思维导图、视频解释和播客式音频摘要等功能。虽然AI可能出错,但每个输出都包含可追溯到源材料的引用链接。Google承诺不会使用用户聊天记录或上传资料进行训练。
AI音频独角兽公司ElevenLabs周二发布新模型,允许用户生成音乐并声称可商用。这标志着该公司从主要专注AI音频工具向音乐生成领域扩张。由于版权争议,AI音乐生成并非易事。去年Suno和Udio因涉嫌使用版权材料训练模型被起诉。ElevenLabs与独立音乐数字发行平台Merlin Network和Kobalt Music Group达成协议,获得其音乐材料用于AI训练的授权。
谷歌宣布其AI笔记应用NotebookLM现已向年轻用户开放,此前该应用仅限18岁以上用户使用。现在13岁以上的消费者和所有年龄段的Google教育工作区用户都可使用。学生可将笔记转换为播客式音频概述、创建交互式思维导图等。谷歌表示对18岁以下用户执行更严格的内容政策,用户聊天和上传内容不会被人工审查或用于AI训练。此举正值OpenAI为ChatGPT推出学习模式,显示各公司正加剧AI教育领域的竞争。
新加坡国立大学与谷歌合作成立人工智能研究创新中心,专注培养AI人才并推进应用研究。该中心将建立快速原型沙盒环境,重点开展三大项目:利用谷歌云平台开发教育AI工具、构建法律专用大语言模型以及整合多元数据推进公共健康AI应用。此外还将设立AI人才培养项目和教授职位,加强产学合作。
欧洲软件巨头SAP宣布计划收购位于旧金山的人力资源初创公司SmartRecruiters,交易金额未披露,预计第四季度末完成。SmartRecruiters主要在美国市场运营,提供自动化大批量招聘软件,其平台具备AI驱动的求职者跟踪工具、招聘分析和用户友好的工作流程。收购完成后,SAP将把SmartRecruiters技术整合到SuccessFactors平台中,为客户提供增强的招聘和员工规划能力。
18岁的贾斯汀·金利用AI开发社交娱乐应用Giggles,吸引12万用户预约,无需传统工程团队。"氛围编程"概念兴起,创业者通过自然语言与AI协作开发产品,Y Combinator显示许多初创公司95%代码由AI生成。这种模式democratizing创业门槛,但面临扩展性挑战。专家警告非技术创始人难以在缺乏工程深度的情况下规模化发展,未来需要创意与编程技能的平衡结合。
应用AI研究公司基础研究实验室宣布完成3300万美元A轮融资,由Prosus领投,Stripe联合创始人兼CEO帕特里克·科利森参投。该公司采用独特结构,在多个领域开发AI应用。目前推出通用消费助手Fairies和电子表格智能体Shortcut等产品,前者可连接应用并执行工作流程,后者专为分析师创建金融模型。公司创始人杨博士表示,希望打造具有历史意义的公司,未来计划向机器人领域扩展。
OpenAI宣布ChatGPT周活跃用户将达到7亿,较3月末的5亿用户增长40%,同比增长4倍。公司计划8月初发布GPT-5,该模型将整合o3系列的推理能力,创建统一的AI系统。商业客户增至500万,年收入达130亿美元。面对谷歌、Meta等竞争对手的激烈竞争,OpenAI正通过技术升级和用户体验优化来巩固市场领先地位。
OpenAI宣布将在ChatGPT中添加"休息提醒"功能,当用户与AI聊天机器人交互时间过长时会弹出提示询问是否需要休息。此举旨在防止成瘾行为,类似于流媒体平台的观看提醒。同时OpenAI还改进了模型以更好地识别用户的心理困扰迹象,并在重大人生决策建议方面更加谨慎。专家建议用户主动设置使用时间限制,避免过度依赖AI工具。
OpenAI已移除允许搜索引擎索引ChatGPT对话的功能,以防用户无意中暴露敏感信息。此前有报告显示ChatGPT对话出现在搜索结果中。OpenAI首席信息安全官表示,该功能引入了太多用户意外分享不当内容的风险。尽管有明确警告不要分享敏感内容,用户仍然这样做了。目前OpenAI正努力从搜索引擎中移除已索引的内容,但清理工作尚未完全完成。
Anthropic公司进行了一项关于人工智能系统个性形成机制的研究,探索了AI系统获得特定"个性"特征的原因,以及导致其产生"恶意"行为的潜在因素。该研究旨在深入理解AI系统的行为模式和决策机制,为开发更安全、更可控的人工智能技术提供理论基础。
苹果首席执行官蒂姆·库克在最新表态中强调,苹果公司"必须"在人工智能领域取得突破,并承诺将为此进行必要的投资。库克的这一表态显示了苹果对AI技术发展的重视程度,以及公司在人工智能赛道上追赶竞争对手的决心。