Anthropic 的编程工具 Claude Code 开局不利。
据 GitHub 用户反馈,Claude Code 的自动更新功能包含了错误的命令,导致一些工作站变得不稳定甚至损坏。当 Claude Code 以"root"或"超级用户"权限安装时 (这些权限允许程序进行系统级更改),这些有问题的命令会让应用程序修改通常受限的文件目录,在最坏的情况下会导致系统"变砖"。
这些有问题的 Claude Code 自动更新命令改变了某些关键系统文件的访问权限。权限定义了哪些程序和用户可以读取或修改文件,或运行特定应用程序。一位 GitHub 用户表示,他们不得不使用"救援实例"来修复被 Claude Code 命令意外破坏的文件权限。
Anthropic 向 TechCrunch 表示,他们已经从 Claude Code 中移除了问题命令,并在程序中添加了指向故障排除指南的链接。该链接最初有一个拼写错误,但 Anthropic 表示这个问题也已经修复。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。