对于注重隐私的GitHub命令行界面(CLI)用户来说,有一个情况需要特别注意。这家微软旗下的代码托管平台已悄然开始从CLI用户处收集匿名化的客户端遥测数据,并将该功能默认设为开启状态。
此次变更并未发布独立的博客公告,仅通过更新GitHub CLI文档(新增遥测说明页)、在版本发布说明中提及匿名遥测功能,以及过去一周在CLI代码仓库中密集推送相关更新来实现。GitHub对此次遥测更新给出的理由十分直接:称收集的数据将帮助团队了解功能使用情况,并推动CLI产品持续改进。
当然,还有AI方面的考量。
遥测说明页面写道:"随着GitHub CLI在智能体场景中的应用不断增长,我们的团队需要了解各项功能在实际使用中的情况。我们利用这些数据来确定工作优先级,并评估功能是否真正满足用户需求。"这里所说的"真实用户",显然也涵盖了AI智能体。
从表面上看,这一做法并无不妥:企业确实需要了解用户如何与产品交互,以及哪些功能值得投入更多资源。从这一角度而言,GitHub增加遥测功能并不令人意外。然而,问题在于:在未明确告知用户将收集哪些遥测数据的情况下,便将其默认开启,这种做法难以让人接受。
CLI代码仓库中新增了大量涉及遥测的代码,但并未提供可能被收集的数据点的完整清单。GitHub在遥测说明页面上也未作详细说明,而是建议用户通过启用日志记录来自行查看将被发送的内容。
帮助页面写道:"如果您希望在不实际发送数据的情况下查看具体内容,可以启用日志记录。"页面随后提供了一个数据样本,其中包含智能体字段、系统架构、设备ID、操作系统、标志位、命令名称、调用ID及其他元数据。GitHub同时指出,实际发送的遥测数据内容可能与此存在较大差异。
GitHub表示,从CLI客户端收集的遥测数据将发送至其内部分析基础设施。但对于那些在未获充分告知的情况下被迫向微软和GitHub提交更多数据的用户而言,这一解释恐怕难以消除疑虑。好在GitHub在新的遥测说明页面上提供了关闭遥测的操作指引。
用户可通过环境变量或CLI配置选项两种方式关闭遥测功能。在环境变量方面,GitHub表示,导出GH_TELEMETRY=false(或其他等效的false值)即可关闭,设置DO_NOT_TRACK=true同样有效。
对于希望通过CLI配置文件进行修改的用户,可执行命令gh config set telemetry disabled来关闭遥测功能。
截至发稿,GitHub尚未就本文相关问题作出回应。
Q&A
Q1:GitHub CLI遥测功能收集哪些数据?
A:根据GitHub提供的数据样本,遥测内容包括智能体字段、系统架构、设备ID、操作系统、标志位、命令名称、调用ID及其他元数据。不过GitHub也指出,实际发送的遥测数据内容可能与样本存在较大差异,用户可通过启用日志记录功能来查看具体将被发送的内容,而无需真正发送数据。
Q2:GitHub CLI遥测功能为什么默认开启?
A:GitHub给出的官方理由是,随着CLI在智能体场景中的应用不断扩展,团队需要了解功能的实际使用情况,以便确定工作优先级并评估功能是否满足用户需求。此举的目的是帮助改进产品,但由于未提前发布公告、未明确列出收集的数据范围便直接默认开启,引发了用户对隐私保护的质疑。
Q3:怎么关闭GitHub CLI的遥测功能?
A:有两种方式可以关闭。第一种是通过环境变量:导出GH_TELEMETRY=false或设置DO_NOT_TRACK=true即可。第二种是通过CLI配置文件:执行命令gh config set telemetry disabled来关闭遥测功能。GitHub已在新的遥测说明页面上提供了上述操作指引。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。