如今,AI几乎无处不在,家庭安防摄像头也不例外。这要归功于 Google Gemini、Ring 等众多品牌目前提供的广泛 AI 视频搜索功能。但周二宣布成立的初创公司 Prompt AI 及其 Seemour 平台承诺将更进一步,提供我从未在安防摄像头上见过的 AI 功能。
Seemour 的第三方 AI 专注于视觉智能,通过对物体和动作的训练,使其能够分析家庭安防摄像头所捕捉的一切画面。大多数家庭安防摄像头都具备这种功能——例如 Arlo 现在允许用户为 AI 识别标记自定义物体——但 Seemour 更胜一筹。
除了视频摘要和个性化通知外,Seemour 还推出了更令人印象深刻的功能,特别是能够通过名字学习识别宠物以实现更准确的通知,以及"即将推出"的识别特定个人并将其从视频画面中移除的功能,从而提高家庭隐私保护。
Seemour 承诺的完整功能列表还包括其他在家庭安防系统中前所未见的 AI 响应,如野生动物特定通知、识别和报告快递投递 (而不仅仅是包裹) 的功能,以及监测可疑人员活动的能力 (这通常是商用摄像头的功能)。
Prompt AI 还计划让平台能够像 Google Gemini 那样向 Seemour 提问,比如"我的钥匙放在哪里?"此外,他们还计划整合特定活动警报功能,如狗开始挖洞等,这类功能我们在 Furbo 等宠物科技公司也见过类似尝试。
Prompt AI 首席执行官兼联合创始人 Tete Xiao 表示:"想象一下,未来你可以询问你的家今天发生了什么,或者当室友打开冰箱时通知他们你已经出门去杂货店了。这样的未来比你想象的更近,我们很高兴能为你带来这样的体验。"
Seemour 应用目前已在 Apple Store 上线 (请勿与完全不同的服务 Seymour.ai 混淆),但尚未登陆 Android 平台。我们会抽时间亲自测试,看看 AI 训练效果如何,当然你也可以自己试用...不过有一点需要注意。相比于信任像 Nest 或 Ring 这样成熟的安防品牌使用 AI 分析视频,信任一家初创公司会更加困难。
使用 Seemour 需要你的信任,因为 Prompt AI 目前还没有多少安全记录,而且需要获取你和宠物的大量信息以及视频源的访问权限。与其让消费者采用第三方应用来处理视频,不如直接使用安防摄像头品牌自带的功能,这也更容易被接受。因此我认为 Seemour 可能也在瞄准未来的内置集成方案。
话虽如此,Seemour 的潜在功能清单令人印象深刻,我完全预期这些功能在未来几年内会以某种形式出现在其他家庭安防 AI 产品中。目前,Seemour 似乎在多个方面都是领先者,我会持续关注这项服务。
好文章,需要你的鼓励
这项研究介绍了Ankh3,一种创新的蛋白质语言模型,通过多任务预训练策略显著提升了模型性能。研究者采用两种互补任务:多掩码概率的掩码语言建模和蛋白质序列补全,使模型仅从蛋白质序列就能学到更丰富的表示。实验表明,Ankh3在二级结构预测、荧光预测等下游任务中表现优异,尤其在模型未曾训练过的任务上展现出强大泛化能力,为蛋白质设计和分析开辟了新路径。
法国波尔多大学研究团队开发了一个突破性框架,用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告,并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法,这一系统能生成透明、有因果关系的解释,同时保持高诊断准确率。研究显示,通过群组相对策略优化(GRPO)训练的轻量级模型能展现复杂推理行为,包括假设检验和非线性思考,提供与临床决策流程一致的排序诊断结果。
这项研究提出了CLUE框架,首次能够生成自然语言解释来揭示AI事实核查系统不确定性的来源。与现有方法不同,CLUE能识别文本片段间的冲突与一致关系,并解释它们如何影响模型的预测不确定性。实验表明,CLUE生成的解释在三种语言模型和两个事实核查数据集上都更忠实于模型不确定性,用户评价其更有帮助、信息更丰富、冗余更少且逻辑更一致。CLUE不需要微调或架构更改,适用于任何白盒语言模型,为事实核查提供了实用支持。
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。