高密度电源模块助力敏锐的监控网络利用 AI 震慑犯罪
自动警务的概念始于几年前的科幻小说,但今天却是真实存在的,而且很有影响力。如果您花几分钟时间与Knightscope 公司的联合创始人、首席客户官 Stacy Stephens 聊聊,就会发现先进的机器人安保其实更具吸引力。
这家公共安全技术服务公司于 2013 年在加州山景城成立,是世界上第一家在大型购物中心、停车场和社区公园等公共场所部署移动、全自主安全机器人 (ASR) 的公司。Knightscope 的愿景是找到更有效的方法遏制犯罪,同时最大限度降低执法人员面临的危险。
Knightscope 的移动机器人是完全自主的,使用支持激光雷达、GPS、声纳、IMU、4K 摄像头以及高保真音频的系统。该机器人有五种类型的传感器 — 与人类非常相似,但灵敏度远远高于人类。
Knightscope 是一家领先的公共安全技术公司,而并非一家在机器人技术、自动驾驶技术、汽车电气化和人工智能融合方面有专长的机器人技术企业。但将以上结合起来,他们带来了一个敏捷的平台,该平台可整合众多传感功能和其它技术,以提供可执行的情报。
提供卓越的 ASR 监视功能
配备 ASR,主要是为了扫描已知威胁,使企业能通过识别被解雇的员工或发放了非法侵入警告的员工来减少工作场所暴力。此外,ASR 还可使用异常监控来识别外部车辆的车牌,从而保障停车场安全。ASR 可凭借其音频特性提供双向通信,允许机器人作为具有广播功能的公共广播系统。因此它们可以与肇事者接触,缓和敌对情况。
“ASR 的‘通话’功能可将危险从人转移到机器人身上。”Stephens 指出,“机器人是一种难以描述的物体,进行对话无需有人站在敌对嫌疑人面前,这可避免事态无意中升级。”“此外,它们还可降低运营开销。”Stephens 补充道,“ASR 既不会生病,也不需要休假。”
注入技术,驱动 ASR 的自主性
Knightscope 的移动机器人是完全自主的,使用支持激光雷达、GPS、声纳、IMU、4K 摄像头以及高保真音频的系统。该机器人有五种类型的传感器(与人类类似),周围环境尽在掌握。大多数情况下,该机器人的感官比公共安全人员还敏锐。
总共有 21 个 LIDAR 激光器,每 25 毫秒绘制一次四周环境。这些数据用于创建机器人周围 100 米半径区域的 3D 地图,可帮助 ASR“看到”其周围环境。此外,声纳传感器还可提供接近感测,使机器人能够判断什么时候有什么物体靠近。GPS 是内部导航的第三输入,如果有人试图移动或偷窃机器人,有助于对其进行跟踪。
里程计传感器通过计算车轮的旋转指示机器人向左还是向右移动或跟踪。最后是惯性测量单元 (IMU),可提供六个自由度的空间感知,以确定机器人是直立还是倾斜的,这可能说明它已经卡住或无法移动。
电源效率对于 ASR 极为重要
高强度的计算、通信和传感为 ASR 的供电网络带来沉重负担。它们必须紧凑、高效。ASR 没有气流或通风功能,因此 Knightscope 开始寻找一种可使用铝皮作为散热片的单纯传导散热解决方案。该公司采用了 Vicor DC-DC 转换器模块 (DCM3623),因为其独特的 ChiP™ 封装不仅散热良好,而且外形极为小巧。此外,该 DCM 的功率密度还为布线和线缆组合提供了帮助,并提高了电池效率和性能,延长了运行时间。
典型的移动机器人应用可为各种负载供电,从计算机到电机驱动器,再到摄像头,不一而足。Knightscope 不仅支持 LIDAR、GPS、声纳、IMU、4K 摄像头和高保真音频,而且还使用 Vicor 高密度电源模块为这些负载供电。Knightscope 寻求紧凑而高效的电源,因为 ASR 没有气流或散热功能。他们需要一种可使用铝皮作为散热片的单纯传导散热解决方案。
在电气方面,机器人需要与所有不同的电源轨隔离。由于有太多具有不同 EMI 特征的传感器,Vicor DCM™ 有助于最大限度减少 EMI 和噪声干扰。
“我们越能减轻电池负担,所获得的运行时间就会越长。”Stephens 表示,“所以,电源永远都是一个考虑因素。最后,所有这些都将帮助我们实现公司的愿景,即架构师坐下来规划商业开发或混合使用的空间时,与烟感报警器及灭火系统一样,我们的产品都会列入安全检查清单。”
镇上似乎来了一位新警长啊,它的名字叫 Knightscope。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。