不知从什么时候开始,以谷歌眼镜为代表的穿戴式智能设备如雨后春笋般现身。通常来说,可穿戴设备是指那些直接穿在身上或是整合进用户的衣服或配件的 设备,除了谷歌眼镜、蓝牙耳机、手表计算器这些我们熟悉的设备外,还有些新奇的东西,比如发亮的裙子、会自动拍照的挂饰摄像头、键盘裤子、传感器智能服、 太阳能充电背包等。
可穿戴技术是20世纪60年代美国麻省理工学院媒体实验室提出的创新技术,利用该技术可以把多媒体、传感器和无线通信等技术嵌入人们的衣着中,可支 持手势和眼动操作等多种交互方式。专家预计,今年将销售接近1500万台可穿戴智能设备,到2017年销售数量将接近7000万台。在产品体积越来越小、 重量越来越轻、功耗越来越低的趋势下,将可穿戴设备连接到功能强大的智能手机或平板电脑进行数据处理和与云端的数据传输变得尤为重要。因此,移动智能设备 已经成为连接一切的枢纽。市场调查机构Gartner预计,到2016年,可穿戴式智能电子产品的市场规模将达到100亿美元,而整个互联网市场将会向移 动终端倾斜。
随着可穿戴技术越来越重要,利用无线连接技术实现设备与智能手机的互联将会成为开发这些设备应用潜力的关键所在。例如,借助近场通信(NFC)技 术,消费者可以购买新型可穿戴设备并将其方便地连接到智能手机,进行快速安全的通信,不需要其他复杂的菜单或繁琐的设置过程;借助Bluetooth Smart和WiFi技术,消费者可以从可穿戴设备中获取数据(例如消耗的卡路里、心率等),并将数据传送到智能手机或云端,而不会消耗太多电量;借助 WiFi直连技术,消费者可以直接将两个WiFi设备连接在一起,不需要接入点或计算机;将可穿戴设备与定位技术结合起来,可以实现一些有趣的新应用功 能,比如医生可以在临床环境中跟踪患者的情况,零售商可以向消费者发送有针对性的广告信息。
好文章,需要你的鼓励
Liquid AI发布了新一代视觉语言基础模型LFM2-VL,专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构,GPU推理速度比同类模型快2倍,同时保持竞争性能。提供450M和1.6B两个版本,支持512×512原生分辨率图像处理,采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
阿里团队推出首个AI物理推理综合测试平台DeepPHY,通过六个物理环境全面评估视觉语言模型的物理推理能力。研究发现即使最先进的AI模型在物理预测和控制方面仍远落后于人类,揭示了描述性知识与程序性控制间的根本脱节,为AI技术发展指明了重要方向。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。