以云计算、AI为代表的技术新势力,正在为传统行业带来变革性力量。360OS AI视觉在10月31日亮相LiveVideoStackCon 音频技术大会,在为期三天的会议里向行业合作伙伴分享了推动智能在线教育的生态性举措和技术成果,通过技术进化行业变革的序幕正在稳步拉开。
作为AI视觉领域的后起之秀,360OS AI视觉凭借一站式技术解决方案,已经得到众多行业合作伙伴肯定式的反馈。2020年疫情之初,在线教育行业被列为360OS的发力重点,是符合产业现实反馈的市场举动。
一方面是对行业趋势的判断,疫情的阻隔让线上教育成为主流,线上教育行业需要能够更好的进行课业实时传授,应对更为复杂的实时场景;另一方面是360OS AI视觉自身的革新推动,除了在广度上与行业合作伙伴深入合作,360OS AI视觉在宽度上力图拓展更多应用场景,涉及智能手机、泛文娱、IOT等领域,应用触角正在突破更多业务版图。
相比在线教育领域同类方案,360OS AI视觉更看重人、物、场景三方的结合,通过深入解决行业痛点,提供代替督学方案、量化检测方案、智能互动方案、智能辅助工具方案等多样智慧教育场景解决方案。
其中,代替督学重点基于人脸识别、姿态检测等AI算法,能够实时检测学生精神状态及行为姿态;量化检测通过检测数据分析计算,输出班级或个人课堂表现报告,为个性化辅导及课堂质量评估提供科学依据;智能互动方案利用AI沉浸式课件和多向互动特效,改变单一互动模式,更好提升教学效果;智能工具通过教育场景智能工具,提供超清拍题、智能补光灯及线上线下人脸考勤方案等。
好的产品解决方案本质在于市场的需求,360OS AI视觉坚持从合作伙伴需求定义产品解决方案,在更为广阔的视角为合作伙伴制造市场价值增量机会。目前360OS已经与声网、三星、Nokia、联想、花椒直播、努比亚、中兴、科大讯飞等进行了深度的技术合作,为合作伙伴提供了超高性价比的AI解决方案。
360OS AI视觉业务负责人张焰表示:基于产业发展背景,AI视觉团队通过深耕AI视觉算法,以领先的算法承载行业多样化的业务需求,将在未来构建更为广阔的算力生态。
好文章,需要你的鼓励
Liquid AI发布了新一代视觉语言基础模型LFM2-VL,专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构,GPU推理速度比同类模型快2倍,同时保持竞争性能。提供450M和1.6B两个版本,支持512×512原生分辨率图像处理,采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
阿里团队推出首个AI物理推理综合测试平台DeepPHY,通过六个物理环境全面评估视觉语言模型的物理推理能力。研究发现即使最先进的AI模型在物理预测和控制方面仍远落后于人类,揭示了描述性知识与程序性控制间的根本脱节,为AI技术发展指明了重要方向。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。