聚焦全球科技发展的新趋势,AI(人工智能)无疑是当今最引人瞩目的关键词之一。在全数字化步伐不断加快的今天,AI不仅成为各大科技巨头的战略方向、受到资本市场广泛热捧,而且迅速融入到众多领域的垂直应用中。AI学科最早于1956年由达特茅斯大学首创,60年后的今天,AI尚未成熟,依旧拥有非常广阔的发展和想象空间。尽管如此,我们的生活早已“无处不智能”,智能家居、无人驾驶、智能机器人等技术及应用,很大程度上得益于计算机处理和通信技术的蓬勃发展。值得注意的是,虽然很多人尚未意识到,但是AI早已走进音频视频和会议领域,例如:许多音频系统能够通过对其周围的环境进行“学习”,自主调整自己的性能,以降低背景噪音,避免甚至消除回音。
思科AI发展史引领协作新未来
思科作为在会议领域中推进人工智能应用的思想领袖和技术先驱,自上世纪90年代至今,在AI发展的每个阶段中,始终以行业领导者的姿态推动AI创新与发展:
从业界第一款4K双流显示的思科Spark Room Kit开始,到最新的思科Spark Room 70,思科不断推动AI技术在会议领域的创新应用,使得思科Spark Room系列产品大放异彩:
思科Spark Room 70全新登场奏响协作AI最强音
2018年3月思科Spark Room 70正式登陆大中华区市场。Spark Room 70是Spark Room系列中功能最为强大的产品。思科Spark Room 70采用了NVIDIA Jetson平台(众多自动驾驶车辆也采用了该平台),实现了摄像机技术和机器学习之间的平衡,通过内容分享和AI技术,为客户带来无与伦比的视频和音频体验,大幅提升团队工作效率:
在AI技术之外,思科Spark Room 70同样拥有强大的硬件支持:
面向未来思科勾勒AI发展蓝图
曾经一度被视为天方夜谭的AI已经成功应用于会议领域,并且不断助力企业提升效率、创造极大的业务价值。目前,思科AI战略将AI能力分成了5个层次,具体包括:
第1层,指令和控制:通过机器听觉和自然语言处理能力实现语音响应,从而简化会议设置机制;
第2层,自然语言理解:通过AI“机器人”(一种可模拟对话的机器算法)来处理各种指令,协助会议管理;
第3层,基于领域专长的语义理解,支持系统创建和分发会议总结;
第4层,智能团队成员:即系统理解会议情境和与会者需求的能力,通过系统的这种能力来合成相关数据,为团队提供帮助,比如通过自动创建数据表来协助决策的制定;
第5层,团队及策略智能:即系统理解企业目标和团队成员技能,以及为与会人员提供建议的能力(比如“Sarah是这个领域的专家,我们是否邀请她参会?”)。
这些功能部分已经得到实现、或者已经出现在思科的AI发展蓝图中。不难想象,AI技术势必将在塑造未来会议技术和会议室中扮演着更为重要的角色。思科希望帮助企业制定针对AI的全球性战略举措,积极使用专为支持当下和未来AI功能而设计的平台,创造并实现AI价值的最大化。
思科全球高级副总裁,应用事业部总经理Rowan Trollope表示:“在未来几年,AI会议机器人将会融入工作团队之中。随着它们被投入使用,员工将能够摆脱乏味的会议设置和其他后勤工作,转而从事更有创造性的工作。拥有人工智能的思科Spark代表着未来会议的发展方向,通过帮助客户充分利用这一具有颠覆性的技术,我们的合作伙伴将会获得绝佳的机遇。”
好文章,需要你的鼓励
随着员工自发使用生成式AI工具,CIO面临影子AI的挑战。报告显示43%的员工在个人设备上使用AI应用处理工作,25%在工作中使用未经批准的AI工具。专家建议通过六项策略管理影子AI:建立明确规则框架、持续监控和清单跟踪、加强数据保护和访问控制、明确风险承受度、营造透明信任文化、实施持续的角色化AI培训。目标是支持负责任的创新而非完全禁止。
NVIDIA研究团队开发的OmniVinci是一个突破性的多模态AI模型,能够同时理解视觉、听觉和文本信息。该模型仅使用0.2万亿训练样本就超越了使用1.2万亿样本的现有模型,在多模态理解测试中领先19.05分。OmniVinci采用三项核心技术实现感官信息协同,并在机器人导航、医疗诊断、体育分析等多个实际应用场景中展现出专业级能力,代表着AI向真正智能化发展的重要进步。
英国正式推出DaRe2THINK数字平台,旨在简化NHS全科医生参与临床试验的流程。该平台由伯明翰大学和MHRA临床实践研究数据链开发,能够安全传输GP诊所与NHS试验研究人员之间的健康数据,减少医生的管理负担。平台利用NHS现有健康信息,安全筛查来自450多家诊所的1300万患者记录,并使用移动消息系统保持试验对象参与度,为传统上无法参与的人群开辟了研究机会。
Salesforce研究团队发布BLIP3o-NEXT,这是一个创新的图像生成模型,采用自回归+扩散的双重架构设计。该模型首次成功将强化学习应用于图像生成,在多物体组合和文字渲染方面表现优异。尽管只有30亿参数,但在GenEval测试中获得0.91高分,超越多个大型竞争对手。研究团队承诺完全开源所有技术细节。