聚焦全球科技发展的新趋势,AI(人工智能)无疑是当今最引人瞩目的关键词之一。在全数字化步伐不断加快的今天,AI不仅成为各大科技巨头的战略方向、受到资本市场广泛热捧,而且迅速融入到众多领域的垂直应用中。AI学科最早于1956年由达特茅斯大学首创,60年后的今天,AI尚未成熟,依旧拥有非常广阔的发展和想象空间。尽管如此,我们的生活早已“无处不智能”,智能家居、无人驾驶、智能机器人等技术及应用,很大程度上得益于计算机处理和通信技术的蓬勃发展。值得注意的是,虽然很多人尚未意识到,但是AI早已走进音频视频和会议领域,例如:许多音频系统能够通过对其周围的环境进行“学习”,自主调整自己的性能,以降低背景噪音,避免甚至消除回音。
思科AI发展史引领协作新未来
思科作为在会议领域中推进人工智能应用的思想领袖和技术先驱,自上世纪90年代至今,在AI发展的每个阶段中,始终以行业领导者的姿态推动AI创新与发展:
从业界第一款4K双流显示的思科Spark Room Kit开始,到最新的思科Spark Room 70,思科不断推动AI技术在会议领域的创新应用,使得思科Spark Room系列产品大放异彩:
思科Spark Room 70全新登场奏响协作AI最强音
2018年3月思科Spark Room 70正式登陆大中华区市场。Spark Room 70是Spark Room系列中功能最为强大的产品。思科Spark Room 70采用了NVIDIA Jetson平台(众多自动驾驶车辆也采用了该平台),实现了摄像机技术和机器学习之间的平衡,通过内容分享和AI技术,为客户带来无与伦比的视频和音频体验,大幅提升团队工作效率:
在AI技术之外,思科Spark Room 70同样拥有强大的硬件支持:
面向未来思科勾勒AI发展蓝图
曾经一度被视为天方夜谭的AI已经成功应用于会议领域,并且不断助力企业提升效率、创造极大的业务价值。目前,思科AI战略将AI能力分成了5个层次,具体包括:
第1层,指令和控制:通过机器听觉和自然语言处理能力实现语音响应,从而简化会议设置机制;
第2层,自然语言理解:通过AI“机器人”(一种可模拟对话的机器算法)来处理各种指令,协助会议管理;
第3层,基于领域专长的语义理解,支持系统创建和分发会议总结;
第4层,智能团队成员:即系统理解会议情境和与会者需求的能力,通过系统的这种能力来合成相关数据,为团队提供帮助,比如通过自动创建数据表来协助决策的制定;
第5层,团队及策略智能:即系统理解企业目标和团队成员技能,以及为与会人员提供建议的能力(比如“Sarah是这个领域的专家,我们是否邀请她参会?”)。
这些功能部分已经得到实现、或者已经出现在思科的AI发展蓝图中。不难想象,AI技术势必将在塑造未来会议技术和会议室中扮演着更为重要的角色。思科希望帮助企业制定针对AI的全球性战略举措,积极使用专为支持当下和未来AI功能而设计的平台,创造并实现AI价值的最大化。
思科全球高级副总裁,应用事业部总经理Rowan Trollope表示:“在未来几年,AI会议机器人将会融入工作团队之中。随着它们被投入使用,员工将能够摆脱乏味的会议设置和其他后勤工作,转而从事更有创造性的工作。拥有人工智能的思科Spark代表着未来会议的发展方向,通过帮助客户充分利用这一具有颠覆性的技术,我们的合作伙伴将会获得绝佳的机遇。”
好文章,需要你的鼓励
卡内基梅隆大学发布了他们的一项最新研究,他们对20多个开源推理模型进行了后训练,涵盖数学推理、科学问答、代码生成、指令遵循等多个维度,最终发现,数学能力优异的模型,在其他任务上表现平平,甚至还不如未加强数学推理能力的原始模型
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
Meta正在建设名为Hyperion的数据中心,预计提供5千兆瓦算力支持其AI实验室。该项目占地面积足以覆盖曼哈顿大部分区域,位于路易斯安那州东北部,将在数年内扩展至5GW规模。此外,Meta还计划在2026年启用1GW的Prometheus超级集群。这些项目旨在提升Meta在AI竞赛中对抗OpenAI和谷歌的竞争力,但也将消耗大量电力和水资源。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。