一场全数字化转型的漩涡正在展开,你能想象哪几个行业处于这个漩涡的中心并受到越来越强的冲击?一项由IMD商学院和思科联合开展的调查报告显示,处于这个漩涡中心点的前三个行业分别是高科技、媒体娱乐和零售行业。对于这几个行业正在产生的全数字化变化也许我们感同身受,科技变化日新月异,媒体娱乐正在快速转变它的内容生产和传播方式,每个人的零售购物方式和以往已大为不同。
紧随其后的这个行业也许你还没来得及思考,不过它正在快速向数字漩涡的中心迈进,那就是金融业。金融行业的变化突如其来,以至于很多人跟银行网点打交道的次数直线降了下来。思科甚至有一个大胆的预测,“现有的10家银行中有4家可能因全数字化颠覆而面临被取代的风险。”它也许就在未来三年内发生。
金融业加速全数字化转型
思科在调查时发现,金融服务领域的全数字化程度已经超越了大多数其他行业,然而在2015年,金融服务仍然仅获得了潜在全数字化价值的29%,金融服务公司正在错失71%的潜在价值。思科大中华区资深副总裁、大客户事业部总经理海广跃在解释这个原因时表示,核心的原因是它们原有的业务建立在传统的组织、业务基础之上,很难颠覆自己。另外一个原因是网络安全威胁阻碍了银行采取全数字化技术和业务模式。
思科大中华区资深副总裁、大客户事业部总经理海广跃
不过在这场全数字化浪潮中根本由不得金融业自己,加速全数字化转型关乎生存更孕育着巨大的机遇。思科调研报告揭示了单就银行业的全数字化创新所带来的巨大商机,从2015年到2017年银行开展全数字化转型可推动产生4050亿美元的潜在价值。
思科认为,在这一巨大商机中,超过90%是由关键全数字化用例推动的。其中包括销售和服务转型、新一代员工、视频顾问、移动支付和联网广告等。
海广跃指出,全数字化本身除了改造生产流程、节约成本外,最大的改变是业务模式的改变。以三菱东京日联银行和瑞穗银行为例,它们正在使用仿人机器人回答问题,提供个性化的理财建议。这些机器人绝非徒有其表,相反,它们身兼视频建议、分析、远程专家、机器人甚至是人工智能等领先技术于一身。在此基础之上,它们为改善客户体验、提高分行效率和优化人力资源管理提供了一种创新的途径。
思科助力金融业拥抱全数字化运营
思科是金融业全数字化转型的重要推动者,“思科从四个层面助力金融行业全数字化转型,一是全数字化客户体验,例如实现全渠道与客服顾问的无阻沟通;二是全数字化协同办公,例如增强金融机构、代理、客户多方的互动体验;三是全数字化业务运营,如通过跨云服务商和数据中心的自动化运营,降低基础架构和应用开发投入成本;四是风险和信息安全管控,满足监管与内控合规要求等。”海广跃说。
其中全数字化业务运营给金融业带来的影响和挑战着实不小,几个月前,中国银监会发布的《中国银行业信息科技“十三五”发展规划监管指导意见(征求意见稿)》就指出,银行业应稳步实施架构迁移,到“十三五”末期,面向互联网场景的重要信息系统全部迁移至云计算架构平台,其他系统迁移比例不低于60%。
思科大中华区副总裁、企业事业部技术总经理苏哲
六成的银行信息系统到2020年迁至云平台恐怕做起来并不容易,思科大中华区副总裁、企业事业部技术总经理苏哲就指出,很多传统金融机构的核心应用开发于几年甚至十几年前,那个时候基于计算、存储、网络等资源构建的IT架构和设计现在并没有太多改变,而现在很多互联网金融和创新金融应用已经开始使用云来帮助实现业务成效,云原生应用已经开始帮助这些创新的金融领域释放巨大的价值。
对于很多传统金融机构来说,它们的全数字化业务转型注重的是怎么让传统的应用过渡到云以及和云原生态应用共存,思科称之为IT的双模模式。
苏哲表示,在此方面,思科能够帮助金融业加速向云和全数字化业务运营迈步,包括底层的基础架构,其上的策略管理与自动化、PaaS+容器、应用生命周期+云服务商管理、IT服务订购、安全与分析等。“以策略管理和自动化来说,它基于SDN软件定义网络的方式,把原来的黑盒子打开应用接口,在上面进行编程,结合应用对底层硬件进行控制。Cisco Tetration Analytics是一个针对云的大数据分析平台,它可以为云和数据中心的客户进行图形化的展现和分析,以判断各个指标运行是否健康。”
当然,除此之外,思科还提供了包括集成架构解决方案、企业混合云方案、超融合解决方案HyperFlex系统、全数字化网络架构(DNA)、协作解决方案等在内的思科全数字化新一代数据中心解决方案推动金融全数字化转型。
海广跃强调,思科公司在中国发展业务二十余载,从进入中国开始思科就服务于中国的金融行业,对中国的金融行业非常了解。全数字化浪潮的今天,思科也正在以全球领先的方法论和成熟的IT架构帮助中国的金融业加速全数字化转型。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。