背景
2016年8月,金融科技被列入国务院《“十三五”国家科技创新规划》。为此,各家商业银行纷纷顺势而为,积极布局金融科技创新战略,以大数据、云计算、区块链、人工智能和移动互联等信息技术应用为支点,着力打造各类金融工具协同融合的金融生态格局。目前,受监管、负利率、罚款和动荡市场等因素冲击,不管是欧美还是中国的银行业都遭遇寒冬,净利增速下滑、裁员等成为行业普遍现象,我国银行业如何应对复杂多变的局势,抓住数字化转型升级的机遇,实现稳健增长?
挑战
互联网、大数据等新技术的应用改变了客户的生活和消费模式,客户的行为和对金融服务的需求更加多元化、个性化,利用数字化渠道获取金融服务已经成为主流。工商银行紧紧跟随业务和客户发展趋势,加大对大数据、人工智能、区块链、物联网和云计算等新技术的研究和应用,积极进行数字化转型,为客户提供智能、随身、随时、随地的全方位、差异化服务。
数字化转型离不开新型架构的数据中心建设,原因在于传统数据中心存在如下痛点:
1) 业务部署低效
计算、存储、网络不能协同管理,导致业务发放效率低下,难以响应市场需求。
2) 资源利用率低
组织间资源隔离,无法共享。
3) 运维管理复杂
缺乏统一管理平台,难以实现业务和资源统一管理,运维困难。
由于现有传统数据中心存在扩展性低、数据中心过于分散、运维成本高、租户业务迁移困难的问题,华为积极引入SDN/NFV技术,采用华为的CloudFabric解决方案,为工行打造新型的SDN云计算数据中心,有力支撑工行的数字化转型和金融科技业务。
解决方案
· 以SDN为中心提供L2/L3自动化,通过OpenStack构建计算/存储/网络的协同编排和调度能力。
· 网络增值服务(FW、LB等)对接运维平台,与云协同,实现网络自服务化,提供统一编排。
· 基础网络采用Spine-Leaf架构;使用VXLAN构建大二层,VTEP部署在Leaf交换机。
· Vxlan三层网关集中部署;可按需部署多组网关,支持业务的扩展。纯硬集中式网关,保证了性能的同时,符合传统数据中心网络管理人员的运维习惯。
· 网络控制器:对接Openstack云平台实现网络业务的自动化部署,提升应用部署效率,是私有云的最佳推荐方案。
价值
· 实现应用部署时网络配置的自动下发,通过自服务化简化变更流程,提升效率。
· 以云服务方式重构托管业务的支撑模式,多租户共享硬件资源并进行隔离,实现租户网络自管理,快速支持应用灵活部署和IT整合。
· 计算资源打通,建设虚拟化资源池和裸金属资源池;增值服务资源打通,建设增值服务池。各个资源池可以动态申请和释放,SDN控制器进行统一的资源调度,节省资源。
· 采用开放控制器架构,实现轻松定义和扩展网络功能。
总结
随着大数据、云计算、区块链、人工智能和移动互联等技术的发展,业务的快速变化给数据中心提出了更高的要求。综观全球以及国内市场,构建基于SDN的智能的云计算数据中心已成为一种必要。
由于华为的CloudFabric解决方案具有开放性好、易扩展、高容量、成本可控、安全稳定的特点,工商银行经过综合评估,最终选择华为的解决方案,成功建设了基于SDN的云计算数据中心。通过和华为在云计算、分布式数据库等多个领域开展的联合创新,工商银行的金融科技创新之路会走得更好、更远,为客户带来更贴心更多元更智能的金融服务。
好文章,需要你的鼓励
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。
这项研究揭示了大型语言模型的惊人能力:只需两个特殊训练的向量,冻结的语言模型就能在一次计算中生成数百个准确词汇,而非传统的逐词生成。研究者发现,这种能力要求特定的输入排列方式,且生成速度比自回归方法快约279倍。这一发现不仅展示了语言模型未被充分探索的并行生成潜力,还为快速文本重建开辟了新方向。
腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
这项由香港科技大学团队开展的研究首次全面评估了压缩对大语言模型Agent能力的影响。研究发现,虽然4位量化能较好地保留工作流生成和工具使用能力(仅下降1%-3%),但在实际应用中性能下降达10%-15%。团队提出的ACBench基准测试横跨工具使用、工作流生成、长文本理解和实际应用四大能力,评估了不同压缩方法对15种模型的影响。结果显示,AWQ量化效果最佳,蒸馏模型在Agent任务上表现不佳,大型模型对压缩更具韧性。研究还提出ERank等创新分析方法,为实际部署提供了切实指导。