近日,2016华为大连软件开发云上线大会在大连市成功举办,大会围绕“云智软件,众享未来”为主题,主要探讨了软件产业升级转型的挑战,和如何利用云的优势提升软件企业的研发效率与竞争力。作为一份解答,也是本次大会的重点之一,华为在会上发布了面向软件企业、高校和开发者提供云端研发工具服务的软件开发云平台DevCloud。华为公司高级副总裁、首席信息官陶景文在会上表示:“软件开发云,就是开放华为在研发领域多年积累的工程能力和优秀实践。”大连市人民政府副市长刘岩评价表示:“华为大连软件开发云的正式上线是大连软件和信息产业发展的一件大事,也是大连市政府与华为公司战略合作的一项重要成果。也标志着大连和华为的战略合作,进入了崭新的阶段。”
在被问及为何会选择在大连召开此次会议时,企业云业务部CTO宋勇表示:“中国软件产业正处于快速发展的时期,大连作为软件名城,经过二十多年的发展,有1500多亿以上的产值,有2000多家企业,有20多万开发者,企业和专业人才都有有转型的诉求,所以,软件开发云的落地有了自己的土壤,我们相信软件开发云会在大连有很好的发展。”
软件开发云产品总监徐峰为我们做了进一步的具体阐述,表示华为与大连的合作是由来已久的:“在大连市市长肖盛峰和华为轮值CEO徐直军先生的共同支持下,2015年6月,华为就在大连成立了云创新中心,并落地了软件开发云的项目,经过这一年的实践,华为已经跟大连市政府以及本地的企业探索出了一条实践的道路。”据悉,大连市政府和华为共同构建的软件开发云平台为大连市扶持的一些高新园区的中小企业提供了端到端的软件研发平台服务,助力很多大连本地中小企业的快速成长,同时让这些中小企业聚焦于自己的核心业务,提升产品竞争力。徐峰补充表示:“这样一种模式会有广泛的适用性。我们非常有信心,将来能在各个软件的城市,以及软件园区充分推广我们软件开发云的平台。”
对此,大连市副市长刘岩也在参会期间表示:“大连软件发展有一定的基础,也同样面临转型升级的任务。在此背景下,通过与华为的合作,将逐步构建大连云计算的产业生态环境,推进云计算基础设施建设,提升云计算的服务能力,进一步培育云服务市场的形成,同时进一步支持围绕云计算、大数据关键技术的研发和应用,带动大连市软件企业的发展。”
据了解,大连市委市政府这些年非常重视软件产业的发展,目前已形成比较明显的基础优势。最重要的是大连的软件产业有比较扎实的产业基础。到2016年全市规模以上软件企业实现总销售收入1015亿,规模以上企业数量达到了600余家,从业人员超过了20万,大连的高新区也聚集了全市80%的软件企业。第二,大连的基础创新成果也令人瞩目,本次华为推出上线的软件云已经有十余个软件自动化、飞机数字化制造、移动通讯,智能交通创新中心等实践。最后,大连作为东北地区重要的对外开放窗口有的独特的区位优势,70多家世界五百强企业在大连落户,集成电路、软件研发、信息服务都是和国际同步发展。
此外,大会同时,华为宣布了华为企业云与大连华信计算机技术股份有限公司、亿达信息技术有限公司、英特工程仿真技术(大连)有限公司、辽宁维森信息技术股份有限公司、大连理工大学、大连海事大学分别签订了云计算战略合作协议。目前,华为企业云已经与全国30多个城市签订了战略合作,和500多家来自智慧城市、大数据、媒资、金融、物联网、智能制造、电商服务、医疗健康、农业、现代服务业等领域的产业链相关企业形成了合作伙伴关系。刘岩副市长表示:“大连市高度重视与华为公司的战略合作,市政府要继续做好华为大连软件开发云平台建设运营的各项服务保障工作,支持本地企业使用华为云服务,借助华为公司云技术优势,吸引和推动更多的企业转型升级。”
作为华为软件开发云的后盾,华为企业云的战略定位是坚持以客户为中心,聚焦IAAS,聚合SAAS,上不做应用,下不碰数据,专注于打造中立、安全、可信的云基础设施服务,做创新云技术的提供者,“我们希望成为数字社会和智能社会发展进程的推动者。” 陶景文如是说。
好文章,需要你的鼓励
这篇研究揭示了大语言模型强化学习中的"熵崩塌"现象——模型在训练早期迅速失去探索能力,导致性能达到可预测的上限。研究者发现验证性能和策略熵之间存在精确的数学关系:R = -a·exp(H) + b,并深入分析了熵变化的内在机制。基于这些发现,他们提出了两种简单有效的方法(Clip-Cov和KL-Cov)来缓解熵崩塌问题,显著提升了模型性能,特别是在困难任务上。这项研究为大模型强化学习的规模化应用提供了关键指导。
Skywork OR1是昆仑公司AI团队开发的开源推理大模型,通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列,采用名为MAGIC的训练方法,在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升,32B模型平均准确率提高15.0%,7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象,提出了有效的缓解策略,并开源了全部代码、数据和模型权重,为AI社区提供了宝贵资源。
上海交通大学研究团队发现多模态大语言模型中的"啊哈时刻"(自我反思模式)虽存在但并不意味着推理能力提升。他们提出了"冷启动强化学习"两阶段方法:先用监督微调建立推理模式,再通过强化学习优化。实验表明,这种方法在多个多模态数学推理基准上表现卓越,使3B参数模型达到接近甚至超越部分7B模型的性能,为增强多模态AI推理能力提供了有效路径。
MBZUAI研究团队开发的SVRPBench是首个模拟真实物流环境的随机车辆路径问题基准测试平台。它通过建模时间依赖的交通拥堵、概率性延误和客户特定时间窗口,为500多个包含最多1000客户的测试实例注入真实世界的不确定性。实验结果显示,先进的强化学习算法在分布变化时性能下降超过20%,而传统方法表现更为稳健。该开源平台通过GitHub和Hugging Face发布,旨在推动更适应现实世界不确定性的路由算法研究。