数据时代背景下,大数据正在深刻地改变政府的治理模式和服务方式。2016年以来,浙江省明确提出加快推进‘最多跑一次’改革。要充分利用大数据、云计算等新技术,构建 “互联网+政务服务”体系,推动政府职能转变,提升政务服务水平,最大程度利企便民。
在“基于数据引擎的数据监测治理”主题演讲中,新华三大数据产品部副部长杨新安介绍了“互联网+政务服务”落地遇到的问题,详细阐述了新华三数据引擎DataEngine在助力智慧政务建设中发挥的作用。
杨新安表示,加快“互联网+政务服务”体系建设,需要分阶段推进:第一阶段是打破传统数据分割,实现数据共享,改进流程,实现一窗通;第二阶段就是对全量沉淀的数据进行挖掘分析,以数据监测/质量为核心,最终提高效能监督机制,实现数据准实时监控,并及时纠偏。
不过,以上两个方面仍停留在传统思维层面:提出需求—给出方案。对于政府而言,陌生领域的决策更需要大数据来支撑,首先必须先从传统思维向大数据思维转变。杨新安指出,借助应用开发引擎、人工智能引擎探索数据价值的未知领域,是大数据发展的第三阶段;依托数据运营引擎实现数据价值最大化是最终目标。
目前,新华三数据引擎DataEngine已经为广东政府打造了数据监测平台,助力政府信息服务效能大幅提升。同时也在大数据信用建设、社保、公安等领域有诸多实践。可以说,新华三数据引擎DataEngine已成为城市数据引擎新动力。
未来,新华三将持续加大在大数据领域的研发投入,借助数据引擎的力量帮助更多政府用户打造大数据中心体系,成为助推新经济的强大动力。
好文章,需要你的鼓励
这项研究介绍了Ankh3,一种创新的蛋白质语言模型,通过多任务预训练策略显著提升了模型性能。研究者采用两种互补任务:多掩码概率的掩码语言建模和蛋白质序列补全,使模型仅从蛋白质序列就能学到更丰富的表示。实验表明,Ankh3在二级结构预测、荧光预测等下游任务中表现优异,尤其在模型未曾训练过的任务上展现出强大泛化能力,为蛋白质设计和分析开辟了新路径。
法国波尔多大学研究团队开发了一个突破性框架,用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告,并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法,这一系统能生成透明、有因果关系的解释,同时保持高诊断准确率。研究显示,通过群组相对策略优化(GRPO)训练的轻量级模型能展现复杂推理行为,包括假设检验和非线性思考,提供与临床决策流程一致的排序诊断结果。
这项研究提出了CLUE框架,首次能够生成自然语言解释来揭示AI事实核查系统不确定性的来源。与现有方法不同,CLUE能识别文本片段间的冲突与一致关系,并解释它们如何影响模型的预测不确定性。实验表明,CLUE生成的解释在三种语言模型和两个事实核查数据集上都更忠实于模型不确定性,用户评价其更有帮助、信息更丰富、冗余更少且逻辑更一致。CLUE不需要微调或架构更改,适用于任何白盒语言模型,为事实核查提供了实用支持。
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。