2021年,是“十四五”的开局之年,更是全面推进“乡村振兴”的元年。在乡村的百年变革中,作为重要抓手的数字乡村建设,正在整体提升农业农村的现代化水平,打造高质量的乡村治理模式,促进农业全面升级、农村全面进步、农民全面发展,成为了数字中国和乡村振兴战略实施的重要结合点。
今年年初,鹰潭市全域被列为首批国家城乡融合发展试验区。在城乡融合发展的大背景下,贵溪看到了数字化创新在推进乡村治理体系和治理能力建设中的价值,与紫光股份旗下新华三集团深化合作,依托鹰潭市政务服务一体化平台,改造贵溪分厅,让智慧城市的创新技术向乡镇、村一级延伸,推进乡村数字治理能力和体系的打造,以乡村数字治理为突破口,激活乡村振兴新动能。
走进雷溪,感受数字治理
在贵溪市南郊雷溪镇,一台简简单单的手机,成了村民们享受数字化政务服务的新窗口。在这里,党员们可以通过视频会议和直播,远程参加“三会一课”,在党员之家则可以随时随地了解家乡动态,更好地服务基层广大党员工作和学习;对村民们而言,如果发现路灯坏了或者村里卫生环境出现了问题,也可以在治理平台上一键提交,相关负责人会在第一时间及时响应,彻底简化了过去“流程多、跑断腿”的棘手问题。
除此之外,雷溪镇更依托数字化平台上线了积分制度,实施家禽圈养,得3分,否则不得分;房前屋后农具、柴火堆晾衣架等摆放整齐,垃圾定期清理,得2分,发现一处陈年垃圾或乱堆放的,扣1分……这些看得见的积分记录,让乡村治理有了量化标准,极大地鼓励了村民们主动维护村容村貌,守护共同的生活家园。同时,乡民们还可以用积分兑换福利,10分可换一包洗衣粉,20分可兑换一件生活用纸,极大地提升了村民对于公共生活的参与感。
在雷溪镇发生这些变化的背后,是贵溪市推进政务服务向乡镇、乡村延伸的坚持。今年7月,雷溪镇率先开展了县域治理现代化乡村基层智治试点工作,推出包括基层数字党建、三务公开、民情反馈、办事不出村、村民积分、你“钉”我办、视频会议、活动直播、邻友圈等十余个应用场景,有效推动了基层公共服务的数字化、精准化、智能化、精细化供给,为贵溪市城乡融合高质量发展营造出良好的环境,跑出了加速度,提升人民群众的获得感、幸福感、安全感。
基层求变,贵溪数字化创新让治理更有力
今年五月,贵溪市下发了《关于“互联网+政务服务”向乡镇(街道)延伸工作的通知》,全面梳理了乡镇(街道)以及下属村、社区级政务服务事项清单,总计收集了633个服务事项。在此基础上,贵溪市深刻把握鹰潭市建设国家城乡融合发展试验区的契机,以服务民生、便民惠民为立足点,以信息化技术为支撑,通过“赣服通4.0”、“赣政通”、政务服务网延伸工程建设等智慧应用的部署,优化办事流程,简化办事材料,强化业务协调,达到数据多跑路、群众少跑腿的目的。
目前,贵溪市的乡镇政务服务事项已经全面部署到位,村级塘湾镇芦甸、雷溪南山村分别上线52项、65项涉及计划生育、社会保险、人口户籍等群众高频服务事项,取得了良好的试点效果。同时,贵溪市已经在“赣服通”、“赣政通”平台上梳理政务应用事项59个,“一链办理”事项清单25个,确认上线开办餐饮店、烟酒类商店、书店、电影院等4个事项,减少材料重复提供18项,优化流程2项,为广大群众提供更加便捷的在线政务服务。
乡村兴则国家兴。面对“十四五”新发展阶段数字乡村发展的重要关口,贵溪市将继续与新华三集团深度配合,以全面领先的创新技术升级服务事项管理等数字化系统,构建乡村数字治理革新的支撑平台,坚持以“便民、利民、为民”的服务理念,想群众之所想,急群众之所急,以数字政府价值的延伸,打造数字乡村,让每一个村民的生活更幸福。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。