2022年4月26日《数据防泄露技术指南》发布会顺利召开。本次会议由中国信息协会信息安全专委会主办,中国信息协会信息安全专业委员会数据安全工作组、北京天空卫士网络安全技术有限公司联合承办。国家信息中心信息与网安部、中国信息协会信息安全专业委员会、中国科学技术大学网络空间安全学院、中国信通院云与大数据研究所、天空卫士公司、海尔集团IT安全中心的领导和专家以及众多信息安全产业代表、数据安全专家参与了本次会议。
数据防泄露技术为数据安全“紧弦”
2022年4月19日,习近平总书记在主持召开的中央全面深化改革委员会第二十五次会议中强调:“要始终紧绷数据安全这根弦"。
数据泄露防护是支撑这根“弦”的重要落地技术。《数据防泄露技术指南》的发布,旨在提升数据安全管理能力,为加快构建数字经济全方位安全保障体系,促进数据合理、合法、合规使用和流通,夯实数字经济的基座,做出相应的贡献。
此次会议,特别邀请数世咨询创始人李少鹏作为本次发布会的主持人,他表示:随着云计算、大数据、区块链等新技术的发展,数据已成为数字经济发展过程中最具价值的生产要素,而数据安全是数字经济的基石,亦是数字经济发展的底线保障,因此,做好数据安全工作有利于推动数字经济的健康发展。
继2020年中国信息协会信息安全专业委员会对数据防泄露产品进行测评之后,通过线上会议形式发布《数据防泄露技术指南》,希望与大家一起探讨DLP的标准和发展方向。
数据泄露防护需求迫切
数据是国家发展、企业生存的命脉。国家信息中心信息与网安部副主任禄凯说道:习近平主席强调,“要切实保障国家数据安全。要加强关键信息基础设施安全保护,强化国家关键数据资源保护能力,增强数据安全预警和溯源能力。“
《数据安全法》、《个人信息保护法》等法律法规的实施,进一步推动了中国的数据安全体系的建设和发展,数据安全作为当前国家安全的重要组成部分,被提到了前所未有的高度,当前的紧迫需要是通过技术手段推动两法的落地,尽快、有效的解决数据安全问题,特别是数据泄露问题。
通过对数据防泄露技术的不断研究、探索和实践,逐步建立完善的数据防泄露技术方法和解决方案。希望通过数据防泄露技术不断创新发展,进一步降低数据泄露风险,促进业务的健康发展。
中国信息协会信息安全专业委员会叶红主任表示: 随着数字经济的不断发展,各类数据海量聚集,数据安全已经成为关乎国家安全与社会经济发展的重大问题。近年来,我国电信、金融等行业的业务数据规模在不断扩大,数据泄露风险也日益提高,数据泄露防护市场需求迫切。
数据安全落地离不开标准和规范
2022年是贯彻落实国家“数据安全法”的关键性一年,中国信息协会信息安全专业委员会做为主办单位,在推动数据安全技术的规范性、标准性、创新性,以及提高数据信息安全技术等方面起着重要的带头作用。
数据分类分级是《数据安全法》提出来一项重要制度,对数据进行分类分级的前提是要先识别敏感数据,那么如何有效识别数据呢?中国科学技术大学网络空间安全学院教授左晓栋分享道:全国信息安全标准化技术委员会于2019年7月批准了“重要数据识别指南”研究项目,并于2020年7月正式立项制定国家标准《重要数据识别指南》。2年以来,标准起草组共收到18家单位的92条意见,均已处理完毕。标准对重要数据的重要性描述很原则,在实际工作中能否发挥指导意义,关键一步是地方、行业要基于国家标准制定地方或行业标准、规范。我们下一步的重要工作一是要继续完善《重要数据识别规则》,抓紧报批发布;其次是研究起草《重要数据处理安全要求》。
数据安全政策的落地,离不开标准和规范的建立。以信通院为代表的国家信息通信领域支撑单位也在不断出台行业标准。中国信通院云与大数据研究所副主任姜春宇与大家分享了信通院在标准化体系建立方面的工作进展。姜主任说道:国家高度重视标准化工作,当前我国安全评估工作的重点在于信息安全,而面向数据安全的市场化评测评估尚处于起步阶段。中国信通院推出国内首个数据安全治理能力评估体系(DSG),《数据安全治理能力评估方法2.0》于2021年发布。2022年中国信通院发起数据安全推进计划,目前拥有168家成员单位,面向数据技术/服务提供方提供数据安全服务能力评估和数据安全产品评测。通过标准体系的建立,推动法律法规及监管要求的贯彻落实,促进数据安全技术交流,推广数据安全最佳实践,提升数据安全治理水平。数据防泄露是数据安全治理核心部分,信通院也在开展相关标准和测评工作,也是与此次《数据防泄露技术(DLP)技术指南》非常契合的。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。