5月27日,在2021数博会期间,奇安信正式发布数据安全开放平台“数据交易沙箱”。据介绍,该产品以秉承“数据不动程序动”、“数据可用不可见”的安全理念,解决数据流通交易过程中的隐私安全问题,为用户提供数据价值挖掘的使能器。
当前,在人工智能、大数据、物联网、5G等新一代网络技术的推动作用下,我国数字经济规模持续增长,数据与土地、劳动力、资本、技术并列上升为新型生产要素,成为支撑数字经济发展的核心力量。然而,隐私泄露事件频发,隐私保护政策日趋严格,各行业管理者在共享开放数据方面顾虑重重,如何才能破解“隐私安全与数据价值流通对立”的难题?
对此,奇安信数据安全子公司产品总监冯镭表示,“我国改革开放以来,以土地、劳动力、资本、技术作为生产要素,推动了四十多年的高速经济增长,当前数字经济时代,数据作为新型生产要素的大幕刚刚开启,数据只有流通起来才有价值,才能真正的生产要素化,我们要做的就是通过技术手段解决数据生产要素化的’拦路虎’,平衡隐私安全与数据价值之间的矛盾。”
奇安信“数据交易沙箱”以方滨兴院士提出的安全分离学习技术为核心,具备开放式机器学习工作台、数据操作追溯审计、数据置换、沙箱计算容器和反隐私隐藏等多种核心功能,支持对接多种数据源,严格化管控数据访问权限,在数据拥有方和数据需求方之间构建一个多层次的“数据交易沙箱”,真正做到分享数据价值不分享数据。
数据要想真正成为新型生产要素,数据安全是重要前提。在数据安全和隐私保护方面,奇安信“数据交易沙箱”采用了创新性的数据沙箱隐私保护计算技术,可根据数据所有方和数据使用方的不同需求灵活部署,使数据分析师在接触不到原始全量数据的前提下,能够对全量数据进行充分的分析和挖掘,最终只带走不含敏感数据的模型文件或分析结果。
同时,“数据交易沙箱”会全程记录对数据的访问、分析、计算等操作行为,对恶意使用数据的行为进行识别与检测,对违规操作行为进行监管与预警,让数据要素安全流通成为可能。
在发布过程中,冯镭向大家展示了“数据交易沙箱”在多个行业场景下的落地与实践。目前,“数据交易沙箱”已在政务、医疗、金融等重要行业落地并使用,在保障数据安全的前提下实现数据价值的挖掘利用。
国务院《关于构建更加完善的要素市场化配置体制机制的意见》明确提出,要加快培育数据要素市场,充分挖掘数据要素价值。奇安信“数据交易沙箱”为广大政企用户提供了国际领先的数据安全解决方案,帮助政企用户突破“不敢”、“不愿”、“不能”共享数据的困境,通过“数据交易沙箱”合法合规地对外开放数据,既保证数据安全,又能充分发挥数据的最大价值,以此助推数据的生产要素化和数字经济的快速发展。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。