近期,由华为云冠名的“华为云杯”2019深圳开放数据应用创新大赛于6月19日正式启动。本次大赛是面向内地及港澳地区高校、专业研究机构、数据分析公司、开发者等专业对象举报的大型数据创新竞赛。
“华为云杯”2019深圳开放数据应用创新大赛正式启动
据悉,本次“华为云杯”2019深圳开放数据应用创新大赛得到了广东省政府服务数据管理局、深圳市委宣传部、深圳市委网信办、深圳市委大湾区办等有关政府单位的指导。由深圳市政府服务数据管理局、深圳市坪山区人民政府、深圳市前海管理局主办,华为技术有限公司、深圳广播电影电视集团承办,并得到德勤中国、香港人工智能与机器人学会、鹏城实验室等相关代表、专家以及各界媒体的支持与关注。
数据是一座富矿 需要深入挖掘
深圳市政务服务数据管理局局长刘佳晨在大赛启动仪式上指出,“2018年4月,习近平总书记在全国网络安全和信息化工作会议上强调,要发展数字经济,加快推动数字产业化,依靠信息技术创新驱动不断催生新产业、新业态、新模式,用新动能推动新发展。毋庸置疑,数据是一座富矿,只有将政府所拥有的数据,在保护个人隐私及信息安全的基础上向社会充分地开放,让数据流动起来,赋予企业、公众和社会使用这些数据的权利,充分挖掘数据资源的宝矿,才能够更好地释放数据资源的红利,发挥最大的效益。”
另外,刘佳晨表示,“之所以要举办2019深圳开放数据应用创新大赛,就是要通过大赛更好地推动政府部门开放数据,通过对政府开放数据进行挖掘和分析,创新城市大数据的多维度深度应用,探索政务数据与互联网数据、企业数据的融汇集成,促进深圳市大数据产业良性发展,从而推动政府更加开放、透明,营造尊重数据、保护数据、善用数据的氛围,促进全社会数据的共建、共治、共享。”
据了解,本次大赛以“数聚粤港澳 智汇大湾区”为主题,秉承公平融合创新开放的宗旨,面向内地和港澳地区招募参赛,在数据脱敏的前提下开放民生实事、道路交通、城市建设、公共安全、经济发展等14个领域1095项14000多万条的数据,获取真实有效的数据集超过500G,涉及政府和社会的方方面面。
此外,本次大赛共设置五大赛道,分别是:数据创意赛、数据分析赛、数据治理赛、坪山民生诉求分析赛、坪山视频识别分析赛。大赛将向参赛者提供140万现金奖励和价值30万的华为云资源作为奖励,从而为参赛者提供了一个开放竞技、创意无限的数据竞赛平台。同时,大赛还将给予优秀队伍产业扶持政府购买服务、项目孵化、项目推广宣传等一系列优待政策,帮助项目顺利落地,促成项目产业化。
刘佳晨最后指出,通过大赛中各参赛者充分发挥聪明才智,以问题需求为导向,大胆创新,以数据驱动美好深圳为目标,就热点、痛点和难点问题所提出的创新解决方案。我们相信大赛创新成果必将形成大量令人惊喜的创新案例,助力深圳市新型智慧城市和数字政府建设,以及政府治理能力和服务水平的提升,并帮助智慧产业链的形成与粤港澳大湾区实现高质量的发展,促进深圳经济高速发展。
ModelArts助选手轻松应赛
作为本次大赛的主要承办方,华为云对大赛的成功举办又提供了哪些方面的支撑呢?华为云EI服务产品部总经理贾永利表示,“我们今天处在一个高度发达的信息化社会,生产和生活中产生了大量的数据,这些数据在数字世界中形成了一个对物理世界的镜像和补充,大量的数据终蕴含了非常多的价值。未来人工智能将是推动人类社会前进的重要力量,而数据将至关重要。”
华为云EI服务产品部总经理 贾永利
贾永利指出,本次“华为云杯”2019深圳开放数据应用创新大赛,政府经过悉心的筹备开放了一大批数据,这些数据都是源自于城市相关的生产生活的真实场景。为了支撑这次大赛的成功举办,华为云提供一系列的支持。
首先,华为云为选手提供了一站式的AI开发工具ModelArts,可以帮助选手在数据预处理、数据算法开发、数据模型训练、推理结果的测试验证、端到端的所有环节提供支持。ModelArts具备三个特点:第一是上手快。可以让一个零AI开发基础的人在一天内学会使用其进行开发,同时其也适用于专业的AI博士和研究人员,因此降低了使用门槛;第二是训练速度快、节省资源。ModelArts通过斯坦佛大学深入学习了所有软件排行榜上的技能,在图像处理的训练速度和推理速度两项都保持大幅领先,训练速度超过第二名4倍;第三是部署推理的速度快。可以大幅降低开发者的入门门槛,能够让开发者更加专注于自己的业务创新和AI的创新。
其次,华为云在本次赛事期间还提供了一系列的实时线上线下培训、技术支持和答疑等活动,能够帮助参赛选手在竞赛中遇到问题时,可以通过线上线下的交流及训练营,获得行业专家的现场指导。同时,华为云对用户的数据保持足够的重视与敬畏,包括提供算法、算力携手客户合作伙伴,结合数据进行行业创新,共同打造AI模型应用。未来华为云将持续发挥链接+云+计算的优势,强化在全栈全场景AI上的解决方案,通过卧虎计划不断引领人才培养。
据悉,华为云AI开发平台ModelArts是面向AI开发者的一站式开发平台,能够提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成,及端-边-云模型按需部署能力,从而帮助用户快速创建和部署模型,管理全周期AI工作流。
华为云释放开发潜力
在接受至顶网采访中,贾永利表示,“华为云是要将云的资源释放出来,把云的优势发挥出来。目前不管是在学校,还是在企业中具备AI开发技术的人才都是非常少的,而学校更关心算法的研究,但学校的资源十分有限。因此华为云将把这种能力释放出来,让开发者在做AI开发的过程中,不用耗费过多精力,从而更加聚焦对业务的创新。”
另据贾永利介绍,通过这样的比赛,赋能培养更多的开发者,助力提升全行业的人工智能技术能力,加速AI落地行业的进程,从而最终实现普惠AI。这也与华为公司的总体愿景是一脉相承的:把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。
最后,贾永利指出,“华为云能够提供从芯片到软件,从云到边缘到端的全栈全场景解决方案,目标是做到普惠AI。华为云希望AI能够让更多的人用得起、用得好,用得放心,希望更多的开发者、企业和创业公司能够快速地培养自己的AI人才,有更多的人学会用人工智能开发,并投入到各自的行业实践中去。”
大赛精彩视频:
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。