“联结最优秀的人,做最有挑战的事”,高校在校学生不仅可以与亚马逊AWS机器学习总监Alexander J. Smola、Facebook科学家贾扬清等全球AI大拿深度互动,还可以完成AI从入门到进阶、从理论研究到应用实践的跨越。近日,由字节跳动发起举办的,接受全球高校学生报名参与的人工智能学习实践训练营“头号玩家”AI夏令营(ByteDance AI Camp)圆满落下帷幕。
据介绍,在此次为期五天的夏令营中,字节跳动邀请人工智能领域全球顶级专家为学员们授课,同时将学员分组和一线技术团队一同精心打造实践项目。字节跳动希望通过此次夏令营,不仅帮助相关专业优秀大学生深入AI前沿研究,也推动他们尝试解决行业内真实存在的技术难题。发起这一夏令营,体现了字节跳动一直以来的人才培养愿景:“联结最优秀的人,做最有挑战的事”。
(字节跳动“头号玩家”AI夏令营学员合影)
夏令营自5月启动报名以来,近2000名本科、硕士、博士经过申请材料审核、线上笔试、视频面试,最终来自国内外30多所知名高校的70位优秀学生通过层层考核,被录取为夏令营首批学员。
除了字节跳动以外,不少国际科技巨头也都通过类似训练营项目吸纳培养人才:微软自 2000 年起开展学生夏令营,Google 举办了大学生创新训练营,Facebook 设立专门吸引大学生的编程马拉松比赛。
在两天的封闭式课程中,由马维英领衔的字节跳动专家团,亚马逊AWS机器学习总监Alexander J. Smola,Facebook科学家、Caffe之父贾扬清等业界大牛与南京大学教授周志华等学术专家,一起为学员们带来了14场高质量技术课程,课程涵盖机器学习、深度学习、对抗学习、计算机视觉、自然语言处理等人工智能技术的各项前沿领域知识及应用。
2天上完14门课程,面对高强度的知识学习,没有学员缺席过一节课。主办方被同学们强烈的求知热情感染,在第二天晚上补增由加州伯克利大学马毅教授带来的计算机视觉前沿技术讲座。讲座持续到深夜23:30,同学们还在踊跃提问,久久不愿离去。
“学术的老师讲完,行业的老师讲,感觉刚知道学术上一个前沿的东西,接下来就知道怎么落地到实际中,这样听下来蛮受用的。”学员表示很喜欢这种交叉授课的方式。
在封闭式课程结束后的项目实践中,学员们选择自己感兴趣的AI项目课题,在行业导师的指导下三人一组在三天内完成AI项目,参加评比。
这次活动的9个项目课题,如图文生成、创意换脸、新闻情感分类和时间序列的检测报警,均出自行业一线。字节跳动的工程师们把工作中遇到有意义的问题拿出来,并精心构建了数据集、工具集,为每组配备足够的算力,让学员们尝试解决。
最终在评比中获得一等奖并赢得五万元奖金的是课题“时间序列的检测报警”研究小组。该组导师因第一天在外地出差,只在线上把文档和操作步骤发给项目小组,没想到第二天一早和小组成员见面时,三位组员已经把baseline的结果跑起来,还搜索了论文,用机器学习的方法去复现,技术能力令导师大感意外。导师表示非常期待他们把时间序列项目继续做下去,放到线上去真正解决问题。
(字节跳动副总裁杨震原和人工智能实验室科学家李航为一等奖获奖小组学员颁奖)
同样令人印象深刻的还有创意变脸项目。小组用3天时间,做出一个前后端完整的换脸产品,人脸、表情包、油画甚至动物的脸部五官互相替换。此项目需要考虑用户的脸与模特的脸的方向不同、肤色的差异、眼镜的置换、面部结合的边缘化处理等问题,他们不仅使用了人脸检测、关键点定位、人脸融合等技术,还把学术界最新研究成果融入到产品中,评审展示时大获好评。
值得一提的是,很多学员在参加夏令营之前,并不具备相关的经验,甚至没接触过NLP(自然语言处理)和CV(计算机视觉),更有同学从Caffe(卷积神经网络框架)的基础环境搭建开始学。通过这次字节跳动组织的夏令营,大家在专家和导师的指导下激发了潜力,解锁了新技能。
学员中还有一名出生于2003年的“00后”,他被作为夏令营“特招旁听生”加入。这名学员小学时参加过计算机竞赛,初一学微积分,初三接触机器学习。他坦言最喜欢中马毅老师的授课,经过马毅老师深入浅出的讲述,原本模糊的CV方向内容变得清晰很多,“头号玩家”AI夏令营让他受益匪浅。
(字节跳动“头号玩家”AI夏令营中的“00后”学员)
许多学员都为能够在读书期间参与这些有影响力、有价值的项目而热血沸腾。来自清华大学的王同学说,在金融机构实习时曾接触过时间序列,不过他的研究最后没能拿到市场上用,而这一次,他很明确“自己在做的事情对工业有影响力”。
“头号玩家”AI夏令营的相关负责人表示:希望这次夏令营活动不仅能让学员们在自己的学员们在AI之路上更进一步,也希望他们带着字节跳动的人才培养初衷回到校园,在返校后影响身边更多有志于AI的技术人才,激发更多优质想法落地业界,成为全球AI技术领域的先行者。”
好文章,需要你的鼓励
这项研究由德累斯顿工业大学等机构的研究团队完成,旨在解决主动学习未被广泛应用的问题。研究者构建了包含460万种超参数组合的实验网格,系统分析了各参数对主动学习性能的影响。研究发现,不同策略实现间存在显著差异,基于边缘的不确定性策略整体表现最佳,随机选择约4000个超参数组合即可获得可靠结果。这些发现为设计可重现、可信赖的主动学习实验提供了明确指导,有助于降低入门门槛,促进技术在实际应用中的普及。
这项由英国爱丁堡大学和上海人工智能实验室研究者共同完成的工作提出了LongBioBench,一种用于评估长文本语言模型的新型基准测试框架。通过使用人工生成的虚构人物传记作为测试环境,该框架在保持可控性的同时,提供了更真实的评估场景。研究对18个长文本模型的测试表明,即使最先进的模型在检索、推理和可信任性方面仍存在显著挑战,特别是上下文长度增加时。研究还揭示了现有合成基准测试的设计缺陷和长上下文预训练的局限性,为未来模型开发提供了重要指导。
SuperWriter是一项来自新加坡科技设计大学和清华大学的突破性研究,通过模仿人类"先思考后写作"的过程,彻底改良了AI长文生成能力。该研究团队开发的框架包含三个关键阶段:规划、写作和修改,使AI能像专业作家一样进行结构化思考。实验结果表明,经过训练的SuperWriter-LM模型不仅超越同等规模的所有AI模型,甚至在某些领域表现优于规模更大的顶级模型,为AI辅助写作开创了新的可能性。
香港大学与阿里巴巴达摩院合作开发的LayerFlow是一种突破性的层级视频生成技术,能同时生成透明前景、完整背景和混合场景视频。该技术通过创新的框架设计将不同视频层级作为子片段连接,并引入层级嵌入使模型区分各层级。面对高质量训练数据稀缺的挑战,研究团队设计了三阶段训练策略,结合Motion LoRA和Content LoRA,实现了图像和视频数据的联合训练。LayerFlow不仅支持多层视频生成,还能实现视频分解和条件层生成,为视频创作领域带来革命性变革。