5月2日,以“后CNN时代的探索”为主题的信息与通信工程学院学术论文沙龙第三期在北京邮电大学西土城校区教三134如期举行。北京飞搜科技算法工程师李磊和肖扬,分别作为胶囊网络组和深度森林组的主讲人进行讲解。
首先是胶囊网络知识的讲解,主讲人李磊从神经网络引出胶囊网络的概念,介绍了胶囊网络的提出与发展过程;接下来李磊通过对比两者的区别与联系,详细讲解了胶囊网络的原理和完整过程:胶囊网络将CNN中每个神经元的标量输出,替换为一个向量输出,通过向量点积更新权重。经过迭代,根据高级胶囊的输出逐步调整低级胶囊输出给高级胶囊的分布,最后会达到一种理想的分布。最后,李磊给出三个思考题, 在场同学分成小组讨论,各组选出代表进行发言分享。经过在场同学的讨论和李磊的解答,胶囊网络和神经网络的异同之处更加清晰明了,同学们对胶囊网络的原理有了更加清晰的概念,同时认识到它的开源框架还比较少,仍具有较大的发展空间。
接下来由主讲人肖扬介绍深度森林的相关知识。首先介绍了神经网络的缺陷:所需数据集大,标注成本大,计算要求高。针对神经网络这些不足,基于机器学习的深度森林模型应运而生。接着,肖扬通过级联结构和森林结构两个角度详细介绍了深度森林的原理, 每棵树会根据样本所在的子空间中训练样本的类别占比生成一个类别的概率分布,然后对森林内所有树的各类比例取平均,输出整个森林对各类的比例。随后,肖扬将深度森林与CNN进行对比,强调了前者是有监督学习,由特征驱动,每一层都可以作为输出,具有计算开销好,超参数少,各个级联采用交叉验证,避免的过拟合等优势。最后,肖扬同样针对所讲内容给出了三个问题供大家讨论,并进行深入浅出的解答。通过在场同学和主讲人思维的碰撞与积极的讨论,问题化繁为简,知识脉络愈加清晰。
此次学术论文沙龙主要从胶囊网络和深度森林两个方面,介绍了后CNN时代的探索,将三者纵向结合,将异同点和适用范围进行对比,为在相关领域进行研究的同学们提供了一个更加清晰的方向。
信息与通信工程学院学术论文沙龙已经成功举办了三期,每一期都干货满满,让在场同学能够结合相关论文材料,切实接触了到前沿概念,洞悉图像识别科技的发展方向,收获颇丰。同时我们也能看到飞搜科技在深度学习图像识别领域的积累以及传承。期待飞搜科技在接下来的学术论文沙龙中带来更多详实的知识!
北京飞搜科技(http://www.faceall.cn/)成立于2015年,公司专注于人工智能,计算机视觉和深度学习的研发,并把研究成果应用到智慧城市解决方案中,让城市更加安全,交通更加高效,生产更加智能、购物更加方便。公司力争在2020年底成为国内领先的智慧城市解决方案提供商。
作为全球领先的深度学习技术提供商,北京飞搜科技是国家高新技术企业、中关村高新技术企业、北京市软件企业。公司已经申请了近50件发明专利,获得20项软件着作权和多项行业认证的标准。公司的核心团队来自诺基亚、法国电信、富士通、微软、英特尔等世界500强企业,具有海外的工作经历和国际视野,以及多年的管理、开发和服务经验。北京飞搜科技(http://www.faceall.cn/)不但提供智慧城市解决方案,还通过阿里云,华为云,amazon平台, 为企业与个人提供人脸/图像识别的SAAS服务; 离线SDK技术授权服务等。公司已经服务了200多家客户,包括中国移动、中国联通、中国电信、华为、台湾广达等国内客户,以及土耳其、科威特、新加坡、捷克、法国等多个国家的企业客户,为他们提供视频监控、智能鉴黄、人脸识别、图片识别、无人驾驶,线上购物支付、机器人等技术支持。
好文章,需要你的鼓励
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
Meta为Facebook和Instagram推出全新AI翻译工具,可实时将用户生成内容转换为其他语言。该功能在2024年Meta Connect大会上宣布,旨在打破语言壁垒,让视频和短视频内容触达更广泛的国际受众。目前支持英语和西班牙语互译,后续将增加更多语言。创作者还可使用AI唇形同步功能,创造无缝的口型匹配效果,并可通过创作者控制面板随时关闭该功能。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。