5月2日,以“后CNN时代的探索”为主题的信息与通信工程学院学术论文沙龙第三期在北京邮电大学西土城校区教三134如期举行。北京飞搜科技算法工程师李磊和肖扬,分别作为胶囊网络组和深度森林组的主讲人进行讲解。
首先是胶囊网络知识的讲解,主讲人李磊从神经网络引出胶囊网络的概念,介绍了胶囊网络的提出与发展过程;接下来李磊通过对比两者的区别与联系,详细讲解了胶囊网络的原理和完整过程:胶囊网络将CNN中每个神经元的标量输出,替换为一个向量输出,通过向量点积更新权重。经过迭代,根据高级胶囊的输出逐步调整低级胶囊输出给高级胶囊的分布,最后会达到一种理想的分布。最后,李磊给出三个思考题, 在场同学分成小组讨论,各组选出代表进行发言分享。经过在场同学的讨论和李磊的解答,胶囊网络和神经网络的异同之处更加清晰明了,同学们对胶囊网络的原理有了更加清晰的概念,同时认识到它的开源框架还比较少,仍具有较大的发展空间。
接下来由主讲人肖扬介绍深度森林的相关知识。首先介绍了神经网络的缺陷:所需数据集大,标注成本大,计算要求高。针对神经网络这些不足,基于机器学习的深度森林模型应运而生。接着,肖扬通过级联结构和森林结构两个角度详细介绍了深度森林的原理, 每棵树会根据样本所在的子空间中训练样本的类别占比生成一个类别的概率分布,然后对森林内所有树的各类比例取平均,输出整个森林对各类的比例。随后,肖扬将深度森林与CNN进行对比,强调了前者是有监督学习,由特征驱动,每一层都可以作为输出,具有计算开销好,超参数少,各个级联采用交叉验证,避免的过拟合等优势。最后,肖扬同样针对所讲内容给出了三个问题供大家讨论,并进行深入浅出的解答。通过在场同学和主讲人思维的碰撞与积极的讨论,问题化繁为简,知识脉络愈加清晰。
此次学术论文沙龙主要从胶囊网络和深度森林两个方面,介绍了后CNN时代的探索,将三者纵向结合,将异同点和适用范围进行对比,为在相关领域进行研究的同学们提供了一个更加清晰的方向。
信息与通信工程学院学术论文沙龙已经成功举办了三期,每一期都干货满满,让在场同学能够结合相关论文材料,切实接触了到前沿概念,洞悉图像识别科技的发展方向,收获颇丰。同时我们也能看到飞搜科技在深度学习图像识别领域的积累以及传承。期待飞搜科技在接下来的学术论文沙龙中带来更多详实的知识!
北京飞搜科技(http://www.faceall.cn/)成立于2015年,公司专注于人工智能,计算机视觉和深度学习的研发,并把研究成果应用到智慧城市解决方案中,让城市更加安全,交通更加高效,生产更加智能、购物更加方便。公司力争在2020年底成为国内领先的智慧城市解决方案提供商。
作为全球领先的深度学习技术提供商,北京飞搜科技是国家高新技术企业、中关村高新技术企业、北京市软件企业。公司已经申请了近50件发明专利,获得20项软件着作权和多项行业认证的标准。公司的核心团队来自诺基亚、法国电信、富士通、微软、英特尔等世界500强企业,具有海外的工作经历和国际视野,以及多年的管理、开发和服务经验。北京飞搜科技(http://www.faceall.cn/)不但提供智慧城市解决方案,还通过阿里云,华为云,amazon平台, 为企业与个人提供人脸/图像识别的SAAS服务; 离线SDK技术授权服务等。公司已经服务了200多家客户,包括中国移动、中国联通、中国电信、华为、台湾广达等国内客户,以及土耳其、科威特、新加坡、捷克、法国等多个国家的企业客户,为他们提供视频监控、智能鉴黄、人脸识别、图片识别、无人驾驶,线上购物支付、机器人等技术支持。
好文章,需要你的鼓励
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
这项由香港中文大学和AWS团队联合开发的研究推出了TALK2MOVE系统,实现了用自然语言精准操作图片中物体的位置、角度和大小。该系统采用强化学习训练方式,通过空间感知奖励机制和智能步骤采样技术,在移动、旋转、缩放三类操作上的准确率显著超越现有方法,同时大幅降低了对昂贵训练数据的依赖,为AI图像编辑领域带来重要突破。
研究人员对Claude、GPT-4、Gemini和Grok等商用AI模型进行测试,发现这些模型能够记忆并完整输出受版权保护的内容。其中越狱后的Claude 3.7 Sonnet能输出95.8%的《哈利波特与魔法石》内容,而Gemini和Grok在无需越狱情况下也能输出超过70%的内容。这一发现可能对正在进行的AI版权诉讼产生重要影响,目前多家AI公司面临超过60项相关法律诉讼。
斯坦福大学等知名机构联合研究发现,企业AI助手在执行组织政策时存在严重"偏科"问题:处理允许请求时成功率超95%,但拒绝违规请求时仅13-40%。研究团队开发的COMPASS评估框架通过8个行业5920个测试问题,揭示了AI助手普遍缺乏"拒绝技能"的问题,并提出了针对性训练解决方案。