近日,京仪孵化器以“助?飞”为主题隆重举办2018年“京仪杯”创业大赛,京仪集团副总经理杨睦民、总工程师董建伟、副总经理卢继伟、相关部室负责人、部分二级企业领导及安芙兰资本、工商银行等金融机构代表出席大会。
“京仪杯”创业大赛紧密结合“十九大”双创精神,落实国家“创新创业”重大战略部署,集聚整合北控集团、京仪集团内外各种创新创业资源,筛选种子项目与京仪集团内部产业链对接,搭建服务创新创业平台。
通过“京仪杯”创业大赛,为在孵企业提供项目对接及投融资服务,促进在孵企业项目成果转化,助力企业创新创业,成为推动集团经济发展和转型升级的强劲引擎,再次掀起新一轮双创活动的热潮。
本届创业大赛经过京仪孵化器为时半年的筹备及初赛,最终十家入孵团队进入决赛并精彩展示。
图为北京飞搜科技PR总监张鹏进行演讲
此次大赛围绕人工智能、智慧城市、智能制造等重点领域向集团及下属企业对接优质在孵项目,大赛现场气氛十分热烈,集团领导及企业负责人争相在提问环节与参赛路演者进行互动交流。
经过一翻激烈角逐,北京飞搜科技荣获2018年“京仪杯“创业大赛三等奖
北京飞搜科技(http://www.faceall.cn/)成立于2015年,公司专注于人工智能,计算机视觉和深度学习的研发,并把研究成果应用到智慧城市解决方案中,让城市更加安全,交通更加高效,生产更加智能、购物更加方便。公司力争在2020年底成为国内领先的智慧城市解决方案提供商。
作为全球领先的深度学习技术提供商,北京飞搜科技是国家高新技术企业、中关村高新技术企业、北京市软件企业。公司已经申请了近50件发明专利,获得20项软件着作权和多项行业认证的标准。公司的核心团队来自诺基亚、法国电信、富士通、微软、英特尔等世界500强企业,具有海外的工作经历和国际视野,以及多年的管理、开发和服务经验。北京飞搜科技(http://www.faceall.cn/)不但提供智慧城市解决方案,还通过阿里云,华为云,amazon平台, 为企业与个人提供人脸/图像识别的SAAS服务; 离线SDK技术授权服务等。公司已经服务了200多家客户,包括中国移动、中国联通、中国电信、华为、台湾广达等国内客户,以及土耳其、科威特、新加坡、捷克、法国等多个国家的企业客户,为他们提供视频监控、智能鉴黄、人脸识别、图片识别、无人驾驶,线上购物支付、机器人等技术支持。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。