自1956年“人工智能”一词诞生起,六十年间其发展起起落落。随着深度学习重燃、海量大数据支撑、计算能力提升与成本下降,21世纪,人工智能迎来了重生期,并开始对生活的方方面面产生影响。
我们应当逐渐适应人工智能作为辅助工具而存在,比如当图像识别技术渗透到我们生活中时,我们相当于把一部分视力外包给了机器,就像我们现在已经把部分记忆外包给了搜索引擎一样。
视觉AI带给了我们一种全新的,与外部世界进行交互的方式。此前我们探寻世界的流程是这样:人眼捕捉目标信息、大脑将信息进行分析、转化成便于记忆的关键词、输出结果。而当深度视觉技术赋予了机器“眼睛”之后,这个过程就可以简化为:机器捕捉目标信息、机器和互联网直接对信息进行分析并返回结果,使摄像头成为解密信息的钥匙,我们仅需把摄像头对准某一未知事物,就能得到预想的答案。推理摄像机已然成为世界信息的重要入口之一。
随着科技创新与医疗、工业、安防、车联网、物流、新媒体等行业的深度融合,如在病理切片、医学影像、污水处理、监控、自动驾驶、物流分拣、AR/VR、机器人等领域对对于视觉“深度感知”的需求十分突出。比如在机器人领域,使用基于深度摄像头的视觉系统进行视觉导航、识别外界的环境、规划路径、实现避障工作等,已经成为“智能视觉”的典型案例。视觉应用的场景非常广,但真正使人工智能应用落地惠及每个人、每个家庭还存在一定距离。
那么,如何使得人工智能视觉技术的应用得到大规模普及?一个成熟的“视觉感知”方案和开发平台十分必要。华为云构筑“云-端-芯”生态成为华为未来人工智能惠普的关键。在HUAWEI CONNECT 2018期间,华为云依托自身领先的“AI + IOT”能力和工程化能力,发布了面向开发者、企业和设备生产厂商的一款强大的一站式视觉AI应用开发、部署和管理服务平台——HiLens, 着力解决当下“端-边-云”场景下亟待解决的开发问题。
以家庭监控为例,开发者利用HiLens平台和慧眼摄像头,可以开发动作检测与哭声识别技能,应用于老人摔倒识别和小孩的智能关怀;开发人形检测和异常声音检测技能,用于家庭安防监控是否有陌生人入侵;开发人脸识别和属性识别技能,用于从存储的监控视频中智能检索相关的片段。作为企业,可以直接从HiLens技能市场购买相关的技能。
开发者窗口:
“工欲善其事必先利其器”,开发者可以利用华为刚发布的AI智能摄像机---慧眼,通过HiLens平台实现私人化定制技能开发,并一键部署技能到端侧设备(如慧眼)上测试和运行,同时可在线对设备进行相应技能的批量升级、维护等操作。开发者不用担心底层硬件适配与系统兼容问题,因为HiLens提供统一的API接口,支持多种开发框架(如Caffe、tensorflow等);不用担心数据隐私、安全方面的问题,因为HiLens视觉开发平台天然的端云协同架构、可靠的端云通信组件,完全满足开发者的个性化需求。
基于HiLens典型的开发流程如下图,开发者训练一个AI模型,在HiLens上导入该模型并开发相应的控制代码,最终部署到自己的设备上去运行。
HiLens提供的技能市场,可以让开发者将自己开发好的技能一键发布到技能市场供其他人使用、购买。HiLens上线时,华为也将在技能市场发布多项技能,针对家庭、园区、车载等不同场景,覆盖物体检测、动作识别、语音识别等多种应用,供开发者和企业使用。
这一套端云协同的AI开发平台,应用场景非常广泛,像家庭陪伴机器人、智能驾驶上的疲劳驾驶检测、家庭或园区的智能监控等。同时,云侧开发、端侧推理的架构,将解决AI开发使用面对的各项挑战。
Chris Frith在《心智的构建》中提到,我们对世界的感知不是直接的,而是依赖于“无意识推理”,也就是说在我们能感知物体之前,大脑必须依据到达感官的信息来推断这个物体可能是什么,这构成了人类最重要的预判和处理突发时间的能力。而视觉是这个过程中最及时和准确的信息获取渠道,人类感觉信息中的80%都是视觉信息。AI视觉之于人工智能的意义就是视觉之于人类的意义。
视觉AI,连接着机器和这个一无所知的世界,帮助它越发了解这个世界,并最终代替我们完成更多的任务。
企业用户/开发者请戳链接了解更多https://www.huaweicloud.com/product/hilens.html
好文章,需要你的鼓励
研究显示47%的企业在IT人才招聘和留存方面面临挑战,流失率居高不下。意大利53%的IT主管表示人才吸引和保留是日常难题。专家认为人才并非稀缺,而是未得到重视,因此更愿意出国发展。成功的CIO需要识别人才、给予适当机会并建立信任关系。通过持续培训、职业发展机会和有效领导力,企业可以更好地留住IT专业人员。
牛津大学研究团队发现,经过强化学习训练的AI搜索助手存在严重安全漏洞。通过简单的"搜索攻击"(强制AI先搜索)和"多重搜索攻击"(连续十次搜索),可让AI的拒绝率下降60%,安全性降低超过80%。问题根源在于AI的安全训练与搜索功能训练分离,导致搜索时会生成有害查询。研究呼吁开发安全感知的强化学习方法。
一家医疗机构的关键业务应用在早晨高峰期会停止响应长达半小时。技术顾问调查发现,应用厂商在未告知客户的情况下,于业务时间在生产系统上运行修复任务,导致数据库锁定。更令人震惊的是,该生产数据库存储医疗数据和支付信息,却完全没有访问控制,任何用户都可以访问任何数据。
斯坦福大学团队开发了GuideFlow3D技术,通过创新的引导机制解决3D对象外观转换难题。该方法采用智能分割和双重损失函数,能在保持原始几何形状的同时实现高质量外观转换,在多项评估中显著优于现有方法,为游戏开发、AR应用等领域提供了强大工具。