618作者入手了一个某大厂的监控摄像头,产品没什么问题,一如既往的结实可靠,但是发货的时候,却少了一张TF卡。当然,这也不是什么大的事情,找客服问一下,漏发了补寄一张也就行了。可是下面这一幕却引发了我的深度思考。
从这个视频可以看出这个企业确实很负责任,每个产品的包装环节都有着视频记录。虽然我把眼睛瞪瞎也没看出TF卡到底给我放在了哪里。但我已经不再想去追究这个事情,而是在想着如果是利用边缘计算技术,是不是可以将这个事情做的更好?
首先是数据问题,从视频画面的清晰度上来看,摄像头的分辨率至少应该在720P以上,而720P分辨率的摄像头每天产生的数据量,根据作者以前的测算,即便是经过数据优化和压缩也会在10个GB左右。每个摄像头,每天积累下的数据量不可谓不大,而且为了查找有可能出现的问题,例如帮作者找那个偷失的TF卡,虽然最终还是没找到,但我决定还是佛系一点,就这么过去了。由此可以看出,这样的数据即便应用效果不高,也不能随便删除。但这就会对企业的存储系统造成很大负担。
其次,从监控能力上看,这样的监控是不是可以简化工作流程、及时发现并纠正问题。在视频里作者还注意到一个细节,员工在备货的时候,还是需要通过纸质发货单去找产品,并通过扫码枪,对产品上的二维码一个一个的进行扫描。无纸化的问题咱们先不去谈,通过视频对物体识别、条码识别、二维码识别这些都已经是很成熟的技术了,可不可以在这个场景中应用一下呢?
试想一下好处会有哪些,首先是存储数据量的减少,摄像头只会将物体识别关键帧的数据进行存储,数据存储量可以获得上千倍的减少,同时精准度会获得极大提升,不会在出现上面模棱两可的情况。如果在这里再进行一下无纸化改进,并与摄像识别数据进行同步,就更可以在发现缺少物品后,直接在显示屏上进行提示,从而有效减少出现错误的几率。这才应该是数字化边缘计算的正确打开方式。
然而,即便是一个企业级数字化解决方案积累经验非常丰富的大厂,为什么还没有看到相应的解决方案呢?很有可能是算力的限制,让小小的摄像头无法实现这些识别功能。如何才能用算力让边缘真正数字化?为此,恩智浦推出了下一代的面向边缘计算的全新产品——MCX产品系列。
在6月15日的媒体沟通会上,恩智浦大中华区工业与物联网市场高级总监金宇杰,恩智浦边缘处理事业部系统工程高级总监王朋朋向我们隆重介绍下一代的面向边缘计算的全新产品——MCX产品系列。
MCX通过一系列的开发,将恩智浦在以往发展中所积累的各种核心技术组合在一起,充分利用原先的平台开发环境融进新的技术,形成了全新的MCX产品系列。该产品系列可以提供更丰富的选择,也为开发人员提供更好的用户体验。
MCX产品组合的四大系列在设计中专注于易用性,可简化迁移的过程,并可根据需要进行设计的扩展或精简,同时通过使用统一的软件工具来尽可能减少开发成本。该产品组合基于高性能Arm Cortex-M内核,并集成了丰富的外设,以实现设计灵活性。MCX微控制器产品集成高达4 MB的片上闪存、低功耗缓存和高级内存管理控制器,另外还提供高达1MB的片上SRAM,可进一步提高边缘应用的实时性能。
下面是MCX产品组合推出的四大系列产品:
MCX N系列(高性能系列),该系列工作运行频率为150到250MHz,恩智浦在该系列中融入了更多的外设,也首次将NPU和DSP这两个元素放到了MCU中,满足边缘计算产品对智能的运算、通过机器对未来有预见性的要求。此外,也嵌入了恩智浦特有的安全系统——EdgeLock®。
MCX A系列(基准系列),是基础入门款MCU系列产品,工作频率在48至96MHz之间,内置定时器、低引脚数、单引脚电源,相对来说非常简单,并且恩智浦针对成本受限应用进行了优化。
MCX W系列(无线连接系列),W系列的工作频率在32到150MHz之间。在这个系列中集成低功耗的蓝牙无线模块,并高度集成部分外围器件,使得关联的整个BOM减少、整体板集成度降低。
MCX L系列(超低功耗系列),工作频率在50到100MHz之间,力求超低的动态功耗和非常低的泄漏功耗。该系列针对具有低功耗要求的应用做了优化,并且集成了原来LPC低功耗技术。
MCX产品系列的所有开发都受MCUXpresso支持,MCUXpresso是恩智浦免费提供给开发者的工具,会沿用原来的系列继续做无缝连接以支持新的产品系列,给开发者更好的体验。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。