618作者入手了一个某大厂的监控摄像头,产品没什么问题,一如既往的结实可靠,但是发货的时候,却少了一张TF卡。当然,这也不是什么大的事情,找客服问一下,漏发了补寄一张也就行了。可是下面这一幕却引发了我的深度思考。
从这个视频可以看出这个企业确实很负责任,每个产品的包装环节都有着视频记录。虽然我把眼睛瞪瞎也没看出TF卡到底给我放在了哪里。但我已经不再想去追究这个事情,而是在想着如果是利用边缘计算技术,是不是可以将这个事情做的更好?
首先是数据问题,从视频画面的清晰度上来看,摄像头的分辨率至少应该在720P以上,而720P分辨率的摄像头每天产生的数据量,根据作者以前的测算,即便是经过数据优化和压缩也会在10个GB左右。每个摄像头,每天积累下的数据量不可谓不大,而且为了查找有可能出现的问题,例如帮作者找那个偷失的TF卡,虽然最终还是没找到,但我决定还是佛系一点,就这么过去了。由此可以看出,这样的数据即便应用效果不高,也不能随便删除。但这就会对企业的存储系统造成很大负担。
其次,从监控能力上看,这样的监控是不是可以简化工作流程、及时发现并纠正问题。在视频里作者还注意到一个细节,员工在备货的时候,还是需要通过纸质发货单去找产品,并通过扫码枪,对产品上的二维码一个一个的进行扫描。无纸化的问题咱们先不去谈,通过视频对物体识别、条码识别、二维码识别这些都已经是很成熟的技术了,可不可以在这个场景中应用一下呢?
试想一下好处会有哪些,首先是存储数据量的减少,摄像头只会将物体识别关键帧的数据进行存储,数据存储量可以获得上千倍的减少,同时精准度会获得极大提升,不会在出现上面模棱两可的情况。如果在这里再进行一下无纸化改进,并与摄像识别数据进行同步,就更可以在发现缺少物品后,直接在显示屏上进行提示,从而有效减少出现错误的几率。这才应该是数字化边缘计算的正确打开方式。
然而,即便是一个企业级数字化解决方案积累经验非常丰富的大厂,为什么还没有看到相应的解决方案呢?很有可能是算力的限制,让小小的摄像头无法实现这些识别功能。如何才能用算力让边缘真正数字化?为此,恩智浦推出了下一代的面向边缘计算的全新产品——MCX产品系列。
在6月15日的媒体沟通会上,恩智浦大中华区工业与物联网市场高级总监金宇杰,恩智浦边缘处理事业部系统工程高级总监王朋朋向我们隆重介绍下一代的面向边缘计算的全新产品——MCX产品系列。
MCX通过一系列的开发,将恩智浦在以往发展中所积累的各种核心技术组合在一起,充分利用原先的平台开发环境融进新的技术,形成了全新的MCX产品系列。该产品系列可以提供更丰富的选择,也为开发人员提供更好的用户体验。
MCX产品组合的四大系列在设计中专注于易用性,可简化迁移的过程,并可根据需要进行设计的扩展或精简,同时通过使用统一的软件工具来尽可能减少开发成本。该产品组合基于高性能Arm Cortex-M内核,并集成了丰富的外设,以实现设计灵活性。MCX微控制器产品集成高达4 MB的片上闪存、低功耗缓存和高级内存管理控制器,另外还提供高达1MB的片上SRAM,可进一步提高边缘应用的实时性能。
下面是MCX产品组合推出的四大系列产品:
MCX N系列(高性能系列),该系列工作运行频率为150到250MHz,恩智浦在该系列中融入了更多的外设,也首次将NPU和DSP这两个元素放到了MCU中,满足边缘计算产品对智能的运算、通过机器对未来有预见性的要求。此外,也嵌入了恩智浦特有的安全系统——EdgeLock®。
MCX A系列(基准系列),是基础入门款MCU系列产品,工作频率在48至96MHz之间,内置定时器、低引脚数、单引脚电源,相对来说非常简单,并且恩智浦针对成本受限应用进行了优化。
MCX W系列(无线连接系列),W系列的工作频率在32到150MHz之间。在这个系列中集成低功耗的蓝牙无线模块,并高度集成部分外围器件,使得关联的整个BOM减少、整体板集成度降低。
MCX L系列(超低功耗系列),工作频率在50到100MHz之间,力求超低的动态功耗和非常低的泄漏功耗。该系列针对具有低功耗要求的应用做了优化,并且集成了原来LPC低功耗技术。
MCX产品系列的所有开发都受MCUXpresso支持,MCUXpresso是恩智浦免费提供给开发者的工具,会沿用原来的系列继续做无缝连接以支持新的产品系列,给开发者更好的体验。
好文章,需要你的鼓励
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试中得分51.3%,比GPT高出17%以上。模型可根据任务难度调整处理时间,简单请求处理速度显著提升。目前已在ChatGPT付费计划中提供。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。