中国的物联网市场究竟有多大?仅就市场规模而言,在2012年,我国的物联网市场规模就已达3650亿元,而据多家第三方机构预测,2015年我国 物联网市场规模将突破7500亿元,未来5年内,市场规模更是有望突破万亿元大关,未来物联网产业的年复合增长率超过30%,物联网前景可谓无可限量!
何为物联网?物联网是指通过射频识别、红外感应器、全球定位系统、激光扫描器等信息传感设备,按约定的协议,把任何物品与互联网相连接,进行信息交 换和通信,以实现智能化识别、定位、跟踪、监控和管理的一种网络概念,在此,我们可以将其简单的理解为通过物与物的联接来实现各种不同功能的应用。
那么物与物之间是通过哪些方式来进行联接的呢?两种方式,其一是有线联接方式,比如通过网线将你的电脑接入互联网或者通过同轴电缆将摄像机接入监控平台等;其二是无线联接方式,比如你的手机可通过无线WIFI实现上网等。
有线联接的优势主要体现在稳定性、可靠性与传输速度上,但由于其采用了实体的联接方式,便利性与实用性是其致命伤。随着无线技术在稳定性、可靠性与 速度上的进化,在未来的物联网应用中,应该说留给有线联接方式的发展空间已不大(当然也不会消失)。而在当下的物联网应用中,无线传输技术可谓众多,但细 数下来,笔者以为应用范围最广且最具潜力的无非是蓝牙、Wifi与ZigBee三种,这三种无线传输技术在物联网应用中上演着三国杀的大戏,那么究竟谁将 一统物“联”天下?
三国杀之曹魏:WIFI
WIFI无线技术在当下的应用可谓极其广泛,其可将个人电脑、路由器、手持设备等终端以无线方式进行互相连接,WIFI是一种高频无线电信号,它拥有最为广泛的用户与群众基础,就像三国时代的曹魏,人多势众,实力雄厚,来势汹汹。
在技术上,WIFI的主要优势体现在传输速度与传输距离上,其最大传输距离可达300m,最大传输速度可达300Mbps,弱点则体现在功耗上,其最大功耗为50mA。
三国杀之蜀汉:蓝牙
尽管在手机及电脑领域中,蓝牙的应用并不普遍,几乎都快被人遗忘,但就像三国时代的蜀汉一样,蓝牙的血统高贵,默默无闻却从不放弃,不断地开疆拓 土,如今可谓有所成,由1.0版本发展到当下最新的4.2版本,功能也越来越强大,其中4.2版本中,蓝牙大大加强了物联网应用特性,可实现IP联接及网 关设置等诸多新特性。
跟WIFI相比,蓝牙的优势主要体现在功耗及安全性上,相对WIFI最大50mA的功耗,蓝牙最大20mA的功耗要小得多,但在传输速度与距离上的劣势也较明显,其最大传输速度与最远传输距离分别为1Mbps及100m。
三国杀之东吴:ZigBee
相对WIFI与蓝牙而言,ZigBee可算新贵了,这个新贵风度翩翩,前途无量,就像三国杀中的东吴一般年轻有为、野心勃勃!ZigBee作为一种无线通讯技术,目前其主要应用在智能家居领域,与众多的智能家居设备商有着良好的合作关系。
作为一种短距离的无线通讯技术,ZigBee的优势体现在低复杂度、自组织、高安全性、低功耗上,此外ZigBee还具备组网和路由特性,可以方便地嵌入到各种设备中,在功耗表现上,ZigBee在三者中表现最好,安全性则在WIFI与蓝牙之间。
谁将一统物“联”天下?
由此可见,蓝牙、Wifi与ZigBee这三种无线传输技术依据各自在技术上的优势,从而在物联网的不同应用中发挥所长,但它们彼此之间的竞争关系 却是毋容置疑的,正所谓天下大势,分久必合!那么在蓝牙、Wifi与ZigBee中,哪种无线传输技术将一统物“联”天下?抑或是还会出现第四种无线技术 参与瓜分天下?国内物联网巨头们最近又有哪些新动向?
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。