在本期专家面对面中,我们采访到Infopulse公司的资深网络IT工程师Yaroslav Glushko。Infopulse公司的内部网络要覆盖4个办事处,支持1200个用户。Glushko表示,老旧建筑影响网络信号,新的移动设备的接 入也常常导致网络崩溃,为了解决这些问题,他们正在重新设计无线网络。
目前在忙些什么?
Yaroslav Glushko:我们现在手里有好几个项目。最重要的就是重新设计无线网络。用户数量不断增多,移动设备数量也随之激增,而我们的办公室并不是采用最新的 建筑标准建造的,所以我们要做的就是尽量让用户获得最好的网络体验。而现有的网络已经过时了,不能很好的满足无线网络通信。目前办公室有几个无线信号传播 问题,所以我们要改进现有的无线网络覆盖环境,尽可能让用户体验更好。当然,我们已经开始使用802.11ac这种新的无线标准来改善网络了。
所以现在面临的问题是建筑材料?
Glushko:对,而且有趣的是,墙壁要比地板厚,所以在楼层之间会有信号重叠和干扰问题。这会扰乱无线通信。
那么要解决这个问题,该如何修改现有的无线网络设计?
Glushko:我们是通过安装更多的无线接入点,以降低每个接入点的发射频率。我们调整算法来控制这些设置,这样所有接入点都可以看到对方,并尽量减少对彼此的影响。
另外,我们更多的是在5 GHz无线频段通信的。5 GHz无线频段应用更广泛,它能使用更多的无线频道,且不会重叠。对于11bg端点,我们使用2.4 GHz无线带宽,同时,对于11ac端点使用5 GHz的。
周边也有企业使用2.4 GHz频段的,所以我们还要尽量降低那些通信对我们的网络的影响。我们的大多数用户现在都连接到5 GHz频段上,我们也在尽一切可能把所有用户都升级到这个频段上,因为这个频段更稳定,而且噪音也小。
除了重新设计无线网络,这些天您工作面临的最大挑战是什么?
Glushko:我们正在为统一网络访问架构制定相应的解决方案。它可以把所有有线、无线和远程VPN网络访问集中到一个独立灵活的解决方案中进行 统一管理。它的目的是让用户基于他们的网络连接、位置、时间、日期、设备类型和设备现有状态,应用于合适的访问级别,除了传统的用户访问权限。此外,它应 该增加网络访问管理过程的粒度和鲁棒性,通过提供最少的必要的网络访问来提高安全性,允许用户在任何时间、地点以及任意设备上办公,增强终端用户的体验和 工作效率。
比如,如果用户在家里使用个人设备通过VPN远程联网,可能在访问某些重要信息时会访问受限。但是如果使用公司的设备连接企业的有线或无线网络,也就是该用户是通过最安全的接入方式访问的,所那么他应该可以访问所有资源。
在做决策时还有很多其它条件,当然也有很多操作可以应用到用户连接上。所有这些功能可以使我们在不同用例中实现定制的访问策略。
造成这种情况的原因是什么?
Glushko:主要的问题是,用户希望在任何地点使用任意设备工作,不仅仅是最安全的那个。而我们的安全专家们也有他们的要求,限制一些恶意访问,所以我们需要找到一个能同时满足两者的解决方案。
您是怎么进入IT网络行业的?
Glushko: 我大学选的是信息与科学技术学院。在那里学习了近6年。大学期间,我进入了思科网络技术学院,那也是我第一次接触网络方面的经验,后来就专注于网络了。那 时我就开始关注IT市场,并开始找相关工作。很幸运,朋友和老师为我指出了正确的方向,大学最后一年,我就成功得到一家IT公司的工作。
网络对您有什么吸引力?
Glushko:网络作为一个有机体,跨越并连接所有IT系统。当你连接到互联网时,你看到的是你的浏览器的主页,但是你可能不知道当你点击网页时到底发生了什么,也不知道数据包是如何通过这些连接和设备传递的。它怎样工作以及如何连接对我来说都很有意思。
一个额外的问题:如何我给你一把时光机的钥匙,你想去过去的哪个时间点?为什么?
Glushko:如果可以,我想去很多时间点,如果非要选择其中一个,那我很想见见爱因斯坦,而且我对自然科学、天文学、物理学、化学以及其它学科等也很感兴趣,所以我想回到1905年或者他研究他的相对论的某一年,和他探讨一下这些问题。
您的回答很有智慧。要是我来回答,我可能会说我想看看恐龙。
Glushko: 我只想到了人。当然,我也想去看看有恐龙的远古时代,甚至更早的时候。
想看宇宙诞生吗?不过我不知道时光机能不能回到那么遥远的时期啊。
Glushko: 我认为可以,因为我们现在已经可以观察到从宇宙早些时候传播的光了。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。