“网络工程师已死,开发者万岁。”尽管这个改变了网络工程师资格的概念颇受追捧,特别是随着SDN的不断演进更为如此,然而从本质上来讲这是片面的,这太极端了。
事情的真相是,好的网络工程师一直是开发人员,每次投身命令行界面时都在写“代码”。
自从数据互联时代的到来,那些建立链接以及连接系统的角色不断发生变化。为了完成任务,他们可能得像计算机科学家或工程师那样去写代码。随着时间的推移,他们成了设计、配置并维护系统到系统、网络到网络连接的专家。只有在过去15到20年这样,网络工程师有独立的工作职能,并影响了几乎所有的其他IT学科。
协议栈的演进反映了工程师的技能
让我们重温一下协议栈这样稀松平常的东西。早年,绝大多数系统需要通过专业的手段进行连接,特定媒介如Local Talk、Token Ring、ProNet以及Ethernet。首先是系统间的通讯大楼协议。为了让系统置于这些网络中,必须要写通信网络堆栈,以支持特定的需求。
大体上,那些堆栈由熟悉网络的工程师来编写,基于现有的文档以及从开发者社区或特定厂商那里获取的帮助。
这样一来,网络工程师的角色既由计算机技术人员转向软件开发人员。确实,现代网络工程专业,乃至网络工程师资格是不断发展的,它也必须如此。
然而网络工程师资格的改进却常为业内所忽视。
需要更多证明吗?考虑下上面的例子,再想想网络工程师的职能与开发者关系有多密切:
· 配置路由器需要专业语言和命令结构。理解协议意味着要熟悉每个标准、层次结构和核心能力,就像掌握编程语言那样。
· 理解不同的网络平台有不同的用途,就像不同的编程技术和工具有不同的核心作用,例如嵌入式、解释型以及编译型。
显然是不同的。从VLAN改变获取即时反馈和路由指标调整与构建模块化应用程序并不相同。然而,编写脚本改变MAC地址格式与通过大型企业网络加VLAN标签或重置广域网点对点编号又并无多大区别。这都需要时间、相关知识来完成任务。
只有在现代,计算机工程和编程才分裂开来。此外,这是由行业造成的现象,为了划分员工职能,以及由厂商围绕“语法敏感”资格建立起的生态系统。
那么,网络工程师已死,开发者万岁?
如这样的逻辑,所有的系统管理员都应该为操作系统开发人员让路,就像无人驾驶汽车会取代汽车修理工一样。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。