通常,从展会回家的飞机上我不会写博客。我不是定时更新(博客)的积极分子,而 且我腿疼,不愿意在倾斜的座椅上用笔记本。不过,在这次从VMworld结束后返家的途中,我一直盯着前面的椅背,琢磨一个有点儿不得劲儿的发现:在展会 上的很多谈话中,我只发现有一个团队真正落地使用NSX了,而其他的则是购买后束之高阁。这一点让管理员觉得讨厌异常。
突然发现找不到NSX的用例
这暴露了我的真实想法:除非管理员说已投入生产了,否则我并不相信。话是很容易说的,但是支持起业务来并不是那么简单的事儿。展会的第一天,一位客户问我 关于之前在文章中写到的数据中心NSX的使用案例。他说,“我知道你是SDN粉,不过NSX最典型的使用案例是什么呢?”如果是之前我可以本能地说个不 休,不过在脑海中我回顾了一下“爬-走-跑”工程最佳实践的第一步,随后滤过了大部分根本算不上大规模的项目,我突然发现我竟无言以对,我不禁也 问,“VMware NSX的网络使用案例是什么?”
当然,在做出那个非正式的民意调查前,我一直是VMware的超级粉丝。我是最早Workstation和ESX的采用者,没有vCenter的话我根本 无法工作。我管理着Hyper-V、Citrix、CoreOS和云,同时我也乐于使用VMware的技术。我也深深地喜欢以可编程的方式管理所有事务。 不过NSX似乎有些停滞不前了,特别是在中型企业中,希望一些反馈能够帮助其改进。
关于没有NSX用例的“抱怨榜单”
展会上没有提及任何NSX用例,而如下给出了关于此管理员最常见的抱怨:
“它很难部署,甚至在实验室环境中也是。”这 是管理员最为常见的抱怨。一位专家、一本技能书,我试着让其在我们的实验室中运转起来,但好像没什么用。对于一个虚拟化产品,这有着太多的硬件和电缆。确 实,它运行起来的时候是很容易管理的,不过思科的1000V也能做到。没有快速配置流程和支持指南,很多的管理员偏离了其原有的概念及功效,仅仅因为他们 没有那么多时间。
“我的老板对它感兴趣,因而我产生了怀疑。”管理员并不喜欢推销给他们的产品,而是会亲自去挑选。当vSwitch监控器和NetFlow停止出口时,我们不再一位追求新潮,而是寻求更为值得信赖的产品。
“它比思科/瞻博等厂家的产品更贵。”每个CPU上千美元,或者每年每个VM几百美元,用上NSX你的预算会无限拉长。
“管理上的风险没保障。”作为管理员,过去十年中我们已经在几个盒子上集中管理了很多服务。能节省成本的管理固然很好,但我们也会越来越担心架构所带来的系统故障。将原有核心数据中心的基础设施全都替换掉不是那么好操作的。
“我还有更重要的事情要做。”换 句话说,IT专业人士在其身上并未看到足够投入的价值。对很多工程师来说,物理硬件已经有了,而且是更新的设施,高性能ASIC工作的也很好,没有替换掉 的理由。当然这和VMware在宣传力度方面不足也有关。其实好处还是巨大的,比如说,分布式防火墙,对东西流量作用巨大。
解决问题尚需时日,然而竞争不断
当然,还有一些宏观的挑战冲击着NSX的用例,比如说对SDN的偏见、没有像思科ACI团队那么多的开发人员以及鹊起的开源软件的应用,不过这些并非 VMware不能解决的事情。拥有着庞大的资源,VMware可以提高在培育用户和宣传力度方面的投入,此外,重新定价也没什么大不了的。
这就是说,需要先让用户了解到VMware虚拟化平台能带来的实际益处。
VMware尚有时间来培育用户,让管理员了解到vCenter给网络管理带来的好处,不过可用的时间并不多,要知道市场变幻莫测,而竞争从未间断过。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。