企业工作负载越来越多地迁移到云中,IT人员是时候使用下一代网络所需要的云监控工具了。
几乎所有企业现在都使用某种形式的云服务。其中,有超过97%的企业在使用软件即服务(SaaS);有超过42%的企业在使用平台即服务(PaaS);最后有超过53%的企业在使用基础架构即服务(IaaS)。
但是,这些应用的宽度与深度并不匹配。通常情况下,只有不到四分之一的企业应用程序通过SaaS交付。在使用IaaS和PaaS的企业中,半数企业都只是将不到3%的工作负载部署到云中。
但是,部署场景处于变革前沿。随着满意度的不断增加,加上集成与安全技术的不断成熟,运行在云中的工作比例在快速攀升。到2020年,我们预计有50%的企业工作负载运行在外部云。
引起这种变化的动因是DevOps技术和文化在越来越多的组织中传播,以及真正的私有云出现。这种技术都非常依赖于资源的自动化和编制:工作负载在各个位置上不断地扩大、缩小和来回移动。所有这些都在编制工具的命令行中自动完成,它们可以从一个应用程序容器上分配任何东西,小到一个微服务,大到一个复杂应用架构(包括容器、虚拟机)、服务器(外加存储、网络和安全)都可以。
相关技术搭配
在这个转变过程之中,IT必须保证要搭配相应的应用程序网络管理工具。
这意味着在整个过程中IT都必须有能力去监控可用性和性能,包括内部应用程序的开始开发阶段到各种服务产品的整个进化过程。成功意味着要能够全面监控服务组件及其底层平台元素,以及从服务器到用户设备的端到端监控。
用户不会关注于中间层的所有元素,但是IT需要尽可能多地理解这些服务是如何交付给用户使用的,因为它们需要知道各个组成部分中可能出现的问题。
必备监控目标清单
总体上,IT需要监控下面的层次:
• 资源层,包括:
计算主机,包括虚拟机(VM)、容器和工作负载直接使用的资源;
存储,包括块、文件或对象;
网络,包括物理和虚拟网络。
• 虚拟机层
• 容器层
• 应用/微服务层
• 用户可见的服务层
而且,IT必须同时跟踪外部和内部托管的工作负载。
在这个方面,如果网络管理工具目前基于网络设备,那么IT需要像在内部环境的一样在外部云环境部署这些工具的虚拟版本。由于管理基于运行在宿主、应用服务器或容器上的代理端,所以IT需要为准备监控的特定组件分配或配置一个代理端——在同一个自动化工作流、声明式定义或黄金镜像中。
类似地,IT只需要通过单独一个玻璃窗就能够查看到构成混合基础架构的所有层次和资源池的服务视图。理想情况下,这个仪表板会嵌入到云管理平台中,IT可以用它快速响应事件。单独一个工具和一个技术是无法解决所有问题的。云管理器是将现代分布式计算环境所需要的所有管理和监控工具聚集在一起的逻辑位置。
好文章,需要你的鼓励
随着AI策略成熟,CIO开始重新考虑对公有云的依赖,私有云和本地环境重新受到关注。调查显示,67%的企业领导计划在未来12个月内将部分AI数据迁移至非云环境。主要原因包括成本可预测性、数据隐私保护、安全问题和云集成挑战。对于持续的AI工作负载,购买自有GPU比租用公有云更经济。私有云支出增长更快,预计2025年将有54%的组织在私有云上投入超过1000万美元。
沙特TachyHealth团队开发的32亿参数医疗AI模型Gazal-R1,通过创新的双阶段训练方法在医疗推理任务上超越了12倍大的模型,在MedQA等测试中取得87.1%的优异成绩,展现了精巧训练策略胜过规模扩张的重要启示,为资源有限的医疗AI研究提供了新路径。
本文深入分析了从传统AI发展到AGI过程中可能出现的智能爆发现象。基于AI专家共识的2040年AGI实现预期,文章探讨了七种主要发展路径,重点关注突破性的"登月路径"。智能爆发理论认为,智能可以像原子链式反应一样相互促进,快速产生大量新智能。文章预测2038-2039年可能发生智能爆发,随后在2040年实现AGI,但也指出了关于智能爆发的启动、控制和潜在风险等争议问题。
奥地利维也纳医科大学研究团队开发了RetFiner技术,通过让眼科AI模型同时学习OCT图像和医疗文字描述,显著提升了诊断准确率。该方法采用四种训练任务让AI模型建立图像与文字的深层联系,在三个主流眼科AI模型上实现了2-6个百分点的性能提升,为医学AI发展开辟了新方向。