数据中心迁移是项复杂工程,可能很难向为迁移活动拨款的企业高管解释清楚,需要了解并管理相关的业务运营风险。下面我们分析一下与管理数据中心有关的几个难题和风险。
服务可用性
数据中心的主要目的就是,托管运行为业务提供服务的应用程序。无论你何时考虑从一个数据中心迁移到另一个数据中心,必须首先考虑底层服务的可用性。这些服务包括:活动目录之类的基础设施应用程序和SAP之类的面向客户的应用程序。
当服务从一个数据中心转移到另一个数据中心时,你必须制定一项策略,特定的服务何时迁移和应用程序对彼此的依赖关系都必须考虑进来。确保服务可用性的一个常见做法就是,建立迁移组,然后把互相依赖的应用程序分到同一组。
至于支持大多数企业应用程序的服务,比如活动目录和DNS,一个常见做法就是,跨数据中心扩展这些核心服务。服务依然在两边的数据中心,直到迁移完成。
硬件迁移
迁移物理服务器通常有两种策略:一种名为“平移”(lift and shift),另一种名为数据复制。在平移策略中,硬件放到活动卡车上,然后安装到新的数据中心。系统在搬到新址之前已备份好,不过这个策略会带来一些风险。
最大的风险之一是物理服务器可能在搬运过程中遭到损坏;搬运过程中的损坏会导致备份毫无用处。另一个挑战就是两个数据中心相隔太远,因而这个方法不现实,无法保证服务在可以接受的时间段内可用。
第二种策略是通过一条租用线路来进行数据迁移。租用线路带来了两种sub-swing硬件方案。一种方案是执行物理机到物理机(P2P)迁移。P2P迁移需要购置同类硬件,以便原有数据中心的应用程序和硬件可以迁移过去,同时确保停机时间最短。
另一种硬件迁移方案是物理机到虚拟机(P2V)转换。P2V需要通过租用线路,将物理机转换成虚拟机。P2V旨在实现两个目标:第一个目标是,将工作负载从一个数据中心迁移到另一个数据中心,同时确保硬件成本最低。第二个目标是,通过转移到虚拟平台,实现数据中心转型。P2V迁移是大受欢迎的方案,因为许多工程师已经习惯于执行这种转换,这是之前数据中心项目的一部分。
数据迁移
将应用程序数据从一处迁移到另一处可能是数据中心迁移工程的最复杂的环节之一。一种简单的方案就是执行基于磁带或硬盘的备份,并执行恢复;不过,类似平移迁移,备份和恢复在及时恢复服务方面提供的能力很有限。另外,备份和恢复并不是最适合数据迁移的理想方法――它更适合数据恢复方案有限的灾难恢复这种场景。
为大多数数据迁移选择的主要方法是配置一条租用线路。如果两个数据中心之间有了一条专用连接,迁移团队就能充分利用基于硬件或软件的同步机制,执行数据迁移。除了能够迁移数据外,这个方法还可以用来执行P2P迁移、P2V迁移和虚拟机到虚拟机(V2V)迁移。
许多企业决定在两个数据中心之间拥有多条连接。连接至少需要两条线路:一路连接支持平常的最终用户和数据中心到数据中心的流量,以便支持活动目录等应用程序和应用程序到应用程序的流量;第二路、通常速度更快的连接用来执行数据同步。双路连接可以防止两种全然不同的流量干扰或影响对方。
好文章,需要你的鼓励
Anthropic发布了面向成本敏感用户的Claude Haiku 4.5大语言模型,定价为每百万输入令牌1美元,输出令牌5美元,比旗舰版Sonnet 4.5便宜三倍。该模型采用混合推理架构,可根据需求调整计算资源,支持多模态输入最多20万令牌。在八项基准测试中,性能仅比Sonnet 4.5低不到10%,但在编程和数学任务上超越了前代Sonnet 4。模型响应速度比Sonnet 4快两倍以上,适用于客服聊天机器人等低延迟应用场景。
中科院微电子研究所团队揭示深度学习中感知优化与质量评估存在意外不对称现象。研究发现评估性能优秀的模型在训练指导中效果有限,对抗性训练具主导作用,传统卷积网络在某些场景仍具优势。这项发现颠覆了"评估性能等同于优化能力"的传统认知,为AI图像处理技术改进提供新方向。
英国初创公司Nscale将为微软建设四个AI数据中心,总计部署约20万个GPU,合同价值高达240亿美元。首个数据中心将于明年在葡萄牙开建,配备1.26万个GPU。德州数据中心规模最大,将部署10.4万个GPU,容量从240兆瓦扩展至1.2吉瓦。所有设施将采用英伟达最新Blackwell Ultra显卡。
香港科技大学研究团队开发了MOSS-ChatV视频AI系统,通过创新的"过程推理奖励"机制解决了现有视频AI推理过程不一致的问题。该系统不仅能准确预测视频中的未来事件,还能提供清晰的推理解释。研究构建了MOSS-Video数据集,采用动态时间规整算法训练模型,在多个视频理解任务上取得显著性能提升,为视频AI的可解释性发展开辟了新方向。