南开大学(Nankai University,NKU),简称“南开”,肇始于1904年,正式成立于1919年,是由严修、张伯苓秉承教育救国理念创办的综合性大学。
近年来,南开大学一直在强化校园信息化支撑服务能力,建设有南开特色的智慧校园,以信息化推进行政管理和教学科研改革,支持学生在线学习、师生在线互动、机关在线服务,支撑“一校三区”协同发展。同时希望通过整合南开大学教学信息化基础设施,构建一套基于“一校三区”多中心的云数据中心平台,提供资源共享的学习环境,建设各类学术资源库和研究协作平台,为南开大学在教育信息化领域走向世界一流打下坚实基础。
为了提高数据中心资源使用效率,降低人员对数据中心的管理成本,改善用户体验,提升数据中心的IT服务能力,南开大学希望建设一个校级云服务管理平台,一方面用于实现对学校数据中心各类软硬件资源的统一管理;另一方面,面向学校各二级部门用户,实现用户对数据中心资源的自助申请,弹性资源调配等功能。具体来说,南开大学对云服务管理平台的要求如下:
要求平台可提供涵盖对计算、存储、网络、安全以及融合设施的管理功能,提供计量计费等运营功能,并具有完善、可靠的监控、分析、预警、告警等运维功能;
要求平台架构合理,具有良好的扩展能力,部署灵活,并且开放平台接口,支持第三方系统接入;
为了帮助南开大学实现其管理要求,华为通过认真分析,为其提供了华为FusionCloud云服务管理平台解决方案。
南开大学校级云服务管理总体架构图
该解决方案的总体架构主要由基础设施层、资源池层、云服务层和管理层组成:
基础设施层:服务器、存储、网络等物理基础设施,构成融合资源池的基础架构。
资源池层:虚拟化层提供基础的计算、存储和网络虚拟化的能力。在FusionSphere OpenStack的管理下,通过虚拟化软件,如华为FusionSphere等,对计算、存储、网络等物理资源进行虚拟化,提供统一的计算、存储、网络资源池。
管理层:统一管理多个数据中心云资源层提供的资源池,提供统一运营和运维管理,构建统一的融合资源池,实现资源共享。
云服务层:基于管理层提供的运营和运维能力,匹配业务场景,通过服务目录实现资源的二级运营服务。华为FusionCloud云服务管理平台解决方案为南开大学校提供统一的数据中心管理平台,同时平台提出“敏捷运营,精简运维”的理念,针对分布云数据中心的服务保障和服务编排提供先进管理方案。
南开大学校级云服务平台解决方案示意图
该解决方案的整体优势:
分布式云数据中心以融合架构(计算、存储、网络融合)作为资源池的基础单元,通过自动化管理和虚拟化平台来支撑IT服务精细化运营。分布式云数据中心的核心理念在于:物理分布、逻辑统一。它可以将南开大学多个数据中心整合起来,使其像一个统一的数据中心一样提供服务,并通过多数据中心融合来提升企业IT效率。
此外,分布式云数据中心还将为南开大学带来前所未有的价值和全新的使用体验,其价值包括:
降低TCO,提高ROI:分布式云数据中心采用虚拟化技术,消除了软件对运行软件的硬件的依赖性,使南开大学的IT主管可以将利用率不足的基础结构转变成富有弹性、自动化和安全的计算资源池,供应程序按需使用;
提高业务敏捷性,加快上线速度,提高用户的满意度:分布式云数据中心在虚拟化技术之上,提供了资源的按需服务能力,分布式云数据中心提供全方位的管理、业务自动化的能力;
减少IT管理和维护资源,提高IT治理能力:分布式云数据中心提供自助的服务能力,而南开大学各二级部门用户可以根据需要自己申请业务,降低对IT运营部门的依赖,让IT的管理更加有效;
统一灵活的云数据中心管理能力:分布式云数据中心的资源来自于多个物理数据中心,资源类型多样,管理需求复杂,针对这种情况,华为分布式云数据中心提出了统一管理,在同一个管理界面上管理各个数据中心;
创新服务模式:基于南开大学各部门或业务单元对资源使用进行计量、统计,为学校教育部门或业务单元分担资源成本提供依据。
综上所述,南开大学通过部署该云服务管理平台,将分散在各个业务系统上的数据资源通过统一的数据标准进行整合、集中管理,提供对外的查询服务和共享。同时,通过华为ManageOne统一管理平台实现资源分配动态化、降低运维管理成本、快速部署快速获得,和高可靠高可用等功能。
“南开大学相关负责人表示,基于华为FusionCloud解决方案,南开大学可以为学校各级部门及学院提供丰富的云服务,这实际业务的提升作用显著,有力地推动了推动信息技术与教育教学深度融合,为南开大学实现智慧校园奠定了良好的基础。”
好文章,需要你的鼓励
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
微软正式确认配置管理器将转为年度发布模式,并将Intune作为主要创新重点。该变化将于2026年秋季生效,在此之前还有几个版本发布。微软表示此举是为了与Windows客户端安全和稳定性节奏保持一致,优先确保安全可靠的用户体验。配置管理器将专注于安全性、稳定性和长期支持,而所有新功能创新都将在云端的Intune中进行。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。