在我的印象中,HPC(High performance computing,高性能计算)是一个追求卓越性能的独特计算环境,想想它的应用场景,是帮助科学家和工程师们利用其超高计算能力解决复杂的科学、工程等难题,注定了是“阳春白雪”而非“下里巴人”。
所以,也没认为HPC能和云计算走在一起。一是因为云计算采用的关键技术是虚拟化,这样会导致牺牲一部分性能,而高性能计算则追求“高速”,两者看似相左。二是因为传统的HPC基础架构的利用率已经非常高了,云的动机也就大打折扣。
不过,当看到亚马逊AWS、微软的Azure陆续推出HPC集群服务后,并且国内阿里云也于近日宣布其基于公共云平台的HPC正式对外商用。我才知道,原来是我落伍了!
以云计算灵活的弹性应用模式来解决公共高性能计算平台的系统管理问题是HPC与云走在一起的巨大推动力,并且云计算的发展也渐渐提升了对HPC高性能计算的基础环境支撑能力。
尤其对于高校而言,研究门类众多,物理、化学、电子、生命科学等众多学科发展高度依赖于高性能计算。不过,对于学校的科研资源获取和管理来说面临众多困难,例如,统筹难,以团队/项目为单位的控制方式,资源分散;投资大,资源相互之间无法共享,不断投资扩容,消耗资金;维护难度大,网络配置、操作系统安装、HPC软件部署都不是一件容易事。
品高云教育行业经理吴一冰这样来形容HPC在高效的应用和管理难题,“物理学院的老师搭好HPC环境之后,即便不用,借给材料学院的老师,也没法直接用,要做很大的改动,材料院的老师用完也没法恢复成物理院需要的HPC环境。简单说,构建难度大、复杂度高,归根结底就是交付效率比较低。”
所以,看到这里,你或许已经知道HPC科研云落地在高校是多么有必要了。
HPC牵手云 重管理舍性能?
HPC以云的方式落地带来的性能损耗与其带来的收益相比已经不重要了,况且,这个损耗真的还那么大吗?
在品高云眼里,这个答案是否定的。“为了提供更强大的计算性能,品高云HPC in Cloud告别虚拟机,改用LXC容器技术来提供计算单元,基本上可以实现物理服务器99%的性能。” 吴一冰在接受ZD至顶网采访时表示。
“用容器代替虚拟机实现全新的计算单元,已经接近物理机的性能。并且,它还可以挂载很多高性能计算所需要的底层特殊硬件,比如GPU。”
所以,有了技术突破,HPC in Cloud已然开启!
用云搭建HPC 充分释放云计算潜力
在海南大学,已经成功构建教务云支撑业务应用与高性能计算。基于品高云搭建的教务云,海大业务系统与高性能计算共享同一IT基础设施平台,因此在业务系统夜晚访问压力较小的时候,可以尽量运行高性能计算任务。对于白天已经开始运行的计算任务,品高云并行计算可以支持热添加计算节点,将白天运行业务系统的资源创建新的计算节点添加进已有的计算任务中,从而实现业务应用与高性能计算在业务闲/忙时的“切换”,提高海大高性能计算服务能力。
并且,品高云内置Matlab、Hadoop等多种高性能计算应用部署方案,海大老师通过界面点击即可在几分钟内顺利获得可直接使用的HPC环境,大大降低了科研人员使用HPC的技术门槛。
用云来搭建HPC,充分利用了云计算的优势。
品高云HPC in Cloud架构
利用云平台建立校级云资源服务平台,并统一对教务和科研需求提供资源,海大老师可以按需申请HPC资源。通过应用自动化部署服务将常见HPC软件打包成模板,各学科老师按需申请资源。利用闲时可以将教务系统部分资源,停机保号(关机但数据保留),将资源提供出来跑HPC业务。利用弹性服务功能,当应用负载增加时自动创建资源应对,降低业务宕机风险。利用SAN做高性能计算,用普通PC组成分布式存储,存放结果数据,降低成本。
吴一冰指出,“用户就可以自助的去使用平台来创建HPC集群,只需要选择他需要的HPC软件应用、选择节点配置、指定节点规模。剩下的所有事情,都交给云,云会自动创建资源、自动安装软件、自动配置成集群,用户可以直接使用。”
融合式教育云是高校IT发展前进路
细心的人或许已经发现,在海大的案例中,它不是单纯的构建的HPC的云,而是融合了学校各信息系统的整体教务云,包括学工系统、人事系统、教学管理系统等,在这之上向海大的老师提供高性能计算的资源。
高性能计算中心作为一个公共的服务平台,已经融入到学校的整体信息化结构中,而不是独立成篇。这正是品高云推出的融合式教育云的理念,集支撑教务应用、科研HPC、教学实训、大数据处理、移动信息化、校内云存储于一体的云平台。
如同品高副总经理周静所强调的,“让高校的传统网络中心完成向服务中心的转变,不再是把所有工作聚焦在硬件、软件的安装上,而是由云自动化的交付一切,包括高性能计算。”
好文章,需要你的鼓励
Blackwell GPU的生产制造工作量达到Hopper GPU的两倍有余,但带来的收入仅增加至约1.7倍。
由AMD驱动的El Capitan超级计算机(现位于美国劳伦斯利弗莫尔国家实验室(LLNL))成为世界上速度最快的超级计算机。