AMD大逆袭?开源GPU编程架构加速超级计算机的算力提升

Chloe Ma

1

GPU,即图形处理器,又称显示核心、视觉处理器、显示芯片,是专门在移动设备上进行图像和图形相关运算工作的微处理器。2020年,GPU市场出现了巨大的供给缺口,这来自于加密货币挖掘和机器学习疯狂增长的需求。同时,科学研究领域也需要GPU加速器对新材料和生物分子进行数学建模。

来自HSE超级计算机原子建模和多尺度分析国际实验室、JIHT RAS和MIPT的研究人员比较了流行的分子建模程序在AMD和Nvidia生产的GPU加速器上的性能。在《国际高性能计算应用杂志》发表的一篇论文中,学者们首次在新的开源GPU技术AMD HIP上移植了LAMMPS。

学者们对三个分子建模程序:LAMMPS、Gromacs和OpenMM在峰值参数相当的Nvidia和AMD GPU加速器上的性能进行了彻底的分析。在测试中,他们使用了载脂蛋白A1(ApoA1)模型。他们发现,研究计算的性能不仅受到硬件参数的影响,而且还受到软件环境的影响。事实证明,在并行启动计算内核的复杂情况下,AMD驱动程序的无效性能会导致相当大的延迟。开源的解决方案仍然有其缺点。

这项研究首次将LAMMPS移植到新的开源GPU技术AMD HIP上。这项发展中的技术看起来很有前途,因为它有助于在Nvidia加速器和AMD的新GPU上有效使用一个代码。开发的LAMMPS修改版已作为开放源码发布,并在官方资源库中提供:来自世界各地的用户可以使用它来加速他们的计算。

“我们彻底分析和比较了Nvidia Volta和AMD Vega20架构的GPU加速器内存子系统。我发现了GPU内核并行启动逻辑的差异,并通过可视化的程序配置文件进行了证明。”HSE大学博士生和论文作者之一Vsevolod Nikolskiy说:“无论是内存带宽、不同级别的GPU内存层次结构的延迟,还是有效并行执行GPU内核,所有这些方面都对GPU程序的真实性能产生重大影响。”

论文作者认为,当代微电子巨头的技术竞赛,表明了一个明显的趋势,即GPU加速技术更加多样化。

“一方面,对消费者来说这是好事,因为它刺激了竞争,降低超级计算机成本的下降。另一方面,由于需要考虑几种不同类型的GPU架构和编程技术的可用性,开发有效的程序将变得更加困难,”HSE大学教授Vladimir Stegailov评论道,“不同GPU平台之间的程序移植是一个更复杂的问题。开源模式消除了许多障碍,对于大型复杂超级计算机软件的开发者来说是莫大的帮助。”

创建强大的超级计算机和开发快速有效的程序,是为解决最复杂的全球挑战准备的工具。今天,全世界都在使用分子建模的计算工具来寻找对抗病毒的方法。

当代两个微电子巨头Nvidia和AMD的竞争,促使了AMD ROCm的出现——一个新的用于GPU加速器编程的开源基础架构。这个平台的开源特性给了人们最大限度地将使用其开发的代码移植到各种类型的超级计算机的希望。

学术界对此给出了积极的回应:基于AMD GPU加速器的最大的新超级计算机的项目已经接近完成。芬兰的Lumi具有0.5 exaFLOPS的性能(这与150万台笔记本电脑的性能相似!)正在迅速建成。今年,预计美国将诞生一台更强大的超级计算机Frontier(1.5 exaFLOPS),而在2023年预计将有更强大的El Capitan(2 exaFLOPS)。

参考资料:

https://www.eurekalert.org/pub_releases/2021-04/nruh-ogt042921.php


告立足学术前沿,远瞻产业发展。更多数据请参考前瞻产业研究院《2021-2026全球及中国云计算芯片行业市场调研及投资前景分析报》,同时前瞻产业研究院提供产业大数据、产业规划、产业申报、产业园区规划、产业招商引资、IPO募投可研等解决方案。

可行性研究报告

广告、内容合作请点这里:寻求合作

咨询·服务

相关阅读

精彩推荐