什么是云原生超级计算机?


高性能计算 (HPC) 和基于计算机的智能已将超级计算机推向广泛的商业用途。它们已成为必不可少的处理信息引擎,以支持研究、逻辑发现和产品开发。

因此,超级计算机现在需要支持各种类型的众多用户以及广泛的软件。它们需要在提供强大的、多租户环境中的裸机性能的同时,动态地提供不间断的服务。

云原生超级计算将 HPC 的强大功能与强大的卸载和加速功能以及云计算服务的易用性相结合。它是一个用于按需 HPC 和基于计算机的智能服务的简单、安全的框架。

云原生超级计算机

云原生超级计算机系统旨在在多租户环境中提供最高性能、安全性以及管理。它将高性能计算的强大功能与云计算服务的易用性相结合。

云计算可以为科学和工程创造更多机会。例如,三星电子为无晶圆厂客户(设计和销售硬件但不生产硬件的客户)创建了一个基于云的平台,以便他们可以按需使用不同的电子设计。他们还可以在制造前与三星合作。

这种新方法将持续集成引入到工程产品中。在云中使用超级计算正在逐渐成为全球许多行业创新的基础。

如今,云计算中的超级计算正在实现昨天看起来像是科幻小说的一切。当然,某些行业仅仅因为这种计算奇迹而存在,例如太空旅行。

云原生超级计算机的架构考虑了比传统超级计算机更有效的执行。它们以协调的方式管理计算和通信,以使密集型任务更容易处理。

这是因为它们使用三种类型的处理器——CPU、DPU 和通常是 GPU 的加速器。让我们分析一下这三者各自的作用是什么?

1. CPU(中央处理器)

中央处理器适用于需要快速顺序处理的计算部分。由于超级计算中的计算任务更加复杂,因此 CPU 经常因管理日益庞大和复杂的系统所需的不断增加的通信任务而感到负担过重。事实上,在传统的超级计算机上,计算作业有时需要等待,而 CPU 处理一个中间任务。

2. DPU(数据处理单元)

DPU 或数据处理单元是一个片上数据中心平台,它提供基础设施服务,处理所有配置、虚拟化和硬件。它为每个超级计算节点提供了两种新功能——一种是支持裸机多租户,另一种是支持裸机性能。在第一种情况下,基础设施控制平面处理器接收来自计算节点的用户访问、存储访问、网络和生命周期协调。在第二种情况下,一个隔离的线速数据路径允许硬件加速。这允许 CPU 将例行任务卸载,而是专注于处理任务,从而提高整体系统性能。

3. GPU(图形处理单元)

在云原生超级计算中,GPU 充当通用协处理器引擎。它们利用 GPU 来加速在 CPU 上运行的应用程序,从而并行执行大量任务。

云原生超级计算机的功能

云原生超级计算机具有以下功能:

  • 它允许不同的用户共享一台超级计算机,同时保持每个用户的作业安全和隔离。由于当前商业云计算中自然可用的“多租户隔离”

  • 它使用 DPU 来管理与存储相关的任务、租户隔离的安全性以及系统管理。这将卸载 CPU 以专注于处理任务并提高整体系统性能。

Explore our latest online courses and learn new skills at your own pace. Enroll and become a certified expert to boost your career.

云原生优势

1. 性能

您通常能够访问公共云服务的原生功能,从而提供比非原生组件更好的性能。例如,您可以使用自动扩展和负载平衡功能来管理 I/O 系统。

2. 效率

云原生应用程序利用云原生功能和 API,应该能够更有效地利用底层资源。这意味着更好的性能,以及更低的成本。

3. 成本

更有效的应用程序通常运行成本更低。云提供商会根据您消耗的资源数量向您发送每月账单,因此,如果您能够用更少的资源做更多的事情,那么您就可以节省开支。

4. 可扩展性

由于您正在针对本机云接口编写应用程序,因此您还可以直接访问云平台的自动扩展和负载平衡功能。

结论

在实现有效利用的同时,从超级计算系统中获得尽可能高的性能,通常与当前云计算的成熟多租户架构不一致。云原生超级计算平台首次提供了最佳方案,将最大性能和集群效率与先进的零信任安全隔离和多租户模型相结合。

更新于: 2022-12-26

174 次查看

开启你的 职业生涯

通过完成课程获得认证

立即开始
广告