AWS ParallelCluster 是一个开源集群管理工具,可让您轻松在 AWS 上部署和管理高性能计算(HPC)集群。ParallelCluster 使用简单的图形用户界面 (GUI) 或文本文件,以安全、自动化的方式为 HPC 应用程序所需的资源进行建模和预置。 它还支持多种实例类型和作业提交队列,以及 AWS Batch 和 Slurm 等作业调度程序。
AWS ParallelCluster 基于热门的开源 CfnCluster 项目构建,通过 AWS CloudFormation 模板或 Python 包索引 (PyPI) 安装 GUI 来发布。ParallelCluster 的源代码托管在 GitHub 上的 Amazon Web Services 存储库中。您无需为 AWS ParallelCluster 支付额外费用,只需为运行应用程序所需的 AWS 资源付费。
优势
自动资源扩缩
借助 AWS ParallelCluster,您可以使用简单的文本文件以自动化、安全的方式为应用程序所需的资源进行建模、预置和动态扩展。
轻松的集群管理
借助 AWS ParallelCluster,您可以以安全、可重复的方式预置资源,无需执行手动操作或编写自定义脚本即可构建和重建基础设施。
无缝迁移到云
AWS ParallelCluster 支持各种操作系统和批量调度程序,让您几乎或完全无需修改即可迁移现有 HPC 工作负载。
工作原理
AWS ParallelCluster 入门
使用案例
优化生产工作负载
要充分利用基于云的服务的弹性和广度,迁移 HPC 工作负载需要为每种工作负载选择正确的计算、存储和网络资源。可以使用 ParallelCluster 轻松创建和管理多个自定义 HPC 集群,以满足工作负载的独特需求。
快速原型制作
测试新产品的研究人员和工程师需要在短时间内访问 HPC 集群,以便这些集群能够尽快进行迭代。AWS ParallelCluster 让研究人员和工程师可以更轻松地按需启动自定义 HPC 集群,无需手动操作或自定义脚本。