什么是超级计算?

超级计算是利用海量 CPU 资源和高速网络进行大规模复杂数据处理的过程。某些用例,例如地球科学模拟或 DNA 分析,需要在短时间内同时处理数十亿甚至数万亿个数据点。超级计算技术是一种高性能计算形式,利用数百甚至数千个并行工作的节点来共同解决复杂的问题。超级计算节点通过基于硬件的加速器进行高度优化,能够以普通计算机无法达到的速度执行计算、交换和集成数据。

超级计算有哪些使用案例?

超级计算有广泛的应用领域。虽然不是详尽无遗的清单,但以下是一些演示企业如何使用超级计算的示例。

计算流体动力学

计算流体动力学(CFD)是使用复杂的数学建模来跟踪传热、流体运动、动量和其他相关流程的过程。CFD 依赖于快速产生超级计算擅长创建的全面模拟。例如,Formula 1 使用计算流体动力学技术来测试汽车的空气动力学特性。使用超级计算,他们可以在设计车辆时模拟不同的详细信息,从而缩短上市时间并提高效率。 

基因组研究

超级计算机的高级处理能力在研究高度复杂的基因组结构、功能和图谱时很有用。超级计算机提供的每秒四万亿次浮点运算可让研究人员进行大规模的基因组研究。举一个真实的示例,国家医学图书馆使用强大的超级计算机来产生序列读取存档(SRA)。SRA 拥有来自 900 多万次实验的测序结果,可让生物信息学家全面分析其内容。 

游戏

游戏工程师必须确保游戏玩家可以在不丢包、拥塞或丢帧的情况下畅玩游戏。超级计算可让开发人员增强图形、模拟物理和渲染逼真的设置。云计算的多处理器有助于处理数据并为游戏玩家和开发人员提供高性能。例如,NICE DCV 通过云向任何设备提供远程桌面和应用程序流式处理。这种支持可避免采用昂贵的专用工作站。通过使用这些超级计算机,开发人员可以在优化成本的同时实现高性能。 

医学研究

医学研究是新药品和化学品的研究、开发和生产。超级计算资源为研究人员提供了同时研究数万亿个数据点所需的处理能力。从对分子建模到生产用于人类健康的新材料,现代超级计算机无处不在。

Good Chemistry 是超级计算实际应用的一个示例。这家创新公司的目标是通过解决与材料科学相关的复杂问题来营造更可持续发展的世界。公司使用超级计算来模拟破坏前氟烷基和多氟烷基物质化学键的新方法的开发,这些物质对人体健康有害。

超级计算有哪些优势?

超级计算机可以汇集资源,每秒提供四万亿次浮点运算。组织使用这种高性能超级计算技术来获得以下优势。

缩短上市时间

超级计算支持复杂新产品的数字原型设计,提高效率并缩短制药、地热研究和其他数学领域等行业的产品上市时间。超级计算使用并行处理来显著减少完成复杂计算和物理模拟所需的时间。通常需要数周的计算只需很短的时间即可完成。可以通过加速模拟来加快研发阶段的速度。 

采用人工智能/机器学习(AI/ML)

人工智能(AI)机器学习(ML)技术需要强大的计算能力来处理大量数据。可以使用超级计算来进行海量数据处理,例如每秒处理数万亿个数据点,从而对庞大的数据集提供高度的见解。超级计算为人工智能和机器学习提供支持,使这些技术能够大规模执行。

大数据分析

超级计算可以分析数万亿个数据点,所用时间仅为通常所需时间的一小部分。可以分析海量数据集,以及执行模式识别、数据提取、分析和其他数据分析操作。超级计算有助于简化金融、科学研究和医学等行业中的大数据分析,在这些行业中,同时并行处理数百万个数据至关重要。 

更快的性能

典型的超级计算机比传统计算机快得多,因为 IT 工具使用可能来自数千个并行处理器的资源。超级计算机是必不可少的工具 — 它们更高的性能有助于加快任何与计算机相关的流程。 

超级计算的工作原理是什么?

超级计算使用分布在互联网络上的计算节点集群。每个节点执行相同任务的子集,因此它们共同计算出最终的复杂结果。高性能计算集群由数百甚至数千个计算节点组成,其中每个节点包含大约 8 到 128 个 CPU。然后,网格中间件将这些计算资源与根据需要请求处理能力的高级应用程序连接起来。

节点

三种类型的节点可促进大多数超级计算机的运转:

用户节点

用户节点从计算网格请求资源。最终用户提出此请求后,用户节点就会将请求传递通过中间件并通知网格计算系统上的所有节点。

提供者节点

提供者节点为计算网格提供资源。当这些节点收到新的请求时,它们开始执行任务。许多提供者节点允许对称多处理,具有每秒最高操作次数的能力。中间件收集并返回结果。

控制节点

控制节点充当管理员,管理所有提供者节点资源的分配。中间件通信工具在控制节点上运行,将任务分配给特定的提供者。 

超级计算系统有哪些组成部分?

超级计算系统由几个核心组件组成,这些组件协同工作以提供高性能。以下解释这些主要组件。

网络接口

超级计算使用自定义的网络接口,可让您通过节点间通信运行应用程序。这些接口增强实例间通信的性能,并有助于扩展工作负载。这些技术混合使用消息传递接口(MPI)和机器学习应用程序来提供按需弹性。 

远程显示协议

超级计算机使用远程显示协议,因此客户可以在其设备上从数据中心或云端访问应用程序。此协议可让您远程运行密集型应用程序,将用户界面流式传输到更简单的设备。该组件可避免采用昂贵的专用工作站,并且提供灵活的部署。

集群管理工具

集群管理工具可让您管理和部署高性能计算集群。该工具包含一个简单的 GUI,可让您访问电网网络的资源。可以使用集群管理工具提交查询、执行并行处理以及有效管理资源集群。

统一界面

统一界面可让您与并行集群协作使用云原生服务。可以使用单一的界面将作业提交到超级计算机网络或本地基础设施。统一的界面可让您跟踪所有计算资源并最大限度地提高应用程序性能。

冷却和电源管理

超级计算机系统使用强大的冷却系统来提高能源效率。由于这些系统消耗大量的计算能力,它们需要协助冷却以免过热。节能系统可以提供高性能,同时消耗更少的资源。

AWS 如何帮助支持您的超级计算要求?

AWS 高性能计算提供快速联网和几乎无限的基础设施,可让您在云中运行复杂的模拟和深度学习工作负载。AWS 提供一整套 HPC 产品和服务,为您提供更快的见解、更强的计算能力和无限的可扩展性。例如:

  • Amazon EC2 UltraClusters 可帮助您扩展到数千个 GPU 或机器学习加速器,从而按需使用超级计算机。
  • NICE DCV 提供高性能远程显示协议,该协议具有全面的安全性、优化的成本和对远程桌面的灵活部署。
  • AWS ParallelCluster 充当开源集群管理工具,可让您自动扩展资源、无缝迁移到云端并轻松管理集群基础设施。

 立即创建免费账户,开始在 AWS 上使用超级计算。

AWS 上的后续步骤

查看其他与产品相关的资源
查看计算服务 
注册免费账户

立即享受 AWS 免费套餐。

注册 
开始在控制台中构建

在 AWS 管理控制台中开始构建。

登录