Amazon EC2 G4 实例

行业中成本效益最高的 GPU 实例用于机器学习推理和图形密集型应用程序

Amazon EC2 G4 实例是行业内成本效益最高的通用 GPU 实例,适用于部署机器学习模型,例如图像分类、对象检测和语音识别,以及图形密集型应用程序,例如远程图形工作站、游戏串流和图像渲染。G4 实例适用于精选的 NVIDIA GPU (G4dn) 或 AMD GPU (G4ad)。

G4dn 实例拥有 NVIDIA T4 GPU 和定制 Intel Cascade Lake CPU ,针对机器学习推理和小规模训练进行了优化。这些实例还赋予了图形密集型应用程序高性能,包括远程工作站、游戏串流和图形渲染。这些实例也极其适合首选使用 NVIDIA 软件(例如,RTX 虚拟工作站)和库(例如,CUDA、CuDNN 和 NVENC)的客户.

G4ad 实例拥有最新的 AMD Radeon Pro V520 GPU 和第 2 代 AMD EPYC 处理器。这些实例在云端图形应用程序中具有最高的性价比,包括远程工作站、游戏串流和图形渲染。 与同等实例相比,它们在图形密集型应用程序中的性价比高出多达 45%。

新 Amazon EC2 G4ad 实例 (1:59)

Amazon EC2 G4dn 实例

由 NVIDIA T4 GPU 提供支持的 G4dn 实例是云中成本最低的基于 GPU 的实例,适用于机器学习推理和小规模训练。它们还提供较高的性能,是一种具有成本效益的解决方案,适用于通过 CUDA、CuDNN 和 NVENC 等 NVIDIA 库针对 NVIDIA GPU 进行优化的图形应用程序。它们提供最多 8 个 NVIDIA T4 GPU、96 个 vCPU、100Gbps 网络和 1.8TB 基于 NVMe 的本地 SSD 存储,当然也可用作裸机实例。

优势

提高性能,降低机器学习推理成本

G4dn 实例配有 NVIDIA T4 GPU,与 CPU 相比它的低延迟吞吐量性能提高 40 倍,因此可以实时处理更多请求。另外,G4dn 实例经过优化,在机器学习中成本效益更高,使总体运营成本中高达 90% 用于机器学习计划。

经济高效的小规模训练

G4dn 实例还可用于对训练时间不那么敏感的企业或机构的小规模/入门级机器学习训练任务。G4dn 实例可达到 65 TFLOP 的 FP16 性能,成为小规模训练任务中无可争议的解决方案。

适合图形密集型应用程序的高性能

与上一代 G3 实例相比,G4dn 实例的图形性能提高 1.8 倍,视频转码能力提高 2 倍。客户可将虚拟工作站配置为能够访问 NVIDIA RTX 工作站,无需额外收费。

功能

由 NVIDIA T4 GPU 提供支持

NVIDIA T4 GPU 可加速多样化云工作负载,包括深度学习训练和推理以及图形。T4 GPU 基于新 NVIDIA Turing 架构,拥有多精度 Turing Tensor Core 和新 RT Core。Turing Tensor Core 技术将多精度计算用于 ML,助力从 FP32 到 FP16 到 INT8 的性能突破,以及 INT4 精度。与 CPU 相比,它在训练中的性能提高 9.3 倍,推理中提高 36 倍。

高性能联网和存储

G4dn 实例可为要求高吞吐量的应用程序提供高达 100 Gbps 的联网带宽。G4dn 实例还支持 Elastic Fabric Adapter (EFA),它使用户能够大规模运行需要高级别节点间通信的应用程序。 这些实例可为需要快速访问本地存储数据的应用程序提供高达 1.8 TB 基于 NVMe 的 SSD 存储。

RTX 和游戏驱动程序

G4dn 实例可为客户提供 NVIDIA RTX 和游戏驱动程序,无需额外收费。RTX 驱动程序可用于为各种视觉密集型工作流提供高质量虚拟工作站。游戏驱动程序可为游戏开发提供无可比拟的图形和计算支持。

Amazon EC2 G4ad 实例

由 AMD Radeon Pro V520 GPU 提供支持的 G4ad 实例,可为云端图形密集型应用程序提供最佳性价比。与 G4dn 实例相比,这些实例的性价比提高多达 45%,这已经是云中成本最低的实例,适用于图形应用程序,例如远程图形工作站、游戏串流,以及利用 OpenGL、DirectX 和 Vulkan 之类的工业级标准 API 的渲染。它们提供多达 4 个 AMD Radeon Pro V520 GPU、64 个 vCPU、25 Gbps 联网和 2.4 TB 本地基于 NVMe 的 SSD 存储。

优势

适合图形密集型应用程序的最高性能、最低成本的实例

G4ad 实例是云中适用于图形密集型应用程序的最低成本的实例。与同等实例相比,它们的性价比提高多达 45%,包括多达 40% 的图形性能提高,它们适用于图形应用程序,例如远程图形工作站、游戏串流,以及利用 OpenGL、DirectX 和 Vulkan 之类的工业级标准 API 的渲染。

简洁的虚拟工作站管理在云中成本最低

G4ad 实例允许客户在几分钟内为虚拟工作站配置高性能模拟、渲染和设计功能,以使客户能够快速扩展。 客户可以使用 AMD Radeon Pro Software for Enterprise 以及高性能远程显示协议、NICE DCV,以在无额外收费的情况下通过 G4ad 实例管理其虚拟工作站环境,每个 GPU 支持最多两台 4k 显示器。

在第三方应用程序中的可靠性

AMD 专业图形解决方案包括丰富的独立软件供应商 (ISV) 应用程序测试和认证流程,名为 Day Zero 认证计划。这可帮助确保开发人员在驱动程序发布之日就能够利用最新的 AMD Radeon Pro Software for Enterprise 功能结合认证软件的可靠性。

功能

由 AMD Radeon Pro V520 GPU 提供支持

AMD Radeon Pro V520 GPU 可为图形提供高性能加速,例如虚拟工作站、计算机生成图像 (CGI)、游戏串流和数字内容创建 (DCC)。这些 GPU 依托 AMD 的 RDNA 架构,极其高效,并具有获得高质量工作站和游戏体验所需的低延迟和高 CPU 至 GPU 带宽。改进了图形管道后,RDNA 架构的设计可以更快地渲染游戏,每个时钟的性能更高。

本地实例存储

G4ad 实例提供高达 2.4 TB 的本地 NVMe 存储以便于快速访问数据,使客户能够高效地创建照片级真实的高分辨率 3D 内容,以提高电影、游戏和 AR/VR 体验。

专业级图形驱动程序

G4ad 实例可提供专业级图形驱动程序,无需额外收费。这些驱动程序可用于为多种视觉密集型工作流提供最佳的虚拟工作站体验,并为游戏开发提供无可比拟的图形和计算支持。

客户案例

Ubitus 是一家引领云端游戏技术构建的创新公司。通过它们的平台,用户只要连接到宽带网络,就可以在任何设备上享受 AAA 级游戏体验,包括智能手机、平板电脑、游戏控制台、智能电视和计算机。

“Ubitus 利用 AWS 的 GPU 功能与 IO Interactive 合作发布适用于高便携性游戏设备的云端版本的 Hitman 3。 在 Amazon EC2 G4ad 实例推出之后,我们能够在每个实例中增加 50% 的并发流而不必更改任何代码,因此优化了我们的成本。这种低成本结构使我们能够向全球的玩家发布更多 Hitman 3 这样的游戏。”

Ubitus 首席执行官 Wesley Kuo。

“Land F/X 利用 GPU 加速来帮助设计专家,同时最大化其性价比。Land F/X 曾将 G4dn 实例用于其开发,在 G4ad 发布之后,他们能够快速地迁移到这种新实例,与使用此前的 GPU 相比,渲染性能提高了 67%,同时产生了 25% 的节约。”

Land F/X 首席执行官/开发人员 Jeremiah Farmer

Duolingo 是一种免费语言培训平台,已经成为最流行的在线语言学习途径。Duolingo 的语言学习科学家、机器学习工程师和 AI 专家利用从超过 3 亿学习者中获得的数据来持续地提高该平台的有效性。

“随着我们的 ML 和研究团队的成长,我们决定更新基于 Amazon ECS 的现有计算基础设施,以支持基于 Amazon EC2 P3 和 G4 GPU 的实例,从而更好地扩展我们的开发模型。Amazon 面向 GPU 实例的 ECS 优化型 AMI 帮助我们非常迅速地使新集群实现正常运行,我们发现 G4 实例让我们的 ML 训练速度相比于 P2 实例实现翻倍,因而节省了 33% 的成本,同时 P3 实例的性能提高四倍,成本节约 15%。总体上,G4 实例适合我们的通用实例,因为它们可在成本与性能之间达到良好的平衡,而 P3 实例极其适合附加速度对特定工作负载至关重要的应用。”

Duolingo 员工运营工程师 Max Blaze

"Blacknut 是一家领先的独立云游戏服务提供商,让普通大众能够在任何设备上“点击玩耍”500 多种视频游戏。为履行我们提供低延迟、快速加载和流畅游戏体验的承诺,我们需要尽可能靠近玩家。借助 EC2 G4dn 实例,我们可以实现平均低至 10 秒或更少的游戏加载时间,保证了总体良好的游戏体验。此外,我们向新市场推出解决方案的周期也缩短到 2 个月以内,同时这种快速响应能力让我们从 2020 年以来实现了每月都部署新的全球合作伙伴,包括 Telecom Italia、Swisscom、POST、Drei Austria 和泰国的 Ais。现在我们的服务已在 40 多个市场上线。" 

Pascal Manchon,Blacknut 首席技术官

2018 年,以其 Snapchat 消息收发应用程序知名的 Snap Inc.(Snap) 产生了非常有趣的新想法:制作一系列动画电影,主角为每位用户的 Bitmoji,即作为 Snapchat 的签名特征的个性化卡通虚拟化身。每一周,Bitmoji TV 都会首映一集呆萌的动画视频,长 3-8 分钟,配有专业字幕,角色是用户及其好友的 Bitmojis,完成从打僵尸到低重力“Moonlympics”环境中的竞赛等各种活动。 利用 Amazon EC2 G4 实例,Snap 能够创建有趣的冒险类个性化娱乐,渲染速度足够使数百万用户同步体验,同时保持低计算成本。

“与 Amazon EC2 G3 实例相比,使用 Amazon EC2 G4 实例后我们的性能提高了 50%,而成本只提高了 10%。”

Snap Inc. 软件工程师 Brad Kotsopolous

阅读案例研究 »

Nearmap 于 2007 年创建于澳大利亚 Perth,已经小型初创公司发展成数字成像领域的领先者。该公司擅长从航拍风景照制作 2D 和 3D 图片,这对各行各业都是有价值的资源。对于 Nearmap,升级到 Amazon EC2 G4 实例的影响直接而重大:该公司能够以 Amazon EC2 G2 实例上的相同成本处理三倍的数据,工作流程毫不费力,并可与现已使用的 AWS 工具无缝集成。

“客户依靠我们来提供高精准度的 3D 现实模型,这些模型都是通过对大面积覆盖区域的多角度航拍计算得出来的。我们每天使用大约 87 万个 GPU 内核。我们过去经常在 Amazon EC2 G2 实例上运行这样的管线,但现在切换到了 Amazon EC2 G4 实例,成本因此降低了 67%。”

Vision Systems 总监 John Corbett

阅读案例研究 »

Untold

Untold Studios 部署了各种 AWS 虚拟工作站配置,包括 G4 实例,它拥有 NVIDIA T4 GPU 和 RTX 技术,针对 VFX 和动画工作流进行了优化。 由于可供选择的实例增多,Untold Studios 可以更准确地匹配虚拟机类型与具体的工作负载,这样在创意和经济方面都能从中受益。

“G4 对我们的工作方式产生了巨大的影响。我们只需使用一行代码就能升级工作站的整个机群,因此艺术家们能够更快地工作,在我们所做的一切中都增加创造性。” 

Untold Studios 技术主管 Sam Reid

Hive

工作站最初使用 Amazon Elastic Compute Cloud (Amazon EC2) G3 实例部署。但是,当 Amazon EC2 G4 实例 — 由 NVIDIA T4 Tensor Core GPU(NVIDIA 的最新一代 GPU)和 NVIDIA RTX 技术(适用于高性能模拟、渲染和设计的最新技术)提供支持 — 问世后,Hive VFX 能够轻松而快速地升级。

“从 G3 升级到 G4 实例很简单,在几分钟内,艺术家们就能够获得新一代 NVIDIA GPU 带来的最新计算机图形和性能。我们使用 G4 实例达到的工作站性能甚至超过一些更大的工作室,满足我们的需要绰绰有余。”

Hive VFX 创始人 Bernie Kimbacher

在 Doritos 的 Super Bowl 2020 商展中,75 岁的演员 Sam Elliott 和 21 岁的说唱艺人 Lil Nas X 共舞,在此产生的竞争让使用一家初创公司开发的人工智能技术成为可能,这家名为 Humen 的初创公司就是 Sway 背后的母公司。这个小不点公司能够赢得与巨头 Doritos 在 Super Bowl 活动中合作并发布 App Store 中排名前列的 Sway,借助的是 Amazon Web Services (AWS) 的帮助。为了承担在 Super Bowl 期间发布图形密集型应用程序的繁重工作负载,Humen 使用了 Amazon Elastic Compute Cloud (Amazon EC2) G4 实例 — 并获得了出色的成果。

“多亏了 Amazon EC2 G4 实例,我才能在大约 6 个月内使 Sway 能够处理 Super Bowl 规模的工作负载。”

Humen 工程师 Jesse Myers

阅读案例研究 »

The Molecule
“视觉效果软件越来越依赖 GPU 能力,在需要的时候根本离不开,但并非每天都需要。作为小型企业,我们承受不起买辆赛车开到杂货店;同样也承受不起购买不是每天使用的东西。我们也无法针对单个项目的独特需求购买 10 辆。但是使用 G4 实例,我们就像获得了一队配有 GPU 的赛车,比我们能购买的任何产品都更好、更快,但没有在不需要时为其付费的开销。艺术家们兴奋地坐进了赛车,我们也很高兴在不再需要时还回它们!”

The Molecule 总裁 Chris Healer

PureWeb
“在 PureWeb,我们致力于提供世界上最好的平台,为企业实现交互内容实时流化。当 Geneva International Motor Show 因 COVID-19 取消时,大众汽车找到我们,寻求通过创新解决方案为客户提供虚拟展厅体验,以应对展会的取消。通过与 AWS 以及我们的创意机构合作伙伴密切合作,我们能够在 Unity Game Engine 中打造了展厅的虚拟重现,三周之前使用 Amazon EC2 G4dn 实例在我们的平台上运行。结果,数以千计的用户能够从家里体验 Geneva Motor Show 上的大众展台。由于对项目的时间和技术限制,我们深信 AWS 是能够帮助我们完成这项工作并提供稳定、可扩展、经济高效且真正便于化的用户体验的唯一云提供商。”

PureWeb 高级软件架构师 Chris Jarabek

产品详细信息

  实例大小 GPU vCPU 内存 (GiB) 实例存储 (GB) 网络带宽 (Gbps) EBS 带宽 (Gbps) 按需价格/小时* 一年期预留实例的有效小时* (Linux) 三年期预留实例的有效小时* (Linux)

G4dn

单 GPU VM g4dn.xlarge 1 4 16 1 个 125 NVMe SSD 最高 25 最高 3.5 0.526 USD 0.316 USD 0.210 USD
g4dn.2xlarge 1 8 32 1 个 225 NVMe SSD 最高 25 最高 3.5 0.752 USD 0.452 USD 0.300 USD
g4dn.4xlarge 1 16 64 1 个 225 NVMe SSD 最高 25 4.75 1.204 USD 0.722 USD 0.482 USD
g4dn.8xlarge 1 32 128 1 个 900 NVMe SSD 50 9.5 2.176 USD 1.306 USD 0.870 USD
g4dn.16xlarge 1 64 256 1 个 900 NVMe SSD 50 9.5 4.352 USD 2.612 USD 1.740 USD
                     
多 GPU VM g4dn.12xlarge 4 48 192 1 个 900 NVMe SSD 50 9.5 3.912 USD 2.348 USD 1.564 USD
g4dn.metal 8 96 384 2 个 900 NVMe SSD 100 19 7.824 USD 4.694 USD 3.130 USD

G4ad

单 GPU VM g4ad.xlarge 1 4 16 1 个 150 NVMe SSD 最高 10 最高 3 0.379 USD 0.227 USD 0.178 USD
g4ad.2xlarge 1 8 32 1 个 300 NVMe SSD 最高 10 最高 3 0.541 USD 0.325 USD 0.254 USD
g4ad.4xlarge 1 16 64 1 个 600 NVMe SSD 最高 10 最高 3 0.867 USD 0.520 USD 0.405 USD
                     
多 GPU VM g4ad.8xlarge 2 32 128 1 个 1200 NVMe SSD 15 3 1.734 USD 1.040 USD 0.810 USD
g4ad.16xlarge 4 64 256 1 个 2400 NVMe SSD 25 6 3.468 USD 2.081 USD 1.619 USD

* 所示价格适用于美国东部(弗吉尼亚北部)AWS 区域。一年期和三年期预留实例的价格适用于“部分预付费用”付款方式或“无预付费用”(针对没有“部分预付费用”选项的实例)。

开始使用 G4dn 实例

使用 AWS 提供的预构建 AMI 和容器

使用 Amazon Deep Learning AMI 或 Deep Learning Containers,您可以快速启动预先安装了常见深度学习框架和界面(如 TensorFlow、PyTorch 和 MXNet)的 Amazon EC2 实例来训练复杂的自定义 AI 模型、试验新算法或学习新技能和技巧。如需了解更多信息,请访问 Amazon Deep Learning AMI 产品页面AWS Deep Learning Containers 产品页面

NVIDIA RTX Virtual Workstation AMI 支持每个 GPU 为可视化应用程序运行多达四个 4K 显示器。NVIDIA Gaming AMI 可按 60 FPS 的速度渲染视频,支持每个 GPU 运行单 4K 显示器。

使用 NVIDIA 驱动程序构建自定义 AMI

NVIDIA Data Center 驱动程序可为深度学习、数据科学和 HPC 中常见的高密集计算工作负载带来最佳性能。

NVIDIA RTX 驱动程序可用于启用 NVIDIA RTX Virtual Workstation 软件。RTX vWS 可为每个 GPU 的多达四个 4K 显示器提供支持。NVIDIA Gaming 驱动程序支持世界上最先进的显卡、游戏解决方案和游戏技术。这种驱动程序可为每个 GPU 的单 4K 显示器提供支持。

如需了解如何将这些驱动程序安装到您的实例,请访问下面这些适用于 LinuxWindows 的链接。

开始使用 G4ad 实例

使用 AWS 提供的预构建 AMI

AMD Radeon Pro Software for Enterprise 驱动程序可为虚拟工作站、游戏串流、渲染和其他图形应用程序提供高性能图形。为了快速上手,您可以使用 AWS 提供的 AMI,它包括预预安装的 AMD Radeon Pro Software for Enterprise。这些 AMI 已可从 AMD Radeon Pro Marketplace 中获得。

使用 AMD 驱动程序构建自定义 AMI

AMD Radeon Pro Software for Enterprise 驱动程序可用于配置具有强大且可靠的专业级图形能力的实例。使用这些驱动程序预置的工作站可支持最多两台 4K 显示器。

如需了解如何将这些驱动程序安装到您的实例以构建自定义 AMI,请访问下面这些适用于 LinuxWindows 的链接。

资源

AWS 计算博客

新 Amazon EC2 G4ad 实例深入探究

阅读博客 »

AMD 博客

最终指南:设置 Amazon EC2 G4ad 实例

阅读博客 »

AMD 博客

基于 AMD 的 Amazon EC2 G4ad 实例促进了云游戏引擎工作流

阅读博客 »

AMD 博客

随时随地通过 Autodesk® Inventor® 和 Amazon EC2 G4ad 实例访问您的数据和设计

阅读博客 »

AMD 博客

最终指南:设置 Amazon EC2 G4ad 实例

阅读博客 »

开始使用 AWS

Step 1 - Sign up for an Amazon Web Services account

注册 AWS 账户

立即享受 AWS 免费套餐

通过 10 分钟教程来进行学习

通过 简单教程进行探讨和学习。

开始使用 AWS 进行构建

按照可帮助您启动 AWS 项目的分步式指南开始构建。

了解关于其他 Amazon EC2 实例类型的更多信息

单击此处了解更多信息
准备好开始使用了吗?
注册
还有更多问题?
联系我们