Amazon EC2 G4 实例是行业内成本效益最高的通用 GPU 实例,适用于部署机器学习模型,例如图像分类、对象检测和语音识别,以及图形密集型应用程序,例如远程图形工作站、游戏串流和图像渲染。G4 实例适用于精选的 NVIDIA GPU (G4dn) 或 AMD GPU (G4ad)。
G4dn 实例拥有 NVIDIA T4 GPU 和定制 Intel Cascade Lake CPU ,针对机器学习推理和小规模训练进行了优化。这些实例还赋予了图形密集型应用程序高性能,包括远程工作站、游戏串流和图形渲染。这些实例也极其适合首选使用 NVIDIA 软件(例如,RTX 虚拟工作站)和库(例如,CUDA、CuDNN 和 NVENC)的客户.
G4ad 实例拥有最新的 AMD Radeon Pro V520 GPU 和第 2 代 AMD EPYC 处理器。这些实例在云端图形应用程序中具有最高的性价比,包括远程工作站、游戏串流和图形渲染。 与同等实例相比,它们在图形密集型应用程序中的性价比高出多达 45%。
Amazon EC2 G4dn 实例
由 NVIDIA T4 GPU 提供支持的 G4dn 实例是云中成本最低的基于 GPU 的实例,适用于机器学习推理和小规模训练。它们还提供较高的性能,是一种具有成本效益的解决方案,适用于通过 CUDA、CuDNN 和 NVENC 等 NVIDIA 库针对 NVIDIA GPU 进行优化的图形应用程序。它们提供最多 8 个 NVIDIA T4 GPU、96 个 vCPU、100Gbps 网络和 1.8TB 基于 NVMe 的本地 SSD 存储,当然也可用作裸机实例。
优势
提高性能,降低机器学习推理成本
G4dn 实例配有 NVIDIA T4 GPU,与 CPU 相比它的低延迟吞吐量性能提高 40 倍,因此可以实时处理更多请求。另外,G4dn 实例经过优化,在机器学习中成本效益更高,使总体运营成本中高达 90% 用于机器学习计划。
经济高效的小规模训练
G4dn 实例还可用于对训练时间不那么敏感的企业或机构的小规模/入门级机器学习训练任务。G4dn 实例可达到 65 TFLOP 的 FP16 性能,成为小规模训练任务中无可争议的解决方案。
适合图形密集型应用程序的高性能
与上一代 G3 实例相比,G4dn 实例的图形性能提高 1.8 倍,视频转码能力提高 2 倍。客户可将虚拟工作站配置为能够访问 NVIDIA RTX 工作站,无需额外收费。
功能
由 NVIDIA T4 GPU 提供支持
NVIDIA T4 GPU 可加速多样化云工作负载,包括深度学习训练和推理以及图形。T4 GPU 基于新 NVIDIA Turing 架构,拥有多精度 Turing Tensor Core 和新 RT Core。Turing Tensor Core 技术将多精度计算用于 ML,助力从 FP32 到 FP16 到 INT8 的性能突破,以及 INT4 精度。与 CPU 相比,它在训练中的性能提高 9.3 倍,推理中提高 36 倍。
高性能联网和存储
G4dn 实例可为要求高吞吐量的应用程序提供高达 100 Gbps 的联网带宽。G4dn 实例还支持 Elastic Fabric Adapter (EFA),它使用户能够大规模运行需要高级别节点间通信的应用程序。 这些实例可为需要快速访问本地存储数据的应用程序提供高达 1.8 TB 基于 NVMe 的 SSD 存储。
RTX 和游戏驱动程序
G4dn 实例可为客户提供 NVIDIA RTX 和游戏驱动程序,无需额外收费。RTX 驱动程序可用于为各种视觉密集型工作流提供高质量虚拟工作站。游戏驱动程序可为游戏开发提供无可比拟的图形和计算支持。
Amazon EC2 G4ad 实例
由 AMD Radeon Pro V520 GPU 提供支持的 G4ad 实例,可为云端图形密集型应用程序提供最佳性价比。与 G4dn 实例相比,这些实例的性价比提高多达 45%,这已经是云中成本最低的实例,适用于图形应用程序,例如远程图形工作站、游戏串流,以及利用 OpenGL、DirectX 和 Vulkan 之类的工业级标准 API 的渲染。它们提供多达 4 个 AMD Radeon Pro V520 GPU、64 个 vCPU、25 Gbps 联网和 2.4 TB 本地基于 NVMe 的 SSD 存储。
优势
适合图形密集型应用程序的最高性能、最低成本的实例
G4ad 实例是云中适用于图形密集型应用程序的最低成本的实例。与同等实例相比,它们的性价比提高多达 45%,包括多达 40% 的图形性能提高,它们适用于图形应用程序,例如远程图形工作站、游戏串流,以及利用 OpenGL、DirectX 和 Vulkan 之类的工业级标准 API 的渲染。
简洁的虚拟工作站管理在云中成本最低
G4ad 实例允许客户在几分钟内为虚拟工作站配置高性能模拟、渲染和设计功能,以使客户能够快速扩展。 客户可以使用 AMD Radeon Pro Software for Enterprise 以及高性能远程显示协议、NICE DCV,以在无额外收费的情况下通过 G4ad 实例管理其虚拟工作站环境,每个 GPU 支持最多两台 4k 显示器。
在第三方应用程序中的可靠性
AMD 专业图形解决方案包括丰富的独立软件供应商 (ISV) 应用程序测试和认证流程,名为 Day Zero 认证计划。这可帮助确保开发人员在驱动程序发布之日就能够利用最新的 AMD Radeon Pro Software for Enterprise 功能结合认证软件的可靠性。
功能
由 AMD Radeon Pro V520 GPU 提供支持
AMD Radeon Pro V520 GPU 可为图形提供高性能加速,例如虚拟工作站、计算机生成图像 (CGI)、游戏串流和数字内容创建 (DCC)。这些 GPU 依托 AMD 的 RDNA 架构,极其高效,并具有获得高质量工作站和游戏体验所需的低延迟和高 CPU 至 GPU 带宽。改进了图形管道后,RDNA 架构的设计可以更快地渲染游戏,每个时钟的性能更高。
本地实例存储
G4ad 实例提供高达 2.4 TB 的本地 NVMe 存储以便于快速访问数据,使客户能够高效地创建照片级真实的高分辨率 3D 内容,以提高电影、游戏和 AR/VR 体验。
专业级图形驱动程序
G4ad 实例可提供专业级图形驱动程序,无需额外收费。这些驱动程序可用于为多种视觉密集型工作流提供最佳的虚拟工作站体验,并为游戏开发提供无可比拟的图形和计算支持。
客户案例
Ubitus 是一家引领云端游戏技术构建的创新公司。通过它们的平台,用户只要连接到宽带网络,就可以在任何设备上享受 AAA 级游戏体验,包括智能手机、平板电脑、游戏控制台、智能电视和计算机。
“Ubitus 利用 AWS 的 GPU 功能与 IO Interactive 合作发布适用于高便携性游戏设备的云端版本的 Hitman 3。 在 Amazon EC2 G4ad 实例推出之后,我们能够在每个实例中增加 50% 的并发流而不必更改任何代码,因此优化了我们的成本。这种低成本结构使我们能够向全球的玩家发布更多 Hitman 3 这样的游戏。”
Ubitus 首席执行官 Wesley Kuo。
“Land F/X 利用 GPU 加速来帮助设计专家,同时最大化其性价比。Land F/X 曾将 G4dn 实例用于其开发,在 G4ad 发布之后,他们能够快速地迁移到这种新实例,与使用此前的 GPU 相比,渲染性能提高了 67%,同时产生了 25% 的节约。”
Land F/X 首席执行官/开发人员 Jeremiah Farmer
Duolingo 是一种免费语言培训平台,已经成为最流行的在线语言学习途径。Duolingo 的语言学习科学家、机器学习工程师和 AI 专家利用从超过 3 亿学习者中获得的数据来持续地提高该平台的有效性。
“随着我们的 ML 和研究团队的成长,我们决定更新基于 Amazon ECS 的现有计算基础设施,以支持基于 Amazon EC2 P3 和 G4 GPU 的实例,从而更好地扩展我们的开发模型。Amazon 面向 GPU 实例的 ECS 优化型 AMI 帮助我们非常迅速地使新集群实现正常运行,我们发现 G4 实例让我们的 ML 训练速度相比于 P2 实例实现翻倍,因而节省了 33% 的成本,同时 P3 实例的性能提高四倍,成本节约 15%。总体上,G4 实例适合我们的通用实例,因为它们可在成本与性能之间达到良好的平衡,而 P3 实例极其适合附加速度对特定工作负载至关重要的应用。”
Duolingo 员工运营工程师 Max Blaze
"Blacknut 是一家领先的独立云游戏服务提供商,让普通大众能够在任何设备上“点击玩耍”500 多种视频游戏。为履行我们提供低延迟、快速加载和流畅游戏体验的承诺,我们需要尽可能靠近玩家。借助 EC2 G4dn 实例,我们可以实现平均低至 10 秒或更少的游戏加载时间,保证了总体良好的游戏体验。此外,我们向新市场推出解决方案的周期也缩短到 2 个月以内,同时这种快速响应能力让我们从 2020 年以来实现了每月都部署新的全球合作伙伴,包括 Telecom Italia、Swisscom、POST、Drei Austria 和泰国的 Ais。现在我们的服务已在 40 多个市场上线。"
Pascal Manchon,Blacknut 首席技术官
2018 年,以其 Snapchat 消息收发应用程序知名的 Snap Inc.(Snap) 产生了非常有趣的新想法:制作一系列动画电影,主角为每位用户的 Bitmoji,即作为 Snapchat 的签名特征的个性化卡通虚拟化身。每一周,Bitmoji TV 都会首映一集呆萌的动画视频,长 3-8 分钟,配有专业字幕,角色是用户及其好友的 Bitmojis,完成从打僵尸到低重力“Moonlympics”环境中的竞赛等各种活动。 利用 Amazon EC2 G4 实例,Snap 能够创建有趣的冒险类个性化娱乐,渲染速度足够使数百万用户同步体验,同时保持低计算成本。
“与 Amazon EC2 G3 实例相比,使用 Amazon EC2 G4 实例后我们的性能提高了 50%,而成本只提高了 10%。”
Snap Inc. 软件工程师 Brad Kotsopolous
Nearmap 于 2007 年创建于澳大利亚 Perth,已经小型初创公司发展成数字成像领域的领先者。该公司擅长从航拍风景照制作 2D 和 3D 图片,这对各行各业都是有价值的资源。对于 Nearmap,升级到 Amazon EC2 G4 实例的影响直接而重大:该公司能够以 Amazon EC2 G2 实例上的相同成本处理三倍的数据,工作流程毫不费力,并可与现已使用的 AWS 工具无缝集成。
“客户依靠我们来提供高精准度的 3D 现实模型,这些模型都是通过对大面积覆盖区域的多角度航拍计算得出来的。我们每天使用大约 87 万个 GPU 内核。我们过去经常在 Amazon EC2 G2 实例上运行这样的管线,但现在切换到了 Amazon EC2 G4 实例,成本因此降低了 67%。”
Vision Systems 总监 John Corbett
Untold Studios 部署了各种 AWS 虚拟工作站配置,包括 G4 实例,它拥有 NVIDIA T4 GPU 和 RTX 技术,针对 VFX 和动画工作流进行了优化。 由于可供选择的实例增多,Untold Studios 可以更准确地匹配虚拟机类型与具体的工作负载,这样在创意和经济方面都能从中受益。
“G4 对我们的工作方式产生了巨大的影响。我们只需使用一行代码就能升级工作站的整个机群,因此艺术家们能够更快地工作,在我们所做的一切中都增加创造性。”
Untold Studios 技术主管 Sam Reid
产品详细信息
实例大小 | GPU | vCPU | 内存 (GiB) | 实例存储 (GB) | 网络带宽 (Gbps) | EBS 带宽 (Gbps) | 按需价格/小时* | 一年期预留实例的有效小时* (Linux) | 三年期预留实例的有效小时* (Linux) | |
G4dn |
||||||||||
单 GPU VM | g4dn.xlarge | 1 | 4 | 16 | 1 个 125 NVMe SSD | 最高 25 | 最高 3.5 | 0.526 USD | 0.316 USD | 0.210 USD |
g4dn.2xlarge | 1 | 8 | 32 | 1 个 225 NVMe SSD | 最高 25 | 最高 3.5 | 0.752 USD | 0.452 USD | 0.300 USD | |
g4dn.4xlarge | 1 | 16 | 64 | 1 个 225 NVMe SSD | 最高 25 | 4.75 | 1.204 USD | 0.722 USD | 0.482 USD | |
g4dn.8xlarge | 1 | 32 | 128 | 1 个 900 NVMe SSD | 50 | 9.5 | 2.176 USD | 1.306 USD | 0.870 USD | |
g4dn.16xlarge | 1 | 64 | 256 | 1 个 900 NVMe SSD | 50 | 9.5 | 4.352 USD | 2.612 USD | 1.740 USD | |
多 GPU VM | g4dn.12xlarge | 4 | 48 | 192 | 1 个 900 NVMe SSD | 50 | 9.5 | 3.912 USD | 2.348 USD | 1.564 USD |
g4dn.metal | 8 | 96 | 384 | 2 个 900 NVMe SSD | 100 | 19 | 7.824 USD | 4.694 USD | 3.130 USD | |
G4ad |
||||||||||
单 GPU VM | g4ad.xlarge | 1 | 4 | 16 | 1 个 150 NVMe SSD | 最高 10 | 最高 3 | 0.379 USD | 0.227 USD | 0.178 USD |
g4ad.2xlarge | 1 | 8 | 32 | 1 个 300 NVMe SSD | 最高 10 | 最高 3 | 0.541 USD | 0.325 USD | 0.254 USD | |
g4ad.4xlarge | 1 | 16 | 64 | 1 个 600 NVMe SSD | 最高 10 | 最高 3 | 0.867 USD | 0.520 USD | 0.405 USD | |
多 GPU VM | g4ad.8xlarge | 2 | 32 | 128 | 1 个 1200 NVMe SSD | 15 | 3 | 1.734 USD | 1.040 USD | 0.810 USD |
g4ad.16xlarge | 4 | 64 | 256 | 1 个 2400 NVMe SSD | 25 | 6 | 3.468 USD | 2.081 USD | 1.619 USD |
* 所示价格适用于美国东部(弗吉尼亚北部)AWS 区域。一年期和三年期预留实例的价格适用于“部分预付费用”付款方式或“无预付费用”(针对没有“部分预付费用”选项的实例)。
开始使用 G4dn 实例
使用 AWS 提供的预构建 AMI 和容器
使用 Amazon Deep Learning AMI 或 Deep Learning Containers,您可以快速启动预先安装了常见深度学习框架和界面(如 TensorFlow、PyTorch 和 MXNet)的 Amazon EC2 实例来训练复杂的自定义 AI 模型、试验新算法或学习新技能和技巧。如需了解更多信息,请访问 Amazon Deep Learning AMI 产品页面或 AWS Deep Learning Containers 产品页面。
NVIDIA RTX Virtual Workstation AMI 支持每个 GPU 为可视化应用程序运行多达四个 4K 显示器。NVIDIA Gaming AMI 可按 60 FPS 的速度渲染视频,支持每个 GPU 运行单 4K 显示器。
开始使用 G4ad 实例
使用 AWS 提供的预构建 AMI
AMD Radeon Pro Software for Enterprise 驱动程序可为虚拟工作站、游戏串流、渲染和其他图形应用程序提供高性能图形。为了快速上手,您可以使用 AWS 提供的 AMI,它包括预预安装的 AMD Radeon Pro Software for Enterprise。这些 AMI 已可从 AMD Radeon Pro Marketplace 中获得。
了解关于其他 Amazon EC2 实例类型的更多信息