Instâncias G4 do Amazon EC2
As instâncias de GPU mais econômicas do setor para inferência de machine learning e aplicações com uso intensivo de gráficos
As instâncias G4 do Amazon EC2 são as instâncias de GPU mais econômicas e versáteis do setor para implantar modelos de machine learning, como classificação de imagens, detecção de objetos e reconhecimento de voz, e para aplicações com uso intensivo de gráficos, como estações de trabalho de gráficos remotos, transmissão de jogos e renderização de gráficos. As instâncias G4 estão disponíveis com uma escolha de GPUs NVIDIA (G4dn) ou GPUs AMD (G4ad).
As instâncias G4dn usam GPUs NVIDIA T4 e CPUs Intel Cascade Lake personalizadas, e são otimizadas para inferência de machine learning e treinamento em pequena escala. Essas instâncias também oferecem alta performance para aplicações com muitos gráficos, incluindo estações de trabalho remotas, transmissão de jogos e renderização de gráficos. Essas instâncias também são ideais para clientes que preferem usar software NVIDIA, como RTX Virtual Workstation, e bibliotecas, como CUDA, CuDNN e NVENC.
As instâncias G4ad usam as mais recentes GPUs AMD Radeon Pro V520 e processadores AMD EPYC de 2ª geração. Essas instâncias oferecem a melhor performance de preço na nuvem para aplicações com gráficos, incluindo estações de trabalho remotas, transmissão de jogos e renderização de gráficos. Em comparação com instâncias parecidas, elas oferecem performance de preço até 45% melhor para aplicações com uso intensivo de gráficos.
Instâncias G4dn do Amazon EC2
As instâncias G4dn, são desenvolvidas por GPUs NVIDIA T4 são as instâncias baseadas em GPU de menor custo na nuvem para inferência de machine learning e treinamento em pequena escala. Elas também fornecem alta performance e são uma solução econômica para aplicações gráficas que são otimizadas para GPUs NVIDIA usando bibliotecas NVIDIA como CUDA, CuDNN e NVENC. Elas fornecem até 8 GPUs NVIDIA T4, 96 vCPUs, redes de 100 Gbps e armazenamento SSD baseado em NVMe local de 1,8 TB e também estão disponíveis como instâncias bare metal.
Benefícios
Aumente a performance e reduza os custos de inferência de machine learning
As instâncias G4dn são equipadas com GPUs NVIDIA T4 que oferecem até 40 vezes melhor taxa de transferência de baixa latência do que as CPUs, para que mais solicitações possam ser atendidas em tempo real. Além disso, as instâncias G4dn são otimizadas para economia em inferência de machine learning, o que pode representar até 90% dos custos operacionais gerais para iniciativas de machine learning.
Treinamento econômico em pequena escala
As instâncias G4dn também são úteis para trabalhos de treinamento de machine learning de pequena escala/nível inicial para empresas ou instituições que são menos sensíveis ao tempo de treinamento. As instâncias G4dn oferecem até 65 TFLOPs de performance FP16 e são uma ótima solução para trabalhos de treinamento em pequena escala.
Alta performance para aplicações com muitos gráficos
As instâncias G4dn oferecem performance gráfica até 1,8 vezes superior e o dobro da capacidade de transcodificação de vídeo em relação às instâncias G3 da geração anterior. Os clientes podem configurar estações de trabalho virtuais com acesso às estações de trabalho NVIDIA RTX sem custo adicional.
Recursos
Desenvolvido por GPUs NVIDIA T4
As GPUs NVIDIA T4 aceleram diversas workloads na nuvem, incluindo treinamento de aprendizado profundo, inferência e gráficos. Com base na nova arquitetura NVIDIA Turing, as GPUs T4 apresentam Turing Tensor Cores de multiprecisão e novos RT Cores. A tecnologia Turing Tensor Core com computação de precisão múltipla para ML desenvolveu a performance avançada de FP32 a FP16 a INT8, bem como precisões INT4. Ela oferece performance até 9,3 vezes superior do que CPUs em treinamento e até 36 vezes em inferência.
Redes e armazenamento de alta performance
As instâncias G4dn oferecem até 100 Gbps de redes para aplicações que exigem alta taxa de transferência. As instâncias G4dn também oferecem suporte ai Elastic Fabric Adapter (EFA), que habilita clientes a executar aplicações que exigem altos níveis de comunicação entre nós em grande escala. Essas instâncias oferecem até 1,8 TB de armazenamento SSD baseado em NVMe para aplicações que exigem acesso rápido aos dados armazenados localmente.
Drivers RTX e Gaming
As instâncias G4dn oferecem os drivers NVIDIA RTX e Gaming aos clientes sem custo adicional. É possível usar os drivers RTX para fornecer estações de trabalho virtuais de alta qualidade para uma ampla variedade de fluxos de trabalho visualmente intensos. O driver Gaming oferece gráficos incomparáveis e suporte de computação para o desenvolvimento de jogos.
Instâncias G4ad do Amazon EC2
As instâncias G4ad, alimentadas por AMD Radeon Pro V520 GPUs, oferecem a melhor performance de preço para aplicações com uso intensivo de gráficos na nuvem. Essas instâncias oferecem performance de preço até 45% melhor em comparação com as instâncias G4dn, que já eram as instâncias de custo mais baixo na nuvem, para aplicações gráficas, como estações de trabalho gráficas remotas, transmissão de jogos e renderização que aproveitam APIs padrão do setor, como OpenGL, DirectX e Vulkan. Elas fornecem até 4 GPUs AMD Radeon Pro V520, 64 vCPUs, redes de 25 Gbps e armazenamento SSD baseado em NVMe local de 2,4 TB.
Benefícios
Instâncias de maior performance e menor custo para aplicações com uso intensivo de gráficos
As instâncias G4ad são as instâncias de menor custo na nuvem para aplicações com uso intensivo de gráficos. Elas oferecem performance de preço até 45% superior, incluindo performance gráfica até 40% melhor, em comparação com instâncias comparáveis para aplicações gráficas, como estações de trabalho gráficas remotas, transmissão de jogos e renderização que utilizam APIs padrão do setor, como OpenGL, DirectX e Vulkan
Gerenciamento simplificado de estações de trabalho virtuais com o menor preço da nuvem
As instâncias G4ad permitem aos clientes configurar estações de trabalho virtuais com simulação de alta performance, renderização e recursos de design em minutos, permitindo aos clientes escalar rapidamente. Os clientes podem usar o AMD Radeon Pro Software for Enterprise e o protocolo NICE DCV de exibição remota de alta performance com instâncias G4ad sem custo adicional para gerenciar seus ambientes de estação de trabalho virtual com suporte para até dois monitores 4k por GPU.
Confiabilidade em aplicações de terceiros
A solução gráfica profissional da AMD inclui um extenso processo de certificação e teste de aplicação de provedor independente de software (ISV) chamado Programa de Certificação Day Zero. Isso ajuda a garantir que os desenvolvedores utilizem os recursos mais recentes do AMD Radeon Pro Software for Enterprise combinados com a confiabilidade do software certificado no dia do lançamento do driver.
Recursos
Desenvolvido por GPUs AMD Radeon Pro V520
As GPUs AMD Radeon Pro V520 oferecem aceleração de alta performance para gráficos, como estações de trabalho virtuais, imagens geradas por computador (CGI), transmissão de jogos e criação de conteúdo digital (DCC). Essas GPUs são construídas com base na arquitetura RDNA da AMD que é hipereficiente, com baixa latência e alta CPU para a largura de banda de GPU necessária para permitir experiências de estação de trabalho e jogos de alta qualidade. Com um pipeline gráfico aprimorado, a arquitetura RDNA foi projetada para renderizar seus jogos mais rapidamente com maior performance de tempo.
Armazenamento de instâncias local
As instâncias G4ad oferecem até 2,4 TB de armazenamento NVMe local para acesso rápido aos dados, permitindo aos clientes criar com eficiência conteúdo 3D fotorrealista e de alta resolução para filmes, jogos e experiências AR/VR
Drivers gráficos de nível profissional
As instâncias G4ad fornecem drivers gráficos de nível profissional sem custo adicional. Esses drivers podem ser usados para fornecer a melhor experiência de estação de trabalho virtual para uma grande variedade de fluxos de trabalho visualmente intensivos e gráficos incomparáveis, bem como suporte de computação para o desenvolvimento de jogos.
Histórias de sucesso dos clientes
A Ubitus é uma empresa inovadora líder na construção de tecnologia de jogos em nuvem. Por meio de suas plataformas, os usuários podem aproveitar uma experiência de jogo AAA em qualquer dispositivo, como smartphones, tablets, consoles de jogos, TVs inteligentes e computadores, desde que estejam conectados a uma rede de banda larga.
“A Ubitus aproveitou os recursos de GPU da AWS para formar uma parceria com a IO Interactive para lançar uma versão em nuvem do Hitman 3 para dispositivos de jogos altamente portáteis. Com a introdução das instâncias do Amazon EC2 G4ad, conseguimos ajustar até 50% mais transmissões simultâneas por instância sem alterar nenhum código, o que nos permitiu otimizar nossos custos. A estrutura de custo mais baixo nos permite levar mais jogos como Hitman 3 para jogadores de todo o mundo.”
Wesley Kuo, CEO – Ubitus.
“A Land F/X aproveita a aceleração da GPU para ajudar os profissionais de design e, ao mesmo tempo, maximizar a performance e o custo. A Land F/X estava usando instâncias G4dn no desenvolvimento e com o lançamento de G4ad conseguiu migrar rapidamente”, resultando em uma melhoria de performance de 67% na renderização, enquanto economizava 25% em relação ao uso da GPU anterior.“
Jeremiah Farmer CEO/Desenvolvedor - Land F/X
A Duolingo é uma plataforma gratuita de ensino de idiomas que se tornou a forma mais popular de aprender idiomas online. Os cientistas de aprendizagem de idiomas, engenheiros de machine learning e especialistas em IA da Duolingo usam dados de mais de 300 milhões de alunos para aumentar constantemente a eficácia da plataforma.
"À medida que nossas equipes de ML e pesquisa cresceram, decidimos atualizar nossa infraestrutura de computação existente baseada no Amazon ECS para oferecer suporte aos tipos de instâncias baseadas em GPU Amazon EC2 P3 e G4 para escalar melhor nosso modelo de desenvolvimento. As AMIs otimizadas para Amazon ECS para instâncias de GPU nos ajudaram a colocar o novo cluster em funcionamento muito rapidamente e descobrimos que as instâncias G4 dobraram nossa velocidade de treinamento de ML em comparação com as instâncias P2, levando a uma economia de custo de 33%, enquanto as instâncias P3 quadruplicaram a performance e proporcionaram uma economia de custos de 15%. No geral, as instâncias G4 são adequadas para nossos casos de uso comuns, pois oferecem um bom equilíbrio entre custo e performance, e as instâncias P3 são ideais quando a velocidade adicional é importante para uma workload específica"
Max Blaze, engenheiro de operações em equipe - Duolingo
“Blacknut é o principal serviço independente de jogos em nuvem que oferece ao público em geral uma experiência de “clique e jogue”, em qualquer dispositivo, com base em um catálogo de mais de 500 videogames. Para cumprir nossa missão de fornecer baixa latência, tempos de carregamento rápidos e uma experiência de jogo fluida, precisamos estar localizados o mais próximo possível dos jogadores. Com as instâncias G4dn do EC2, podemos fornecer aos nossos jogadores um tempo médio de carregamento de dez segundos ou menos por jogo, garantindo uma experiência geral de jogo positiva. Também podemos implantar nossa solução em novos mercados em menos de dois meses, e essa reatividade nos permitiu implantar novos parceiros globais todo mês desde 2020, incluindo a Telecom Italia, Swisscom, POST, Drei Austria e Ais na Tailândia. Nosso serviço agora está disponível em mais de 40 mercados.”
Pascal Manchon, CTO da Blacknut
Em 2018, a Snap Inc. (Snap), conhecido por sua aplicação de sistema de mensagens Snapchat, teve uma ideia nova e intrigante: criar uma série de vídeos animados estrelando o Bitmoji de cada usuário, o avatar de desenho animado personalizado que é o recurso de assinatura do Snapchat. A cada semana, a Bitmoji TV lançava novos episódios consistindo de vídeos bobos com roteiro profissional e animados de 3 a 8 minutos nos quais os Bitmojis dos usuários e seus amigos eram as estrelas, fazendo de tudo, desde lutar contra zumbis até competir em baixa gravidade “Moonlympics”. Com as instâncias G4 do Amazon EC2, a Snap conseguiu criar um tipo divertido e ousado de entretenimento personalizado que foi renderizado com rapidez suficiente para milhões de pessoas desfrutarem simultaneamente, mantendo os custos de computação baixos.
"Com as instâncias G4 do Amazon EC2 comparadas às instâncias Amazon EC2 G3, obtivemos um aumento de 50% com um custo 10% mais alto.”
Brad Kotsopolous, engenheiro de software - Snap Inc.
A Nearmap foi fundado em Perth, Austrália, em 2007 e cresceu de uma pequena startup para um líder em geração de imagens digitais. A empresa é especializada na criação de imagens 2D e 3D a partir de fotos aéreas de paisagens, um recurso valioso para uma ampla variedade de setores. Para a Nearmap, o impacto da atualização para instâncias G4 do Amazon EC2 foi imediato e profundo: a empresa conseguiu executar três vezes mais dados pelo mesmo custo do que em instâncias Amazon EC2 G2, em um processo sem esforço e cuja integração parecia perfeita com as ferramentas da AWS que já estava usando.
“Nossos clientes contam conosco para a entrega de modelos altamente precisos de realidade 3D computados com base em fotografias aéreas de vários ângulos sobre áreas de cobertura imensas. Utilizamos aproximadamente 870 mil núcleos de GPU por dia. Anteriormente, executávamos esse pipeline em instâncias G2 do Amazon EC2, mas mudamos para as instâncias G4 do Amazon EC2 e reduzimos os custos em 67%.”
John Corbett, Diretor - Vision Systems
A Untold Studios implantou diversas configurações de estação de trabalho virtual da AWS, incluindo instâncias G4 com GPUs NVIDIA T4 e tecnologia RTX, e que são otimizadas para VFX e fluxos de trabalho de animação. Com opções de instância expandidas, a Untold Studios pode combinar com mais precisão os tipos de máquinas virtuais a workloads específicas, uma abordagem que é benéfica tanto criativa quanto economicamente.
“A G4 teve um grande impacto em como trabalhamos. Podemos atualizar toda uma frota de estações de trabalho com uma linha de código para que os artistas possam trabalhar mais rápido, melhorando a criatividade em tudo o que fazemos.”
Sam Reid, diretor de tecnologia - Untold Studios
Detalhes do produto
Tamanho de instância | GPU | vCPUs | Memória (GiB) | Armazenamento de instâncias (GB) | Largura de banda de rede (Gbps) | Largura de banda do EBS (Gbps) | Preço sob demanda/hora* | Instância reservada por 1 ano – por hora* (Linux) | Instância reservada por 3 anos – por hora* (Linux) | |
G4dn |
||||||||||
VMs com uma GPU | g4dn.xlarge | 1 | 4 | 16 | 1 x 125 SSD NVMe | Até 25 | Até 3,5 | USD 0,526 | USD 0,316 | USD 0,210 |
g4dn.2xlarge | 1 | 8 | 32 | 1 x 225 SSD NVMe | Até 25 | Até 3,5 | USD 0,752 | USD 0,452 | USD 0,300 | |
g4dn.4xlarge | 1 | 16 | 64 | 1 x 225 SSD NVMe | Até 25 | 4,75 | USD 1,204 | USD 0,722 | USD 0,482 | |
g4dn.8xlarge | 1 | 32 | 128 | 1 x 900 SSD NVMe | 50 | 9,5 | USD 2,176 | USD 1,306 | USD 0,870 | |
g4dn.16xlarge | 1 | 64 | 256 | 1 x 900 SSD NVMe | 50 | 9,5 | USD 4,352 | USD 2,612 | USD 1,740 | |
VMs com várias GPUs | g4dn.12xlarge | 4 | 48 | 192 | 1 x 900 SSD NVMe | 50 | 9,5 | USD 3,912 | USD 2,348 | USD 1,564 |
g4dn.metal | 8 | 96 | 384 | 2 x 900 SSD NVMe | 100 | 19 | USD 7,824 | USD 4,694 | USD 3,130 | |
G4ad |
||||||||||
VMs com uma GPU | g4ad.xlarge | 1 | 4 | 16 | 1 x 150 SSD NVMe | Até 10 | Até 3 | USD 0,379 | USD 0,227 | USD 0,178 |
g4ad.2xlarge | 1 | 8 | 32 | 1 x 300 SSD NVMe | Até 10 | Até 3 | USD 0,541 | USD 0,325 | USD 0,254 | |
g4ad.4xlarge | 1 | 16 | 64 | 1 x 600 SSD NVMe | Até 10 | Até 3 | USD 0,867 | USD 0,520 | USD 0,405 | |
VMs com várias GPUs | g4ad.8xlarge | 2 | 32 | 128 | 1 x 1200 SSD NVMe | 15 | 3 | USD 1,734 | USD 1,040 | USD 0,810 |
g4ad.16xlarge | 4 | 64 | 256 | 1 x 2400 SSD NVMe | 25 | 6 | USD 3,468 | USD 2,081 | USD 1,619 |
*Os preços mostrados são para a região Leste dos EUA (Norte da Virgínia) da AWS. Os preços das instâncias reservadas para 1 e 3 anos são para as opções de pagamento “pagamento adiantado parcial” ou para as opções de pagamento "sem pagamento adiantado" de instâncias que não têm a opção “adiantado parcial”.
Comece a usar as instâncias G4dn
Uso de AMIs e contêineres pré-construídos da AWS
Usando as AMIs de aprendizado profundo da Amazon e os Deep Learning Containers, é possível executar rapidamente instâncias do Amazon EC2 que já contenham frameworks de aprendizado profundo comuns, como TensorFlow, PyTorch e MXNet para treinar modelos de IA sofisticados e personalizados, testar novos algoritmos ou aprender novas habilidades e técnicas. Para saber mais, acesse a página do produto AMIs de aprendizado profundo da Amazon ou AWS Deep Learning Containers.
As AMIs de estação de trabalho virtual RTX da NVIDIA oferece suporte à execução de até quatro monitores 4K por GPU para aplicações de visualização. As AMIs de Gaming da NVIDIA renderizam vídeos a 60 FPS e oferecem suporte a execução de um único monitor 4K por GPU.
Construir a sua própria AMI personalizada com drivers NVIDIA
Os drivers do datacenter NVIDIA oferecem a melhor performance para workloads computacionais altamente intensivas, geralmente encontradas em aprendizado profundo, ciência de dados e HPC.
É possível usar os drivers NVIDIA RTX para habilitar o software NVIDIA RTX Virtual Workstation. O RTX vWS oferece suporte para até quatro monitores 4K por GPU. Os drivers Gaming da NVIDIA oferecem suporte a placas gráficas, soluções de jogos e tecnologia de jogos mais avançadas do mundo. Esse driver oferece suporte para um único monitor 4K por GPU.
Para saber mais como instalar esses drivers na sua instância, acesse estes links para Linux e Windows.
Comece a usar as instâncias G4ad
Usar AMIs pré-construídas da AWS
Os drivers do AMD Radeon Pro Software for Enterprise fornecem gráficos de alta performance para estações de trabalho virtuais, transmissão de jogos, renderização e outras aplicações gráficas. Para começar rapidamente, é possível usar AMIs fornecidas pela AWS que incluem o AMD Radeon Pro Software for Enterprise pré-instalado. Essas AMIs estão disponíveis no AMD Radeon Pro Marketplace.
Construir sua própria AMI personalizada com drivers AMD
É possível usar os drivers do AMD Radeon Pro Software for Enterprise para configurar instâncias com gráficos de nível profissional avançados e confiáveis. As estações de trabalho provisionadas com esses drivers são compatíveis com até dois monitores 4K.
Para saber mais como instalar esses drivers na sua instância para criar a sua própria AMI personalizada, acesse estes links para Linux e Windows.
Recursos
Blog AWS Compute
Deep dive on the new Amazon EC2 G4ad instances
Blog da AMD
The ultimate guide: setting up Amazon EC2 G4ad instances (O Guia definitivo: configuração de instâncias G4ad do Amazon EC2)
Blog da AMD
AMD based Amazon EC2 G4ad instances accelerate game engine workflows in the cloud (AMD baseada em instâncias G4ad do Amazon EC2 acelera fluxos de trabalho de mecanismos de jogos na nuvem)
Blog da AMD
Access your data and design anywhere with Autodesk® Inventor® and Amazon EC2 G4ad Instances (Acesse seus dados e projete em qualquer lugar com instâncias G4ad do Amazon EC2 e Autodesk® Inventor®)
Blog da AMD
The ultimate guide: setting up Amazon EC2 G4ad instances (O Guia definitivo: configuração de instâncias G4ad do Amazon EC2)
Comece a usar a AWS
Cadastre-se para obter uma conta da AWS
Aprenda com tutoriais de 10 minutos
Comece a criar com a AWS
Saiba mais sobre os outros tipos de instância do Amazon EC2