Por que optar pelas instâncias Trn2 e UltraServers do Amazon EC2?
As instâncias Trn2 do Amazon EC2, com tecnologia de 16 chips do AWS Trainium2, são projetadas com propósito específico para IA generativa e representam as instâncias do EC2 mais avançadas para treinar e implantar modelos com centenas de bilhões a trilhões de parâmetros. As instâncias Trn2 fornecem uma performance de preço de 30 a 40% superior em comparação com a geração atual das instâncias P5e e P5en do EC2 que são baseadas em GPU. Com as instâncias Trn2, é possível obter uma performance de treinamento e de inferência de última geração, ao mesmo tempo em que reduz custos. Isso possibilita diminuir o tempo de treinamento, iterar mais rapidamente e fornecer experiências em tempo real com tecnologia de IA. É possível usar as instâncias Trn2 para treinar e implantar modelos, incluindo grandes modelos de linguagem (LLMs), modelos multimodais e transformadores de difusão, para o desenvolvimento de aplicações de IA generativa da próxima geração.
Para reduzir os tempos de treinamento e fornecer tempos de resposta revolucionários (latência por token) nos modelos mais avançados e complexos pode ser necessário mais recursos de computação e memória do que uma única instância é capaz de disponibilizar. As instâncias Trn2 UltraServers usam o NeuronLink, nossa interconexão proprietária “chip-to-chip”, para conectar 64 chips do Trainium2 em quatro instâncias Trn2, quadruplicando a capacidade de processamento, memória e largura de banda da rede disponíveis em um único nó. Isso fornece uma performance revolucionária na AWS para workloads de aprendizado profundo e de IA generativa. Para tarefas de inferência, os servidores UltraServers contribuem para proporcionar tempos de resposta de ponta, garantindo as melhores experiências em tempo real. Para tarefas de treinamento, os UltraServers aumentam a velocidade e a eficiência do treinamento de modelos com uma comunicação coletiva mais rápida para o paralelismo de modelos, em comparação com as instâncias autônomas.
É possível começar a usar as instâncias Trn2 e as instâncias Trn2 UltraServers com suporte nativo para estruturas conhecidas de machine learning (ML), como PyTorch e JAX.
Benefícios
Recursos
Depoimentos de clientes e de parceiros
A seguir, apresentamos exemplos de como clientes e parceiros pretendem atingir suas metas de negócios com as instâncias Trn2 do Amazon EC2.
-
Anthropic
-
Databricks
-
poolside
-
Itaú Unibanco
O Itaú Unibanco tem como propósito melhorar a relação das pessoas com o dinheiro, promovendo um impacto positivo em suas vidas e ampliando suas oportunidades de transformação. No Itaú Unibanco, acreditamos que cada cliente é único e nos concentramos em atender às necessidades deles por meio de jornadas digitais intuitivas, que usam a capacidade da IA para se adaptar constantemente aos hábitos de consumo.
-
NinjaTech AI
O Ninja trata-se um agente de IA completo para a obtenção de produtividade ilimitada: uma assinatura simples e acesso ilimitado aos melhores modelos de IA do mundo, além de habilidades avançadas, como: produção textual, programação, geração de ideias, criação de imagens e pesquisa on-line. O Ninja é uma plataforma com capacidades de agentes e disponibiliza o “SuperAgent”, que emprega um conjunto de agentes com precisão de alto nível, comparável aos modelos de base mais avançados e superando-os em determinadas categorias. A tecnologia Agentic do Ninja requer aceleradores de máxima performance para proporcionar as experiências em tempo real únicas que nossos clientes demandam.
-
Ricoh
A equipe de machine learning da RICOH desenvolve soluções para o ambiente de trabalho e serviços de transformação digital projetados para gerenciar e otimizar o fluxo de informações em nossas soluções empresariais.
-
PyTorch
-
Refact.ai
A Refact.ai disponibiliza ferramentas avançadas de IA, como o preenchimento automático de código baseado na geração aumentada via recuperação (RAG), fornecendo sugestões mais precisas, e um chat contextual que usa tanto modelos proprietários quanto de código aberto.
-
Karakuri Inc.
-
Stockmark Inc.
-
Brave
-
Anyscale
A Anyscale é a responsável pelo Ray, um mecanismo de computação baseado em IA que impulsiona iniciativas de machine learning e IA generativa para empresas. Com a plataforma unificada de IA da Anyscale, orientada pelo RayTurbo, os clientes experimentam até 4,5 vezes mais rapidez no processamento de dados, uma redução de 10 vezes no custo de inferência em lote com LLMs, 5 vezes mais agilidade na escalabilidade, 12 vezes mais rapidez nas iterações e uma economia de 50% nos custos de inferência de modelos on-line, ao otimizar a utilização dos recursos.
-
Datadog
-
Hugging Face
-
Lightning AI
A Lightning AI, criadora do PyTorch Lightning e do Lightning Studios, disponibiliza a plataforma de desenvolvimento de IA mais intuitiva e completa para IA de nível empresarial. A Lightning fornece ferramentas de código completo, de baixo código e sem código para o desenvolvimento de agentes, aplicações de IA e soluções de IA generativa, com velocidade característica das soluções da Lightning. Projetada para fornecer flexibilidade, a solução funciona sem complicações na nuvem que você usa ou na nossa, aproveitando a experiência e o suporte de uma comunidade de desenvolvedores com mais de 3 milhões de integrantes.
-
Domino Data Lab
A Domino orquestra todos os artefatos de ciência de dados, incluindo infraestrutura, dados e serviços na AWS em todos os ambientes, complementando o Amazon SageMaker com recursos de governança e colaboração para apoiar equipes corporativas de ciência de dados. O Domino está disponível no AWS Marketplace como SaaS ou autogerenciado.
Conceitos básicos
Detalhes do produto
Tamanho de instância | Disponível no EC2 UltraServers | Chips Trainium2 | Memória do acelerador |
vCPUs | Memória (TB) |
Armazenamento de instâncias (TB) | Largura de banda da rede (Tbps) | Largura de banda do EBS (Gbps) |
trn2.48xlarge | Não | 16 | 1,5 TB | 192 | 2 TB | 4 x 1,92 SSD NVMe | 3.2 | 80 |
trn2u.48xlarge | Sim (pré-visualização) | 16 | 1,5 TB | 192 | 2 TB | 4 x 1,92 SSD NVMe | 3.2 | 80 |