Perché scegliere le istanze P3 di Amazon EC2?
Le istanze P3 di Amazon EC2 forniscono elevate prestazioni di calcolo nel cloud con fino a 8 GPU Tensor Core NVIDIA® V100 e fino a 100 GB/s di throughput di rete per applicazioni di machine learning e HPC. Queste istanze offrono fino a un petaflop di prestazioni a precisione mista per istanza che accelera significativamente l’apprendimento automatico e le applicazioni di elaborazione ad alte prestazioni. Le istanze P3 di Amazon EC2 velocizzano in modo significativo i tempi di addestramento per l’apprendimento automatico, riducendoli da giorni a minuti, e aumentano il numero di simulazioni completate per il calcolo ad alte prestazioni di 3-4 volte.
Con una larghezza di banda di rete fino a quattro volte superiore rispetto alle istanze P3.16xlarge, le istanze P3dn.24xlarge di Amazon EC2 sono le nuove arrivate nella famiglia P3, ottimizzata per le applicazioni di machine learning e HPC distribuite. Queste istanze offrono fino a 100 Gb/s di velocità effettiva di rete, 96 vCPU Intel® Xeon® scalabile (Skylake), 8 GPU Tensor Core NVIDIA® V100 con 32 GB di memoria ciascuna e 1,8 TB di archiviazione SSD locale basata su NVMe. Le istanze P3dn.24xlarge supportano anche Elastic Fabric Adapter (EFA) che accelera le applicazioni distribuite di machine learning che utilizzano NVIDIA Collective Communications Library (NCCL). EFA è in grado di ridimensionarsi a migliaia di GPU, migliorando sensibilmente il throughput e la scalabilità dei modelli di formazione di deep learning, per ottenere risultati più rapidi.
Panoramica delle istanze P3 di Amazon EC2
Vantaggi
Testimonianze dei clienti
Ecco alcuni esempi di come clienti e partner hanno raggiunto i loro obiettivi aziendali con le istanze Amazon EC2 P3.
-
Airbnb
In Airbnb, utilizziamo l’apprendimento automatico per ottimizzare le raccomandazioni di ricerca e migliorare le linee guida dinamiche sui prezzi per i proprietari: fattori che si traducono in maggiori conversioni in prenotazioni. Con le istanze P3 di Amazon EC2, Airbnb ha la possibilità di eseguire carichi di lavoro di addestramento più rapidi, che ci permettono di eseguire maggiori iterazioni, costruire modelli di machine learning migliori e ridurre i costi.
-
Celgene
Celgene è un'azienda biotecnologica globale che sviluppa terapie mirate abbinate alla terapia del paziente. L'azienda esegue i suoi carichi di lavoro HPC per il sequenziamento del genoma e le simulazioni chimiche di ultima generazione sulle istanze P3 di Amazon EC2. Con questa potenza di calcolo, Celgene è in grado di addestrare modelli di deep learning capaci di distinguere le cellule maligne da quelle benigne. Prima di utilizzare le istanze P3, occorrevano due mesi per eseguire attività computazionali su larga scala; oggi sono sufficienti quattro ore. La tecnologia AWS ha consentito a Celgene di accelerare lo sviluppo di terapie farmacologiche per i tumori e le patologie infiammatorie.
-
Hyperconnect
Hyperconnect è specializzata nell'applicazione di nuove tecnologie basate sul machine learning per l'elaborazione di immagini e video ed è stata la prima azienda a sviluppare webRTC per piattaforme mobili.
-
NerdWallet
NerdWallet è una start-up di finanza personale che fornisce strumenti e consigli ai suoi clienti per estinguere facilmente i debiti, scegliere i migliori prodotti e servizi finanziari e portare a termine grandi obiettivi, come comprare una casa o risparmiare per la pensione. L'azienda si basa principalmente su processi di data science e machine learning (ML) per fornire ai clienti prodotti finanziari personalizzati.
-
PathWise Solutions Group
Leader nella fornitura di soluzioni di sistemi di qualità, PathWise di Aon è una suite applicativa SaaS basata sul cloud orientata alla modellazione di sistemi di gestione del rischio aziendale che fornisce velocità, affidabilità, sicurezza e servizi on demand a una clientela variegata.
-
Pinterest
Pinterest utilizza la formazione di precisione mista nelle istanze P3 in AWS per accelerare la formazione dei modelli di deep learning e sfrutta inoltre queste istanze per ottenere un'inferenza più rapida di tali modelli e abilitare un'esperienza di rilevamento rapida e unica per gli utenti. Pinterest si serve di PinSage, realizzato con PyTorch in AWS. Questo modello di AI raggruppa le immagini in base a determinati temi. Con 3 miliardi di immagini nella piattaforma, esistono 18 miliardi di associazioni diverse che le connettono. Tali associazioni consentono a Pinterest di contestualizzare temi e stilli e di produrre un'esperienza utente ulteriormente personalizzata.
-
Salesforce
Salesforce sta utilizzando l’apprendimento automatico per alimentare Einstein Vision: questo consente agli sviluppatori di sfruttare la potenza del riconoscimento delle immagini in casi d’uso tra cui la ricerca visiva, il rilevamento del marchio e l’identificazione del prodotto. Le istanze P3 di Amazon EC2 consentono agli sviluppatori di formare, in modo rapido, modelli di apprendimento automatico che consentano di raggiungere rapidamente gli obiettivi di apprendimento automatico.
-
Schrodinger
Schrodinger utilizza il computing ad alte prestazioni (HPC) per sviluppare modelli predittivi finalizzati a estendere la portata della scoperta e dell’ottimizzazione e a offrire, ai propri clienti, la possibilità di commercializzare i farmaci salvavita in modo più rapido. Le istanze P3 di Amazon EC2 consentono a Schrodinger di eseguire, in un giorno, quattro volte il numero di simulazioni che otterrebbe con le istanze P2.
-
Subtle Medical
Subtle Medical è un'azienda tecnologica nel settore sanitario che lavora per migliorare l'efficienza della diagnostica per immagini e l'esperienza del paziente con soluzioni innovative di deep learning. Il suo team è composto di illustri scienziati di immagini, radiologi e esperti di IA laureati presso università come Stanford, MIT, MD Anderson e altre ancora.
-
Western Digital
Western Digital utilizza HPC per eseguire decine di migliaia di simulazioni che includono scienze dei materiali, flussi termici, magnetica e trasferimento dei dati, per migliorare le prestazioni e la qualità delle soluzioni delle unità hardware e di storage. Basate su test precoci, le istanze P3 consentono ai team di progettazione di eseguire simulazioni almeno tre volte più velocemente rispetto alle soluzioni precedentemente implementate.
Istanze P3 di Amazon EC2 e Amazon SageMaker
Istanze P3 di Amazon EC2 e AMI di deep learning di AWS
Ambienti di sviluppo preconfigurati per creare subito applicazioni di apprendimento profondo
Le AMI di deep learning di AWS rappresentano un'alternativa ad Amazon SageMaker per gli sviluppatori con requisiti particolari; inoltre, forniscono a professionisti e ricercatori di machine learning l'infrastruttura e gli strumenti per velocizzare il deep learning nel cloud su qualsiasi scala. È possibile lanciare rapidamente istanze P3 di Amazon EC2 con popolari framework preinstallati di deep learning, tra cui TensorFlow, PyTorch, Apache MXNet, Microsoft Cognitive Toolkit, Caffe, Caffe2, Theano, Torch, Chainer, Gluon e Keras per addestrare modelli di IA sofisticati e personalizzati, sperimentare con nuovi algoritmi o apprendere nuove competenze e tecniche. Ulteriori informazioni
Istanze P3 di Amazon EC2 e computing ad alte prestazioni
Risolvere problemi complessi di calcolo e ottenere nuove informazioni importanti utilizzando la potenza di HPC su AWS
Le istanze P3 di Amazon EC2 P3 sono una piattaforma ideale per eseguire simulazioni ingegneristiche, finanza computazionale, analisi sismiche, modellistica molecolare, genomica, renderizzazione e altri carichi di lavoro di elaborazione GPU. Il Computing ad alte prestazioni (HPC) consente agli scienziati e ai tecnici di risolvere problemi complessi che richiedono un’elaborazione intensiva. Le applicazioni HPC spesso richiedono prestazioni di rete elevate, storage veloce, grandi quantità di memoria e funzioni di elaborazione di alto livello o tutte queste caratteristiche insieme. AWS permette di migliorare la velocità di ricerca e ridurre il tempo necessario per ottenere risultati grazie all’esecuzione di HPC nel cloud e all’utilizzo di un numero di attività in parallelo che non sarebbero praticabili nella maggior parte degli ambienti locali. Ad esempio, le istanze P3dn.24xlarge supportano Elastic Fabric Adapter (EFA), che consente alle applicazioni HPC che utilizzano Message Passing Interface (MPI) di ridimensionarsi a migliaia di GPU. AWS aiuta a ridurre i costi fornendo soluzioni ottimizzate per specifiche applicazioni senza grandi investimenti di capitali iniziali. Ulteriori informazioni
Supporto per NVIDIA RTX Virtual Workstation
Le AMI NVIDIA RTX Virtual Workstation offrono prestazioni grafiche elevate grazie alle potenti istanze P3 con GPU NVIDIA Volta V100 in esecuzione nel cloud AWS. Queste AMI dispongono del software di grafica GPU NVIDIA più recente preinstallato insieme ai driver RTX più aggiornati e alle certificazioni NVIDIA ISV con supporto per un massimo di quattro risoluzioni desktop 4K. Le istanze P3 con GPU NVIDIA V100 combinate con le vWS RTX offrono una workstation ad alte prestazioni nel cloud con fino a 32 GB di memoria GPU, tracciamento a raggi rapidi e rendering alimentato da IA - Intelligenza Artificiale.
Le nuove AMI sono disponibili su AWS Marketplace e offrono supporto per Windows Server 2016 e Windows Server 2019.
Istanze P3dn.24xlarge di Amazon EC2
Dettagli prodotto istanza P3 di Amazon EC2
Dimensioni istanza | GPU – Tesla V100 | Peer to peer GPU | Memoria GPU (GB) | vCPU | Memoria (GB) | Larghezza di banda di rete | Larghezza di banda EBS | Prezzo on demand/h* | Istanza riservata effettiva di 1 anno all’ora* | Istanza riservata effettiva di 3 anno all’ora* |
---|---|---|---|---|---|---|---|---|---|---|
p3.2xlarge | 1 | N/D | 16 | 8 | 61 | Fino a 10 Gb/s | 1,5 Gbps | 3,06 USD | 1,99 USD | 1,05 USD |
p3.8xlarge | 4 |
NVLink | 64 | 32 | 244 | 10 Gbps | 7 Gbps | 12,24 USD | 7,96 USD | 4,19 USD |
p3.16xlarge | 8 | NVLink | 128 | 64 | 488 | 25 Gbps | 14 Gbps | 24,48 USD | 15,91 USD | 8,39 USD |
p3dn.24xlarge | 8 | NVLink | 256 | 96 | 768 | 100 Gb/s | 19 Gb/s | 31,218 USD | 18,30 USD | 9,64 USD |
* - I prezzi sono calcolati per Linux/Unix nella regione AWS Stati Uniti orientali (Virginia settentrionale) e arrotondati al centesimo più vicino. Per ulteriori dettagli, consulta la pagina dei prezzi di Amazon EC2.
I clienti possono ora acquistare le istanze P3 come Istanze on demand, istanze riservate, istanze Spot e host dedicati.
Fatturazione al secondo
Uno dei molti vantaggi del cloud computing è la natura elastica delle risorse di provisioning o deprovisioning a seconda delle esigenze. Riducendo l’utilizzo fino al secondo, consentiamo ai clienti di aumentare la loro elasticità, risparmiare denaro e consentire loro di ottimizzare l’allocazione delle risorse verso il raggiungimento degli obiettivi di apprendimento automatico.
Prezzi delle istanze riservate
Le istanze riservate offrono una notevole riduzione (fino al 75%) rispetto ai prezzi delle istanze on demand. L’acquisto di un’istanza riservata in una zona di disponibilità specifica consente di prenotare capacità in tale zona, per garantire il corretto avvio di istanze esattamente nel momento in cui servono.
Prezzi Spot
I costi addebitati per le istanze Spot saranno quelli del prezzo Spot in corso di validità durante l'esecuzione delle istanze. I prezzi delle istanze Spot sono stabiliti da Amazon EC2 e regolati in modo graduale in base ai trend a lungo termine di offerta e domanda di capacità inutilizzata dell'istanza Spot. Le istanze Spot sono disponibili con prezzi fino al 90% inferiori rispetto ai prezzi on demand.
La disponibilità globale più ampia
Le istanze P3.2xlarge, P3.8xlarge e P3.16xlarge di Amazon EC2 sono disponibili in 14 regioni AWS e forniscono la flessibilità necessaria per formare e distribuire i modelli di apprendimento automatico dove si trovano i dati. Le regioni AWS disponibili per P3 sono: Stati Uniti orientali (Virginia), Stati Uniti orientali (Ohio), Stati Uniti occidentali (Oregon), Canada (Centrale), UE (Irlanda), UE (Francoforte), UE (Londra), Asia e Pacifico (Tokyo), Asia e Pacifico (Seoul), Asia e Pacifico (Sydney), Asia e Pacifico (Singapore), Cina (Pechino), Cina (Ningxia) e GovCloud (Stati Uniti occidentali).
Le istanze P3dn.24xlarge sono disponibili nelle regioni AWS Asia Pacifico (Tokyo), Europa (Irlanda), Stati Uniti orientali (Virginia settentrionale), Stati Uniti occidentali (Oregon), GovCloud (Stati Uniti occidentali) e GovCloud (Stati Uniti orientali).
Inizia a usare le istanze P3 di Amazon EC2 per il machine learning
Per iniziare in pochi minuti, scopri di più su Amazon SageMaker o usa l'AMI di deep learning in AWS con popolari framework preinstallati di deep learning, ad esempio Caffe2 e MXNet. In alternativa, puoi anche usare l'AMI NVIDIA con driver GPU e kit di strumenti CUDA preinstallato.