Инстансы Amazon EC2 G4

Самые экономичные в отрасли инстансы на базе графических процессоров для логического вывода на базе машинного обучения и приложений с интенсивным использованием графики

Какие преимущества дают инстансы Amazon EC2 G4?

Инстансы Amazon EC2 G4 – это самые экономичные и универсальные в отрасли инстансы с графическими процессорами для развертывания моделей машинного обучения, предназначенных для классификации изображений, обнаружения объектов и распознавания речи, а также для ресурсоемких графических приложений, таких как удаленные графические рабочие станции, потоковая передача игр и рендеринг графики. Инстансы G4 предлагаются с разными графическими процессорами NVIDIA (G4dn) или AMD (G4ad).

Инстансы G4dn оснащены графическими процессорами NVIDIA T4 и специальными процессорами Intel Cascade Lake, а также оптимизированы для выполнения машинного обучения в небольших масштабах и логического вывода. Эти инстансы обеспечивают высокую производительность для приложений с интенсивным использованием графики, например удаленных рабочих станций, потоковой передачи игр и рендеринга графики. Эти инстансы также идеально подходят для тех клиентов, которые предпочитают использовать программное обеспечение NVIDIA, в том числе виртуальную рабочую станцию RTX или библиотеки CUDA, cuDNN, NVENC и так далее.

Инстансы G4ad оснащены новейшими графическими процессорами AMD Radeon Pro V520 и процессорами AMD EPYC второго поколения. Эти инстансы обеспечивают наилучшее соотношение цены и производительности среди всех облачных предложений для графических приложений, таких как удаленные рабочие станции, потоковая передача игр и рендеринг графики. По сравнению с другими инстансами аналогичного уровня они обеспечивают на 45 % лучшее соотношение цены и производительности для приложений с интенсивным использованием графики.

Новые инстансы Amazon EC2 G4ad

Инстансы Amazon EC2 G4dn

Инстансы G4dn на базе графических процессоров NVIDIA T4 – это самые недорогие в облаке инстансы на базе графических процессоров, предназначенные для машинного обучения в небольших масштабах и получения логических выводов. Они также обеспечивают высокую производительность и являются экономичным решением для графических приложений, оптимизированных для использования графических процессоров NVIDIA с библиотеками NVIDIA, таких как CUDA, cuDNN или NVENC. Они могут иметь до 8-ми графических процессоров NVIDIA T4, до 96 виртуальных процессоров, сетевое подключение до 100 Гбит/с и локальный твердотельный накопитель на базе NVMe емкостью до 1,8 ТБ. Предлагается также вариант инстансов без операционной системы.

Преимущества G4dn

Инстансы G4dn оснащены графическими процессорами NVIDIA T4, которые обеспечивают в 40 раз более высокую пропускную способность (с низкой задержкой) по сравнению с центральными процессорами, что позволяет обслуживать больше запросов в режиме реального времени. Кроме того, инстансы G4dn оптимизированы таким образом, чтобы с наименьшими затратами предоставлять логический вывод на базе машинного обучения, поскольку эта статья расходов может составлять до 90 % всех эксплуатационных расходов в проектах машинного обучения.

Инстансы G4dn также пригодны для заданий обучения моделей машинного обучения небольшого или стартового уровня, если для предприятия или учреждения не очень важна скорость обучения. Инстансы G4dn обеспечивают производительность до 65 терафлопс для типа данных FP16 и являются отличным решением для небольших заданий обучения.

Инстансы G4dn обеспечивают производительность графических вычислений до 1,8 раз выше и возможность транскодирования видео до 2 раз выше по сравнению с инстансами G3 предыдущего поколения. Заказчики могут настроить виртуальные рабочие станции с доступом к рабочим станциям NVIDIA RTX без дополнительной оплаты.

Характеристики G4dn

Графические процессоры NVIDIA T4 ускоряют выполнение разнообразных облачных рабочих нагрузок, включая процессы обучения и логического вывода на базе глубокого обучения, а также графические вычисления. Графические процессоры T4, основанные на новой архитектуре NVIDIA Turing, оснащены высокоточными ядрами Turing Tensor Cores и новыми ядрами RT. Технология Turing Tensor Core с мультипрецизионными вычислениями для машинного обучения обеспечивает непревзойденную производительность для типов данных FP32, FP16, INT8 и INT4. Она обеспечивает до 9,3 раза более высокую производительность по сравнению с традиционными процессорами для задач обучения, и до 36 раз – для задач логического вывода.

Инстансы G4dn обеспечивают скорость сети до 100 Гбит/с для приложений, которым важна высокая пропускная способность. Также инстансы G4dn поддерживают Интерфейс эластичной матрицы (EFA), который позволяет клиентам в большом масштабе запускать приложения с интенсивным взаимодействием между узлами. Эти инстансы предоставляют твердотельный накопитель на базе NVMe емкостью до 1,8 ТБ для приложений, которым важен быстрый доступ к локально хранящимся данным.

Инстансы G4dn без дополнительной оплаты предоставляют клиентам драйверы RTX и игровые драйверы NVIDIA. Драйверы RTX позволяют создавать высококачественные виртуальные рабочие станции для широкого спектра рабочих потоков с интенсивным использованием визуальной информации. Игровые драйверы обеспечивают непревзойденную графическую и вычислительную поддержку для разработки игр.

Инстансы G4ad Amazon EC2

Инстансы G4ad на основе графических процессоров AMD Radeon Pro V520 предлагают наилучшее сочетание цены и производительности для приложений с интенсивным использованием графики в облаке. У этих инстансов соотношение цены и производительности на 45 % лучше, чем у инстансов G4dn, которые до этого момента были самыми дешевыми инстансами в облаке, предназначенными для приложений с использованием графики, таких как удаленные графические рабочие станции, потоковое вещание игр и рендеринг графики, с поддержкой стандартных отраслевых API, например OpenGL, DirectX и Vulkan. Они содержат до 4 графических процессоров AMD Radeon Pro V520, 64 виртуальных процессора, сеть 25 Гбит/с и локальный SSD на базе NVMe емкостью 2,4 ТБ.

Преимущества G4ad

Инстансы G4ad – это самые экономичные инстансы в облаке для приложений с интенсивным использованием графики. Соотношение цены и производительности у них на 45 % лучше, а производительность графических вычислений на 40 % выше, чем у любых сопоставимых инстансов для приложений с использованием графики, таких как удаленные графические рабочие станции, потоковое вещание игр и рендеринг графики, с поддержкой стандартных отраслевых API, например OpenGL, DirectX и Vulkan.

Инстансы G4ad позволяют клиентам за считаные минуты настраивать виртуальные рабочие станции с возможностями для высокопроизводительного моделирования, визуализации и проектирования, чтобы клиенты могли быстро масштабировать свои системы. Клиенты могут использовать AMD Radeon Pro Software for Enterprise и высокопроизводительный протокол удаленного отображения NICE DCV в сочетании с инстансами G4ad без дополнительных затрат на управление средами виртуальных рабочих станций с поддержкой двух мониторов с разрешением 4К на каждый графический процессор.

Профессиональное графическое решение AMD включает процесс тщательного тестирования и сертификации приложений вендоров ПО (ISV), который известен под названием Day Zero Certification Program. Он позволяет убедиться, что разработчики с первого же дня выпуска драйвера используют самые новые функции AMD Radeon Pro Software for Enterprise в сочетании с надежностью сертифицированного программного обеспечения.

Характеристики G4ad

Графические процессоры AMD Radeon Pro V520 обеспечивают высокую производительность графических вычислений для таких задач, как виртуальные рабочие станции, компьютерная генерация изображений (CGI), потоковая передача игр и создание цифрового контента (DCC). Эти графические процессоры основаны на сверхэффективной архитектуре AMD RDNA, которая отличается низкой задержкой и высокой скоростью передачи данных между центральными и графическими процессорами, что важно для обеспечения высокого качества взаимодействия с рабочими станциями и играми. Архитектура RDNA получила улучшенный графическому конвейер, чтобы игры обрабатывались быстрее и производительность повышалась.

Инстансы G4ad предоставляют локальное хранилище NVMe емкостью до 2,4 ТБ, обеспечивая быстрый доступ к данным, что позволяет клиентам эффективно создавать фотореалистичный трехмерный контент высокого разрешения для фильмов, игр, дополненной и виртуальной реальности.

Инстансы G4ad предоставляют графические драйверы профессионального уровня без дополнительной оплаты. Эти драйверы можно использовать для оптимизации работы виртуальной рабочей станции при выполнении широкого спектра рабочих процессов с высокой нагрузкой на графическую систему. Также они обеспечивают непревзойденную поддержку графических и традиционных вычислений при разработке игр.

Отзывы клиентов и партнеров

Здесь представлены несколько примеров того, как наши клиенты и партнеры достигли бизнес-целей с помощью инстансов Amazon EC2 G4.

  • Ubitus

    Инновационная компания Ubitus считается лидером в создании облачных игровых технологий. На платформах этой компании пользователи могут наслаждаться играми класса AAA на любом устройстве, включая смартфоны, планшеты, игровые консоли, смарт-телевизоры и компьютеры. Нужно лишь широкополосное подключение к сети.

    Ознакомиться с примером использования

    Компания Ubitus использовала возможности графических процессоров на AWS, чтобы в сотрудничестве с IO Interactive выпустить облачную версию Hitman 3 для портативного игрового устройства. С появлением инстансов Amazon EC2 G4ad мы смогли разместить на 50 % больше параллельных потоков на каждый инстанс без изменения кода, что помогло нам оптимизировать затраты. Более дешевая структура позволяет нам предложить геймерам по всему миру больше новых игр, таких как Hitman 3.

    Уэсли Куо, генеральный директор Ubitus
  • Land F/X

    Компания Land F/X использует ускорение на графических процессорах, чтобы помочь специалистам по проектированию максимально увеличить соотношение производительности и затрат. Компания Land F/X использовала инстансы G4dn при разработке, а при появлении G4ad ей удалось быстро перейти на них, повысив производительность рендеринга на 67 % и снизив затраты на 25 % по сравнению с использовавшимся ранее графическим процессором.

    Джеремайя Фармер, генеральный директор и разработчик, компания Land F/X
  • Duolingo

    Duolingo – это бесплатная образовательная платформа, которая стала самым популярным способом онлайн-изучения языков. Лингвисты, инженеры по машинному обучению и специалисты по искусственному интеллекту Duolingo используют данные более 300 миллионов учащихся для постоянного повышения эффективности платформы.

    Ознакомиться с примером использования

    По мере роста наших отделов машинного обучения и исследования мы решили обновить существующую вычислительную инфраструктуру на базе Amazon ECS, включив в нее инстансы Amazon EC2 P3 и G4 на базе графических процессоров, чтобы лучше масштабировать нашу модель разработки. Оптимизированные образы Amazon ECS AMI для инстансов с графическим процессорами помогли нам очень быстро запустить новый кластер. Мы обнаружили, что инстансы G4 удвоили скорость задач по машинному обучению по сравнению с инстансами P2, что позволило сократить расходы на 33 %. Инстансы P3 увеличили производительность еще в четыре раза и снизили затраты на 15 %. В целом, инстансы G4 подходят для наших типичных сценариев использования, поскольку обеспечивают хорошее соотношение стоимости и производительности, а инстансы P3 идеальны для тех случаев, когда дополнительная скорость критически важна для конкретной рабочей нагрузки.

    Макс Блейз, штатный инженер по эксплуатации в Duolingo
  • Blacknut

    Ведущий независимый сервис облачных игр Blacknut предоставляет широкой публике возможность играть на любом устройстве в режиме «нажми и играй» в любую из более 500 видеоигр, выбирая их из каталога. Чтобы выполнить поставленную задачу (низкие задержки, быстрая загрузка и отзывчивый игровой интерфейс), нам было важно находиться как можно ближе к игрокам. С помощью инстансов EC2 G4dn мы можем обеспечить игрокам среднее время загрузки игры не более 10 секунд, что гарантирует положительные впечатления. Мы также можем выводить наше решение на новые рынки менее чем за 2 месяца, и такая оперативность позволила нам ежемесячно, начиная с 2020 года, привлекать новых глобальных партнеров, в числе которых Telecom Italia, Swisscom, POST, Drei Austria и Ais (Таиланд). Сейчас наш сервис доступен более чем на 40 рынках.

    Паскаль Маншон, технический директор Blacknut
  • Snap

    В 2018 году компания Snap Inc. (Snap), известная своим приложением Snapchat для обмена сообщениями, решила реализовать новую интересную идею: создать серию анимационных видеороликов с участием мультяшного аватара Bitmoji, который персонализируется для каждого пользователя – это фирменная фишка приложения Snapchat. Каждую неделю на Bitmoji TV выходили новые серии продолжительностью от 3 до 8 минут с непритязательным содержанием, написанных и анимированных профессионалами. В этих видео главную роль играли Bitmoji конкретного пользователя и его друзей: иногда им предстояло победить зомби, а в другой раз – принять участие в «Лунлимпийских играх» в условиях низкой гравитации. С помощью инстансов Amazon EC2 G4 компания Snap смогла создать увлекательное и смелое персонализированное развлечение, которое можно создавать одновременно для миллионов пользователей при невысоких затратах на вычислительные ресурсы.

    Ознакомиться с примером использования

    При использовании инстансов Amazon EC2 G4 мы получили прирост производительности на 50 % по сравнению с инстансами Amazon EC2 G3, а затраты увеличились всего на 10 %.

    Брэд Коцопулос, инженер ПО, Snap Inc.
  • Nearmap

    Компания Nearmap была основана в Перте, Австралия, в 2007 году, и из небольшого стартапа превратилась в лидера в области цифровой обработки изображений. Компания специализируется на создании двухмерных и трехмерных изображений ландшафтов на основе аэрофотоснимков, что очень востребовано в самых разных отраслях. Для компании Nearmap переход на инстансы Amazon EC2 G4 принес немедленный и ощутимый эффект. Они смогли за те же деньги обрабатывать в три раза больше данных, чем ранее на инстансах Amazon EC2 G2. Переход оказался очень простым и интеграция с уже используемыми инструментами AWS не доставила ни малейших проблем.

    Ознакомиться с примером использования

    Наши клиенты рассчитывают на то, что мы предоставляем высокоточные 3D-модели реальности, рассчитанные на основе многоугольной аэрофотосъемки в больших зонах покрытия. Мы используем около 870 тысяч ядер графических процессоров каждый день. Раньше мы запускали этот конвейер на инстансах Amazon EC2 G2, но потом перешли на инстансы Amazon EC2 G4 и снизили затраты на 67 %.

    Джон Корбетт, директор по системам машинного зрения
  • Untold Studios

    Untold Studios развернула несколько конфигураций виртуальных рабочих станций AWS, в том числе на инстансах G4 с графическими процессорами NVIDIA T4 и технологией RTX, оптимизированные для рабочих процессов обработки визуальных эффектов и анимации. Благодаря широкому выбору инстансов компания Untold Studios смогла очень точно сопоставить типы виртуальных машин с конкретными рабочими нагрузками, что очень полезно и для творчества, и для бюджета.

    G4 оказали огромное влияние на нашу работу. Мы можем одной строкой кода модернизировать целый парк рабочих станций, чтобы художники могли работать быстрее и развивать творческий потенциал во всем, что мы делаем.

    Сэм Рид, руководитель отдела технологий, Untold Studios
  • Hive VFX

    Рабочие станции изначально были развернуты с использованием инстансов Amazon Elastic Compute Cloud (Amazon EC2) G3. Но когда появились инстансы Amazon EC2 G4 на базе графических процессоров NVIDIA T4 Tensor Core (это новейшее поколение графических процессоров NVIDIA) с поддержкой самой современной технологии NVIDIA RTX для высокопроизводительного моделирования, рендеринга и проектирования, Hive VFX смогла легко и быстро обновить систему.

    Переход с G3 на G4 прошел очень легко, и уже через несколько минут наши художники получили доступ к графическим процессорам NVIDIA нового поколения с самыми инновационными технологиями для поддержки компьютерной графики и повышения производительности. Производительность рабочих станций, которые мы получаем на инстансах G4, превосходит даже возможности некоторых крупных студий. Этого более чем достаточно для удовлетворения наших потребностей.

    Берни Кимбахер, основатель Hive VFX
  • Humen

    В рекламном ролике Doritos, посвященном Суперкубку 2020 года, был показан танец 75-летнего актера Сэма Эллиотта с 21-летним рэпером Lil Nas X. Этот танцевальный батл стал возможным благодаря технологии искусственного интеллекта, разработанной стартапом Humen в рамках проекта Sway. Эта небольшая компания смогла заключить партнерское соглашение с мегакорпорацией Doritos в рамках кампании по поддержке Суперкубка. Ее приложение Sway стало лидером продаж в App Store, не без поддержки платформы Amazon Web Services (AWS). Чтобы справиться с колоссальной нагрузкой по запуску приложения с интенсивным использованием графики во время проведения Суперкубка, компания Humen применила инстансы Amazon Elastic Compute Cloud (Amazon EC2) G4, которые помогли добиться превосходных результатов.

    Ознакомиться с примером использования

    Благодаря инстансам Amazon EC2 G4 мне удалось примерно за 6 месяцев сделать Sway способным справляться с масштабами Суперкубка.

    Джесси Майерс, инженер, Humen
  • The Molecule

    Программное обеспечение для визуальных эффектов требует все больше мощности графического процессора. Она очень важна, когда используется, но зато используется не каждый день. Наше предприятие относится к малому бизнесу, и нам не по карману гоночный автомобиль для поездок за продуктами. Мы не можем себе позволить купить какую-то штуку, которую используем только изредка. И уж тем более мы не можем купить 10 таких штук для одного проекта с уникальными требованиями. Но благодаря инстансам G4 мы получили доступ к целой команде гоночных автомобилей с поддержкой графических процессоров, которые работают лучше и быстрее всех штук, которые мы могли бы купить, и за них нам не нужно платить, когда они не используются. Наши творческие сотрудники очень рады, что могут использовать гоночные машины, а мы еще больше рады, что можем их вернуть, когда они нам не нужны!

    Крис Хилер, президент компании The Molecule
  • PureWeb

    Компания PureWeb стремится предоставить предприятиям лучшую в мире платформу для потоковой передачи интерактивного контента в режиме реальном времени. Когда Женевский международный автосалон был отменен из-за пандемии COVID-19, компания Volkswagen обратилась к нам с инновационной идеей – создать для клиентов виртуальный шоурум, который поможет смягчить проблемы, вызванные этой отменой. В тесном сотрудничестве с AWS и креативным агентствами мы смогли всего за три недели создать виртуальную копию шоурума на базе Unity Game Engine, который выполнялся на оборудовании инстансов Amazon EC2 G4dn. В результате тысячи пользователей смогли посетить стенд Volkswagen на Женевском автосалоне, даже не выходя из дома. Учитывая ограничения по времени и технические ограничения, мы уверены, что среди всех поставщиков облачных услуг только AWS подходит для решения поставленной задачи, обеспечивая стабильное, масштабируемое, экономичное и поистине глобальное взаимодействие с пользователями.

    Крис Джарабек, старший архитектор программного обеспечения, компания PureWeb

Сведения о продукте

  Размер инстанса Графический процессор Виртуальные ЦПУ Память (ГиБ) Хранилище инстансов (ГБ) Пропускная способность сети (Гбит/с) Пропускная способность EBS (Гбит/с) Цена по требованию/час* Инстанс, зарезервированный на 1 год; фактический почасовой тариф* (Linux) Инстанс, зарезервированный на 3 года; фактический почасовой тариф* (Linux)

G4dn

Виртуальные машины с одним графическим процессором g4dn.xlarge 1 4 16 1 x 125 SSD на базе NVMe До 25 До 3,5 0,526 USD 0,316 USD 0,210 USD
g4dn.2xlarge 1 8 32 1 × 225 SSD на базе NVMe До 25 До 3,5 0,752 USD 0,452 USD 0,300 USD
g4dn.4xlarge 1 16 64 1 × 225 SSD на базе NVMe До 25 4,75 1,204 USD 0,722 USD 0,482 USD
g4dn.8xlarge 1 32 128 1 × 900 SSD на базе NVMe 50 9,5 2,176 USD 1,306 USD 0,870 USD
g4dn.16xlarge 1 64 256 1 × 900 SSD на базе NVMe 50 9,5 4,352 USD 2,612 USD 1,740 USD
                     
ВМ с несколькими графическими процессорами g4dn.12xlarge 4 48 192 1 × 900 SSD на базе NVMe 50 9,5 3,912 USD 2,348 USD 1,564 USD
g4dn.metal 8 96 384 2 × 900 SSD на базе NVMe 100 19 7,824 USD 4,694 USD 3,130 USD

G4ad

Виртуальные машины с одним графическим процессором g4ad.xlarge 1 4 16 1 × 150 SSD на базе NVMe До 10 До 3 0,379 USD 0,227 USD 0,178 USD
g4ad.2xlarge 1 8 32 1 × 300 SSD на базе NVMe До 10 До 3 0,541 USD 0,325 USD 0,254 USD
g4ad.4xlarge 1 16 64 1 × 600 SSD на базе NVMe До 10 До 3 0,867 USD 0,520 USD 0,405 USD
                     
ВМ с несколькими графическими процессорами g4ad.8xlarge 2 32 128 1 × 1200 SSD на базе NVMe 15 3 1,734 USD 1,040 USD 0,810 USD
g4ad.16xlarge 4 64 256 1 × 2400 SSD на базе NVMe 25 6 3,468 USD 2,081 USD 1,619 USD

* Цены указаны для региона AWS Восток США (Северная Вирджиния). Цены, указанные для инстансов, зарезервированных на 1 и 3 года, действительны при выборе способа оплаты с частичной предоплатой или без предоплаты (для инстансов, не предусматривающих возможности частичной предоплаты).

Начать работу с инстансами G4dn

Использование готовых AMI и контейнеров AWS

Благодаря использованию AMI для глубокого обучения Amazon или Контейнеров для глубокого обучения AWS вы можете быстро запускать инстансы Amazon EC2 с предварительно установленными популярными платформами и интерфейсами глубокого обучения, такими как TensorFlow и PyTorch, что позволяет обучать сложные специализированные модели искусственного интеллекта, экспериментировать с новыми алгоритмами или изучать новые навыки и методы. Чтобы получить больше информации, посетите страницу продукта «AMI для глубокого обучения Amazon» или страницу продукта «Контейнеры для глубокого обучения AWS».

AMI виртуальной рабочей станции NVIDIA RTX поддерживают для приложений визуализации до четырех дисплеев с разрешением 4K на каждый графический процессор. Игровые AMI NVIDIA отрисовывают видео со скоростью 60 кадров в секунду и поддерживают работу одного дисплея с разрешением 4K на каждый графический процессор.

Создание собственного пользовательского AMI с драйверами NVIDIA

Драйверы центра обработки данных NVIDIA обеспечивают наилучшую производительность высокоинтенсивных вычислительных рабочих нагрузок, которые часто применяются для задач глубокого обучения, анализа данных и высокопроизводительных вычислений.

Драйверы NVIDIA RTX можно использовать для поддержки программного обеспечения виртуальной рабочей станции NVIDIA RTX. RTX vWS поддерживает до четырех дисплеев с разрешением 4K на каждый графический процессор. Драйверы NVIDIA Gaming поддерживают самые передовые в мире видеокарты, игровые решения и технологии. Этот драйвер обеспечивает поддержку одного дисплея с разрешением 4K на каждый графический процессор.

Чтобы узнать, как установить эти драйверы на свой инстанс, перейдите по ссылкам с инструкциями для операционных систем Linux и Windows.

Начать работу с инстансами G4ad

Использование предварительно созданных AMI от AWS

Драйверы AMD Radeon Pro Software for Enterprise обеспечивают высокопроизводительные графические вычисления для виртуальных рабочих станций, потоковой передачи игр, рендеринга графики и других графических приложений. Чтобы быстро начать работу, вы можете использовать AMI, предоставленные компанией AWS, которые содержат предустановленные драйверы AMD Radeon Pro Software for Enterprise. Эти AMI доступны на торговой площадке AMD Radeon Pro.

Создание собственного пользовательского AMI с драйверами NVIDIA

Драйверы AMD Radeon Pro Software for Enterprise позволяют настроить для инстансов мощную и надежную графическую систему профессионального уровня. Рабочие станции с этими драйверами могут поддерживать до двух дисплеев с разрешением 4K.

Сведения о том, как установить эти драйверы на инстанс для создания собственного AMI, предоставлены по ссылкам с инструкциями для операционных систем Linux и Windows.