为什么选择 Trainium?
AWS Trainium 是 AWS 专门为超过 1,000 亿个参数模型的深度学习训练打造的机器学习 (ML) 芯片。每个 Amazon Elastic Compute Cloud (Amazon EC2) Trn1 实例部署多达 16 个 Trainium 加速器,为云中的深度学习培训提供高性能、低成本的解决方案。尽管深度学习和生成式人工智能的使用正在加速,但许多开发团队的预算是固定的,这限制了改进模型和应用程序所需的训练范围和频率。基于 Trainium 的 Amazon EC2 Trn1 实例通过提供更快的训练时间解决了这一挑战,同时与同类 Amazon EC2 实例相比,可节省高达 50% 的训练成本。Trainium 已针对训练自然语言处理、计算机视觉和推荐器模型进行了优化,这些模型用于文本摘要、代码生成、问题解答、图像和视频生成、推荐和欺诈检测等各种应用程序。
AWS Neuron SDK 可以帮助开发人员在 Trainium 加速器上训练模型,并且可以在 AWS Inferentia 加速器上训练它们。它与 PyTorch 和 TensorFlow 等热门框架原生集成,让您可以继续在 Trainium 加速器上训练,并且使用现有的代码和工作流。