什么是 “Build on Trainium”?
“Build on Trainium” 是一项耗资 1.1 亿美元的投资计划,专注于人工智能研究和大学教育,旨在支持 AWS Trainium 的下一代创新和发展。AWS Trainium 是一款专为推进最先进的人工智能理念和应用而设计的人工智能脉动阵列芯片。“Build on Trainium” 资助在 Trainium 上进行的创新 AI 研究,投资领先的学术团队,在关键领域推动创新,包括新模型架构、机器学习库、优化、大规模分布式系统等。这项为期多年的计划激励学术界使用、投资和参与围绕 Trainium 的开源社区,为人工智能的未来奠定了基础。将这些优势与 Neuron 软件开发工具包(SDK)和最近推出的 Neuron Kernel 接口(NKI)相结合,Trainium 客户现在可以在云端进行大规模创新。

AWS Trainium 研究集群
我们已经创建了一个包含多达 40,000 个 Trainium 芯片的专用 Trainium 研究集群,用户可以通过 Amazon EC2 Trn1 实例访问该集群,而这些实例则通过 Amazon EC2 UltraClusters 连接在一个单一的非阻塞 PB 级网络上。研究团队和学生可以使用适用于 ML 的 Amazon EC2 容量块进行自管理容量块预留来访问这些芯片。

AWS 研究奖励
我们正在向广泛的研究界进行多轮亚马逊研究奖 (ARA) 提案征集 (CFP),入选的提案将获得 AWS Trainium 积分和可访问 Trainium 研究集群。请访问 ARA CFP 页面了解更多信息。“Build on Trainium” 欢迎那些利用流行开源机器学习库和框架的研究提案,并将研究成果回馈给开源社区,以增加机器学习开发者社区的资源。

Neuron Kernel 接口
Neuron Kernel 接口(NKI)是适用于 AWS 人工智能芯片 Trainium 和 Inferentia 的全新编程接口。NKI 提供对 AWS Trainium 和 Inferentia 上可用硬件原语和指令的直接访问,使研究人员能够构建和调整计算内核以实现最佳性能。它是一个基于 Python 的编程环境,采用常用的类似 Triton 的语法和图块级语义。研究人员可以使用 NKI 为深度学习模型增加新功能、优化性能,并推动科学创新。要了解更多信息,请访问 NKI 文档页面。

优势
参与的大学
以下是顶尖大学如何从 “Build on Trainium” 计划中受益。
-
Berkeley University of California
Trainium 超越了可编程的范畴——不仅可以运行程序,还可以通过低级访问来调整硬件本身的功能。架构中每一步都融入灵活性调节功能,使其成为研究的理想平台。AWS 确实在推动意想不到的创新。我走过实验室,每个项目都需要计算集群资源来实现不同的用途。“Build on Trainium” 资源将非常有用——从日常工作到我们在实验室进行的深入研究。
Christopher Fletcher,加州大学伯克利分校计算机科学副教授 -
Carnegie Mellon University
AWS 全新的 “Build on Trainium” 计划使我们的教职员工和学生能够大规模访问 AWS Trainium 等现代加速器,采用开放的编程模型,并使我们能够大幅扩展在张量程序编译、机器学习并行化、以及语言模型服务与调优方面的研究。
Todd C. Mowry,卡内基梅隆大学计算机科学教授 -
University of Texas
Trainium 加快了我们在多个科学领域的生成式人工智能研究速度。对于希望扩大规模的学术界而言,它彻底改变了游戏规则。
Adam Kilvans,德克萨斯大学计算机科学教授 -
University of Oxford
AWS Build on Trainium 计划极大地加强了我在牛津大学实验室开展的神经符号人工智能研究,从而彻底改变硬件设计。利用 Trainium 加速器,我们的研究人员和学生能够进行规模宏大、影响深远的创新。
Tom Melham,牛津大学计算机科学教授