什么是 SageMaker 笔记本?
在几秒钟内即可从 Amazon SageMaker Studio 启动完全托管的 JupyterLab。使用笔记本、代码和数据的集成式开发环境(IDE)。您可以使用 IDE 中的可快速启动的协作式笔记本访问 SageMaker 和其他 AWS 服务中专门构建的机器学习工具,以完成机器学习开发,从使用 Spark on Amazon EMR 准备 PB 级数据,到训练和调试模型、部署和监控模型以及管理管道——这一切都在一个基于 Web 的可视界面中完成。轻松调高或调低计算资源,而不会中断您的工作。
SageMaker 笔记本的优势
大规模构建 ML
快速入门
只需几秒钟即可在 Studio 中启动完全托管的 JupyterLab。SageMaker Studio 预先配置了预先构建的 SageMaker Distribution,其中包含常用的机器学习软件包,包括 PyTorch、TensorFlow 和 Keras 等深度学习框架;NumPy、scikit-learn 和 panda 等常用的 Python 软件包,可帮助您开始构建模型。
弹性计算
纵向扩展或横向扩展您的基础计算资源,并使用共享的持久性存储来切换计算,而无需中断您的工作。从 AWS 提供的最丰富的计算资源中进行选择,包括最强大的 GPU 机器学习实例。
提高 ML 开发效率
数据准备
利用统一的环境简化数据工作流。直接从 JupyterLab 创建、浏览和连接到 Amazon EMR 集群和 AWS Glue 交互式会话。使用内置的数据准备功能来可视化数据并提高数据质量。
笔记本作业
您可以使用 SageMaker 笔记本作业创建非交互式作业,使其按需运行或按计划运行。使用直观的用户界面或 SageMaker Python SDK 直接从 JupyterLab 安排作业。选择笔记本后,SageMaker 笔记本会创建整个笔记本的快照,并将其依赖项打包到容器中,构建基础设施,将笔记本作为自动化作业按从业者设置的日程运行,并在作业完成后取消预置基础设施。SageMaker 笔记本作业也可作为 Amazon SageMaker Pipelines 中的原生步骤使用,使您能够在几行代码内将笔记本自动转换为多步骤工作流,并依赖于 CI/CD 部署。
人工智能驱动的工具
Amazon Q 开发者版提供有关 SageMaker 功能的操作说明指导、代码生成帮助以及 JupyterLab 环境中的故障排除支持。只需用自然语言提问,例如“如何在 SageMaker 端点上部署模型以进行实时推理?”,Amazon Q 开发者版会提供分步说明和代码,帮助您入门。若您在执行代码时遇到错误,Amazon Q 开发者版可随时为您提供帮助。只需要求 Amazon Q 开发者版修复错误,它就会提供调试和解决问题的详细步骤。
灵活性和自定义
专为团队而构建
使用 AWS IAM Identity Center(AWS Single Sign-on 的后继者),设置您的团队对 SageMaker Studio 笔记本的访问权限。为平台管理员和业务领导创建单独的环境,以监控 SageMaker Studio 的成本和使用情况。创建共享的空间,以使您的团队能够共同实时读取、编辑和运行笔记本,以简化协作和沟通。团队成员可以共同审查结果,以便立即了解模型的运行情况,而不必来回传递信息。使用为 BitBucket 和 AWS CodeCommit 等服务提供的内置支持,团队可以轻松管理不同的笔记本版本,并比较随时间发生的变化。系统会自动标记所有的资源,因此便于使用 AWS Budgets 和 AWS Cost Explorer 成本管理服务等工具监控成本和制定预算计划。
可自定义
使用一个自定义的 Docker 映像,将您自己的笔记本开发环境迁移到 SageMaker Studio。使用“生命周期配置”,为您的团队自动化和自定义笔记本环境。
独立笔记本实例
在完全托管式 SageMaker 服务中,使用您熟悉并信赖的独立版 Jupyter 笔记本。免去很多麻烦,包括设置计算资源、升级数据科学和机器学习软件包以及应用安全补丁。使用 SageMaker 笔记本实例,您可以将全部精力放在机器学习上,并使用最新的开源软件保护和及时更新您的计算环境。