Amazon SageMaker Canvas 功能

使用可视化界面构建高度准确的机器学习模型,无需任何代码

准备数据

SageMaker Canvas 连接到 50 多个数据来源,您也可以上传本地文件来训练您的 ML 模型。支持表格、图像或文本数据。您还可以使用 SQL 编写查询来访问数据来源,并直接以各种文件格式(例如 CSV、Parquet、ORC 和 JSON)以及数据库表导入数据。
通过 SageMaker Canvas 无代码界面,您可以使用内置或自定义可视化来探索、可视化和分析数据。只需单击一下,您就可以生成数据质量和洞察报告来验证数据质量,例如确保数据集不包含缺失值或重复行,还可以检测异常值、类不平衡和数据泄漏等异常情况。
SageMaker Canvas 提供 300 多种预构建的、基于 PySpark 的数据转换,因此您可以转换数据,而无需编写任何代码。或者,您也可以使用基础模型支持的聊天界面来准备数据。
SageMaker Canvas 可以轻松启动或安排数据准备工作流程,以快速处理数据并跨数据集扩展数据准备、将其导出到 SageMaker Studio 笔记本或与 SageMaker Pipelines 集成。

访问和构建 ML 模型

SageMaker Canvas 提供对用于内容生成、文本提取和文本摘要的即用型基础模型(FM)的访问权限。 你可以访问诸如 Claude 2、Llama-2、Amazon Titan、Jurassic-2 和 Command(由亚马逊 Bedrock 提供支持)等虚拟机,以及猎鹰、Flan-T5、Mistral、Dolly 和 MPT(由 SageMaker JumpStart 提供支持)等公开的 FM,并使用自己的数据对其进行调整。

通过 SageMaker Canvas 无代码界面,您可以使用公司数据自动构建自定义 ML 模型。选择和准备数据并确定要预测的内容后,SageMaker Canvas 会识别问题类型,根据问题类型测试数百个 ML 模型(使用诸如线性回归、逻辑回归、深度学习、时间序列预测和梯度提升等 ML 技术),并创建一个自定义模型,根据您的数据集做出最准确的预测。或者,您可以将自己之前构建的模型引入 SageMaker Canvas 并部署该模型进行推理。

SageMaker Canvas 提供对即用型表格、NLP 和 CV 模型的访问,适用于情感分析、图像中的对象检测、图像中的文本检测和实体提取等用例。即用型模型不需要构建模型,并由包括 Amazon RekognitionAmazon TextractAmazon Comprehend 在内的 AWS AI 服务提供支持。

构建模型后,您可以在使用公司数据将模型部署到生产环境之前评估模型的性能。您可以轻松比较模型响应并选择最适合需求的响应。

生成 ML 预测

SageMaker Canvas 提供可视化假设分析,以便您可以更改模型输入,然后了解这些更改如何影响单个预测。您可以为整个数据集创建自动批量预测,而且,数据集更新时,您的 ML 模型也会自动更新。机器学习模型更新后,您可以从 SageMaker Canvas 无代码界面查看更新的预测。

您可以将 SageMaker Canvas 模型部署到 SageMaker 端点以进行实时推理。

Amazon QuickSight 共享模型预测,以构建在同一交互式视觉效果中结合传统商业智能和预测数据的控制面板。此外,SageMaker Canvas 模型可以直接在 QuickSight 中共享和集成,使分析师能够在 QuickSight 仪表板中为新数据生成高度准确的预测。

利用 MLOps

只需单击一下即可将在 SageMaker Canvas 中创建的 ML 模型注册到 SageMaker 模型注册表,以便将模型集成到现有模型部署 CI/CD 流程中。

您可以与使用 SageMaker Studio 的数据科学家共享您的 SageMaker Canvas 模型。然后,数据科学家可以查看、更新模型并与您共享更新后的模型,或部署您的模型进行推理。