Amazon DataZone:集成
Amazon DataZone 集成分为四类:
生产者数据来源
从 AWS Glue Data Catalog 和 Amazon Redshift 的内置数据来源发布数据。对于所有其他类型的来源,您可以定义自定义资产类型,并使用 Amazon DataZone 公共 API 发布这些资产。为了与 AWS Glue 数据质量自动监测功能集成,数据来源可用于按计划生成数据质量分数。
分析工具
使用 Amazon Athena 和 Amazon Redshift 查询编辑器等服务,以便您可以直接处理来自查询编辑器的数据。使用 API 可轻松扩展此功能,进而自定义其他第三方工具。Amazon DataZone 可以与这些工具共享项目访问环境。
访问权限实现
自动为由 AWS Lake Formation 托管的 AWS Glue 表以及 Amazon Redshift 表和视图实现和管理权限。 对于所有其他资产,Amazon DataZone 会发送与用户操作相关的标准事件,例如订阅请求或批准。您可以使用这些标准事件与其他 AWS 服务或第三方解决方案集成,以实现自定义集成。
机器学习(ML)工具
结合 Amazon SageMaker 使用,轻松获得对数据和机器学习资产的访问权限。您可以轻松执行 ML 任务,并将新创建的数据和机器学习资产发布到您的业务数据目录中。详细了解 Amazon SageMaker 如何支持机器学习治理。
管理数据湖中的数据
使用 AWS 集中管理和扩展细粒度的数据访问权限。
使用 Amazon DataZone 和 AWS Glue 进行元数据管理
您可能已经在使用 AWS Glue Data Catalog 来管理您的技术元数据。学习如何通过结合 AWS Glue Data Catalog 和 Amazon DataZone 来管理与业务数据目录集成的技术元数据目录。
通过使用 Amazon DataZone 和 AWS Glue 管理元数据来统一您的数据环境
您需要一个强大而全面的元数据管理解决方案,让用户、引擎和模型可以发现您的数据。使用 Amazon DataZone 和 AWS Glue Data Catalog 简化发现、管理和分析。