Amazon SageMaker Lakehouse

Simplificar el análisis y la IA con un almacén de lago de datos unificado, abierto y seguro

¿Qué es SageMaker Lakehouse?

Amazon SageMaker Lakehouse unifica todos los datos en los lagos de datos de Amazon Simple Storage Service (Amazon S3) y los almacenes de datos de Amazon Redshift, lo que ayuda a crear potentes aplicaciones de análisis e IA/ML en una sola copia de los datos. SageMaker Lakehouse brinda la flexibilidad de acceder a los datos y consultarlos in situ con todas las herramientas y los motores compatibles con Apache Iceberg. Proteja sus datos en un depósito mediante la definición de permisos detallados que se aplican en todas las herramientas y los motores de análisis y machine learning (ML). Lleve los datos de las bases de datos y aplicaciones operativas a lakehouse casi en tiempo real mediante integraciones sin ETL. Además, acceda y consulte los datos en el lugar con capacidades de consulta federadas en orígenes de datos de terceros.

Beneficios

Unifique todos sus datos en los lagos de datos de Amazon S3 y los almacenes de datos de Amazon Redshift con SageMaker Lakehouse. Reúna sus datos de bases de datos y aplicaciones operativas en el lakehouse casi en tiempo real mediante integraciones sin ETL. Puede usar cientos de conectores para integrar datos de varias fuentes. Además, puede acceder a los datos y consultarlos en el lugar con las capacidades de consulta federadas en los orígenes de datos de terceros.
Use sus herramientas y motores preferidos, compatibles con el estándar abierto de Apache Iceberg. Obtenga la flexibilidad de acceder a sus datos y consultarlos en el lugar con todas las herramientas compatibles con Apache Iceberg en una sola copia de los datos. Compatible con la especificación del catálogo de REST de Iceberg, SageMaker Lakehouse le permite utilizar las herramientas y los motores de análisis que prefiera, como SQL, Apache Spark, inteligencia empresarial (BI) y herramientas de IA y ML, y colaborar con los datos guardados en el almacenamiento de datos de Amazon Redshift y los lagos de datos de Amazon S3. Use SageMaker Lakehouse con su arquitectura de datos existente, permitiéndole usar sus formatos de almacenamiento y motores de consulta preferidos, compatibles con Apache Iceberg.
Proteja sus datos con controles de acceso detallados e integrados que se aplican a todos sus datos en todas las herramientas y motores de análisis. Defina los permisos una vez y comparta datos con confianza en toda su organización.

Casos de uso

Unifique todos sus datos en los lagos de datos de Amazon S3 y los almacenes de datos de Amazon Redshift para sus iniciativas de análisis e IA con una sola copia de los datos. Con los controles de acceso integrados, SageMaker Lakehouse permite definir permisos detallados y compartir de forma segura una única copia de los datos en toda la organización.
Acceda a datos casi en tiempo real en las bases de datos y aplicaciones operativas de SageMaker Lakehouse mediante integraciones sin ETL. Acceda a sus datos y consúltelos en el lugar, desde una amplia gama de servicios de AWS y herramientas y motores de código abierto y de terceros compatibles con Apache Iceberg.
Reúna los datos existentes de varios almacenes de datos de Amazon Redshift en SageMaker Lakehouse para consultar y unir los datos almacenados en grupos de trabajo y clústeres de Redshift. Amplíe sus cargas de trabajo para los procesos de extracción, transformación y carga (ETL), los informes de BI y el análisis según sea necesario sin administrar varios recursos compartidos de datos.