Was ist SageMaker Lakehouse?

Amazon SageMaker Lakehouse vereinheitlicht all Ihre Daten aus Data Lakes von Amazon Simple Storage Service (Amazon S3), einschließlich S3 Tables, und Amazon Redshift Data Warehouses und hilft Ihnen so, leistungsstarke Analytik- und KI/ML-Anwendungen auf einer einzigen Datenkopie zu erstellen. SageMaker Lakehouse bietet Ihnen die Flexibilität, mit allen Apache-Iceberg-kompatiblen Tools und Engines direkt auf Ihre Daten zuzugreifen und diese abzufragen. Schützen Sie Ihre Daten im Lakehouse, indem Sie differenzierte Berechtigungen definieren, die in allen Tools und Engines für Analytik und Machine Learning (ML) durchgesetzt werden. Bringen Sie Daten aus Betriebsdatenbanken und Anwendungen durch Null-ETL-Integrationen nahezu in Echtzeit in Ihr Lakehouse. Darüber hinaus können Sie mit Verbundabfragefunktionen aus Datenquellen von Drittanbietern direkt auf Daten zugreifen und diese abfragen.

In Aktion erleben

Erfahren Sie, wie Sie in SageMaker Lakehouse auf vereinheitlichte Daten aus S3 Data Lakes, S3 Tables und Redshift Data Warehouses zugreifen können.

sagemaker-lakhouse-thumbnail

Vorteile

Vereinheitlichen Sie all Ihre Daten in Amazon S3 Data Lakes, einschließlich S3 Tables, und Amazon Redshift Data Warehouses mit SageMaker Lakehouse. Bringen Sie Ihre Daten aus Betriebsdatenbanken und Anwendungen durch Null-ETL-Integrationen nahezu in Echtzeit in das Lakehouse. Sie können Hunderte von Konnektoren verwenden, um Daten aus verschiedenen Quellen zu integrieren. Darüber hinaus können Sie mit Verbundabfragefunktionen aus Datenquellen von Drittanbietern direkt auf Daten zugreifen und diese abfragen.
Verwenden Sie Ihre bevorzugten Tools und Engines, die mit dem offenen Standard Apache Iceberg kompatibel sind. Mit allen Apache-Iceberg-kompatiblen Tools erhalten Sie die Flexibilität, direkt auf Ihre Daten zuzugreifen und diese abzufragen, und zwar auf einer einzigen Datenkopie. SageMaker Lakehouse ist mit der Iceberg-REST-Katalogspezifikation kompatibel und ermöglicht Ihnen die Verwendung von Analytik-Tools und -Engines Ihrer Wahl, wie z. B. SQL, Apache Spark, Business Intelligence (BI) und KI/ML-Tools. Darüber hinaus ermöglicht es die Zusammenarbeit mit Daten, die in Amazon S3 Data Lakes und Amazon Redshift Data Warehouses gespeichert sind. SageMaker Lakehouse arbeitet mit Ihrer vorhandenen Datenarchitektur und ermöglicht Ihnen die Verwendung Ihrer bevorzugten Speicherformate und Abfrage-Engines, die mit Apache Iceberg kompatibel sind.
Schützen Sie Ihre Daten mit integrierten, differenzierten Zugriffskontrollen, die für all Ihre Daten in allen Analytik-Tools und Engines durchgesetzt werden. Definieren Sie Berechtigungen einmal und teilen Sie Daten vertrauensvoll in Ihrem Unternehmen.

Anwendungsfälle

Vereinheitlichen Sie all Ihre Daten in Amazon S3 Data Lakes und Amazon Redshift Data Warehouses für Ihre Analytik- und KI-Initiativen mit einer einzigen Datenkopie. Mit integrierten Zugriffskontrollen können Sie mit SageMaker Lakehouse differenzierte Berechtigungen definieren und eine einzige Datenkopie sicher im gesamten Unternehmen teilen.
Greifen Sie über Null-ETL-Integrationen nahezu in Echtzeit auf Daten aus operativen Datenbanken und Anwendungen im SageMaker Lakehouse zu. Greifen Sie direkt auf Ihre Daten zu und fragen Sie sie ab – mit einer Vielzahl von AWS-Services sowie Open-Source-Tools und Engines von Drittanbietern, die Apache Iceberg unterstützen.
Bringen Sie vorhandene Daten aus mehreren Amazon Redshift Data Warehouses in SageMaker Lakehouse, um Daten abzufragen und zu verknüpfen, die in Amazon-Redshift-Clustern und Arbeitsgruppen gespeichert sind. Skalieren Sie Ihre Workloads für Prozesse von Extract, Transform, Load (ETL), BI-Berichte und Analysen nach Bedarf, ohne mehrere Datenfreigaben verwalten zu müssen.

Kunden

Lennar

„Wir haben die letzten 18 Monate damit verbracht, mit AWS zusammenzuarbeiten, um unsere Datenbasis so zu transformieren, dass wir erstklassige Lösungen verwenden können, die auch kostengünstig sind. Mit Fortschritten wie Amazon SageMaker Unified Studio und Amazon SageMaker Lakehouse beschleunigen wir unsere Liefergeschwindigkeit durch den nahtlosen Zugriff auf Daten und Services, sodass unsere Techniker, Analysten und Wissenschaftler Einblicke gewinnen können, die für unser Unternehmen von erheblichem Wert sind.“

Lee Slezak, SVP of Data and Analytic, Lennar

Roche

Roche ist ein globaler Vorreiter in den Bereichen Pharma und Diagnostik, der sich auf die Weiterentwicklung der Wissenschaft konzentriert, um das Leben der Menschen zu verbessern.

„Wir haben Amazon Redshift verwendet, um Erkenntnisse aus strukturierten und halbstrukturierten Daten in all unseren Daten-Repositorys zu gewinnen. Ich bin begeistert von dem neuen Amazon SageMaker Lakehouse, das das Potenzial hat, den Zugriff auf Data Lakes oder andere Datenquellen mit Services wie Amazon Redshift, AWS-Glue-Datenkatalog und AWS Lake Formation zu verbessern und zu vereinheitlichen. Diese Innovation wird es unseren Daten- und Entwicklungsteams ermöglichen, den Datenzugriff zu vereinfachen und die Interoperabilität zwischen Daten-, Analytik- und Anwendungs-Workloads zu fördern. Ich rechne mit einer deutlichen Verringerung von Datenfehlern durch weniger Datenkopien, eine Verringerung der Verarbeitungszeit um 40 %, ein schnelleres Write-Back von Analytikdaten in Transaktionssysteme zur Verbesserung der Entscheidungsfindung und die Möglichkeit für unsere Teams, sich auf die Schaffung von Geschäftswerten zu konzentrieren.“

Yannick Misteli, Head of Engineering, Global Product Strategy, Roche

Roche

Idealista

Idealista unterstützt Immobilienmakler und Privatpersonen in ganz Südeuropa durch die Bereitstellung einer Online-Plattform für Immobilienkleinanzeigen.

„Unser Ziel ist es, den Zugriff auf Salesforce-Daten für eine verbesserte Analytik in unserem Data Lake zu optimieren. Durch die Nutzung der neuen Amazon SageMaker Lakehouse-Unterstützung für Null-ETL-Integrationen von Anwendungs-Features können wir unsere Prozesse zur Datenextraktion und -erfassung vereinfachen und die Notwendigkeit mehrerer ETLs für den direkten Zugriff auf Salesforce beseitigen. Dieser zentralisierte Ansatz reduziert die Komplexität und verbessert die Effizienz unseres Datenmanagements erheblich. Wir rechnen mit einer erheblichen Zeitersparnis bei der Entwicklung der Datenextraktion und -aufnahme, sodass sich unser Team darauf konzentrieren kann, aus unseren Daten umsetzbare Erkenntnisse abzuleiten, anstatt deren Erfassung zu verwalten.“

Javier Monterrubio, Data Platform Engineer Manager bei Idealista

Idealista

Carrier

„Bei Carrier transformiert die nächste Generation von Amazon SageMaker unsere Unternehmensdatenstrategie, indem sie die Art und Weise, wie wir Datenprodukte entwickeln und skalieren, optimiert. Der Ansatz von SageMaker Unified Studio zur Datenermittlung, -verarbeitung und Modellentwicklung hat unsere Lakehouse-Implementierung erheblich beschleunigt. Am beeindruckendsten ist, dass die nahtlose Integration in unseren bestehenden Datenkatalog und die integrierten Governance-Kontrollen es uns ermöglichen, den Datenzugriff zu demokratisieren und gleichzeitig die Sicherheitsstandards aufrechtzuerhalten, sodass unsere Teams schnell fortschrittliche Analytik- und KI-Lösungen im gesamten Unternehmen bereitstellen können.“

Carrier

Partner

Tableau

Tableau unterstützt Personen und Unternehmen dabei, datengesteuerter zu werden.

„Die Partnerschaft zwischen Amazon und Salesforce Tableau steht für ein gemeinsames Engagement für Innovation und Kundenerfolg. Durch die neue Null-ETL-Integration von Amazon kombinieren wir die KI-gestützten Daten und Analytik von Tableau mit der leistungsstarken Dateninfrastruktur von Amazon, um die Art und Weise zu verändern, wie Unternehmen Erkenntnisse aus ihren Daten gewinnen. Diese nahtlose Integration ermöglicht es unseren Kunden, mithilfe der Leistung von Amazon SageMaker Lakehouse und Amazon Redshift Erkenntnisse aus all ihren strukturierten und unstrukturierten Daten zu gewinnen. Dadurch wird die technische Komplexität und die Bereitstellungszeit drastisch reduziert. Gemeinsam unterstützen Tableau und Amazon Kunden dabei, die digitale Transformation zu beschleunigen und den Geschäftswert in großem Maßstab zu steigern.“

Ali Tore, Senior VP, Advanced Analytics bei Tableau

Tableau

dbt Labs

Die Aufgabe von dbt Labs besteht darin, Analysten bei der Erstellung und Verbreitung organisatorischen Wissens zu unterstützen.

„Wir sind seit langem der Transformationsstandard auf Basis von Amazon Redshift und bieten Flexibilität, Zusammenarbeit und Vertrauen. Dank des neuen Amazon SageMaker Lakehouse können wir diesen Mehrwert auf mehr Kunden und noch mehr Daten in der AWS-Umgebung ausdehnen. Jetzt können Kunden auf alle ihre Daten im gesamten AWS-System zugreifen, einschließlich Data Warehouses und Data Lakes. Wir freuen uns darauf, unsere Fähigkeiten mit dem neuen Amazon SageMaker zu kombinieren, um unseren gemeinsamen Kunden Governance-, Katalogisierungs- und Datenoptimierungen anzubieten.“

Shawn Toldo, VP Partnerships bei dbt Labs

dbt Labs

Informatica

Informatica, ein führendes Unternehmen im Bereich KI-gestütztes Cloud-Datenmanagement für Unternehmen, erweckt Daten und KI zum Leben, indem es Unternehmen die Möglichkeit gibt, das transformative Potenzial ihrer wichtigsten Ressourcen zu nutzen.

„Unsere Intelligent Data Management Cloud (IDMC)-Plattform und Amazon SageMaker helfen Unternehmen dabei, Datenpotenzial zu erschließen und Innovation und Effizienz voranzutreiben. Als Startpartner von Amazon SageMaker Lakehouse sind wir stolz darauf, eine Lösung auf Unternehmensebene bereitzustellen, die den hohen Standards moderner datengesteuerter Organisationen gerecht wird. Gemeinsam mit der Infrastruktur von AWS ermöglichen wir schnellere, fundierte Entscheidungen für wirkungsvolle Ergebnisse in allen Branchen.“

Pratik Parekh, SVP Product Management bei Informatica

Informatica