Harga SageMaker Lakehouse

Amazon SageMaker Lakehouse menyatukan semua data Anda di seluruh danau data Amazon Simple Storage Service (Amazon S3) dan gudang data Amazon Redshift, membantu Anda membangun analitik dan aplikasi AI/ML yang canggih pada satu salinan data. SageMaker Lakehouse memberi Anda fleksibilitas untuk mengakses dan memeriksa data Anda dengan semua alat dan mesin yang kompatibel dengan Apache Iceberg. Ini mengamankan data Anda di lakehouse dengan mendefinisikan izin terperinci, yang diterapkan secara konsisten di seluruh alat dan mesin analitik serta machine learning (ML). Selain manfaat ini, akses data Anda dari basis data dan aplikasi operasional melalui integrasi nol-ETL dan data lintas sumber pihak ketiga melalui kemampuan kueri terfederasi di lakehouse.

SageMaker Lakehouse dapat diakses langsung dari Studio Terpadu Amazon SageMaker (pratinjau). Data dari berbagai sumber diatur dalam kontainer logis yang disebut katalog di SageMaker Lakehouse. Setiap katalog mewakili data baik dari sumber data yang ada seperti gudang data dan basis data pihak ketiga atau dibuat langsung di lakehouse untuk menyimpan data di Amazon S3 atau Amazon Redshift Managed Storage (RMS). Mesin kueri dapat terhubung ke katalog ini dan mengakses data langsung dengan API Apache Iceberg. Anda dapat menggunakan mesin apa pun yang kompatibel dengan Apache Iceberg seperti Apache Spark, Trino, Amazon Athena, atau Amazon EMR untuk mengakses data sebagai tabel Apache Iceberg dan meminta data dari mesin kueri pihak pertama dan ketiga mereka. Demikian pula, katalog dipasang di mesin kueri pihak pertama seperti klaster dan kelompok kerja Amazon Redshift sebagai basis data. Hubungkan ke basis data dari alat kueri melalui Java Database Connectivity (JDBC) atau Editor Kueri V2 Amazon Redshift untuk membuat kueri menggunakan SQL.

Harga SageMaker Lakehouse

SageMaker Lakehouse memiliki komponen dasar di bawah ini. Anda membayar komponen yang Anda gunakan di lakehouse.

Metadata SageMaker Lakehouse: Definisi data disusun dalam hierarki logis katalog, basis data, dan tabel menggunakan Katalog Data AWS Glue.

  • Katalog: Kontainer logis yang menampung objek dari penyimpanan data seperti skema, tabel, tampilan, atau tampilan terwujud dari Amazon Redshift. Anda dapat menumpuk katalog di bawah katalog untuk mencocokkan tingkat hierarki dari sumber data yang Anda bawa ke lakehouse.
  • Basis Data: Basis data dapat digunakan untuk mengatur objek data seperti tabel dan tampilan di lakehouse.
  • Tabel dan tampilan: Tabel dan tampilan adalah objek data dalam basis data yang menjelaskan cara mengakses data dasar seperti skema, partisi, lokasi penyimpanan, format penyimpanan, dan kueri SQL untuk mengakses data.

Metadata SageMaker Lakehouse dapat diakses dari API AWS Glue. Untuk penyimpanan metadata dan permintaan API, harga metadata Katalog Data AWS Glue berlaku, termasuk AWS Tingkat Free. Untuk informasi lebih lanjut, kunjungi harga AWS Glue.

Penyimpanan dan akses data: Menggunakan SageMaker Lakehouse, Anda dapat membaca dan menulis data ke Amazon S3 atau RMS. Berdasarkan jenis penyimpanan yang Anda pilih untuk menyimpan data di lakehouse, Anda akan dikenakan biaya penyimpanan dan komputasi tambahan untuk mengakses penyimpanan yang mendasarinya. Kunjungi harga AWS Glue untuk detail lebih lanjut tentang harga penyimpanan dan komputasi untuk jenis penyimpanan.

Statistik dan pemeliharaan tabel Apache Iceberg: Di SageMaker Lakehouse, Anda dapat mengotomatiskan pengumpulan statistik pada tabel danau data di Amazon S3 untuk eksekusi kueri yang lebih cepat dan pemeliharaan tabel Apache Iceberg, seperti pemadatan, untuk mengoptimalkan tata letak penyimpanan tabel Apache Iceberg Anda. Anda akan dikenakan biaya tambahan saat mengaktifkan fitur ini. Untuk informasi lebih lanjut, kunjungi harga AWS Glue.

Izin: Izin terperinci di SageMaker Lakehouse didukung oleh AWS Lake Formation. Izin di SageMaker Lakehouse gratis. Untuk detail lebih lanjut, kunjungi harga Lake Formation.

Biaya integrasi nol-ETL

SageMaker memiliki integrasi nol-ETL dengan aplikasi, menghilangkan kebutuhan untuk membangun dan mengelola pipeline extract, transform, and load (ETL). Aplikasi yang didukung termasuk Salesforce, ServiceNow, Zendesk, dan banyak lagi.

Integrasi ini memberi Anda fleksibilitas, sehingga Anda dapat memilih tabel data tertentu dalam aplikasi untuk direplikasi otomatis ke Amazon Redshift. Fleksibilitas ini memungkinkan Anda menjalankan analitik terpadu di berbagai aplikasi dan sumber data. AWS tidak mengenakan biaya tambahan untuk integrasi nol-ETL. Anda membayar sumber daya yang ada yang digunakan untuk membuat dan memproses data perubahan yang dibuat sebagai bagian dari integrasi nol-ETL. Ini termasuk penyimpanan Amazon Redshift tambahan untuk menyimpan data replikasi, sumber daya komputasi untuk memproses replikasi data (atau RPU di Amazon Redshift Nirserver), dan biaya transfer data lintas-AZ untuk memindahkan data dari sumber ke target. Pemrosesan perubahan data yang berkelanjutan melalui integrasi nol-ETL ditawarkan tanpa biaya tambahan. Untuk informasi lebih lanjut, kunjungi harga Amazon Aurora, harga Amazon Relational Database (Amazon RDS) untuk MySQL, harga Amazon DynamoDB, dan harga AWS Glue.