Pemrosesan Data Amazon SageMaker menganalisis, menyiapkan, mengintegrasikan, dan mengatur data Anda dengan kemampuan pemrosesan dari Amazon Athena, Amazon EMR, AWS Glue, dan Amazon Managed Workflow for Apache Airflow (MWAA). Anda dapat memanfaatkan kerangka kerja pemrosesan data sumber terbuka, seperti Apache Spark menganalisis data dalam skala besar dengan Trino, dan membangun analitik waktu nyata secara mulus dengan Apache Flink dan Apache Spark.
Pemrosesan Data Amazon SageMaker menyatukan Amazon EMR, Amazon Athena, AWS Glue, dan Amazon Managed Workflows for Apache Airflow.
Pemrosesan Data SageMaker membantu Anda menjelajahi data, membangun pekerjaan transformasi data, mengatur, dan menerapkan pipeline data dalam skala besar. Ini meningkatkan performa, mendorong wawasan yang lebih cepat daripada sistem sumber terbuka tradisional dengan versi Apache Spark, Apache Airflow, Apache Flink, Trino, dan banyak lagi yang kompatibel dengan API hemat biaya dan sumber terbuka. Pemrosesan Data menyediakan akses ke sumber data Anda di Amazon SageMaker Lakehouse melalui integrasi nol-ETL, kemampuan kueri gabungan dan konektor.
Tidak, Anda tidak perlu melakukan migrasi ke Amazon SageMaker. Anda dapat terus menggunakan Amazon EMR, Amazon Athena, AWS Glue, dan Amazon Managed Workflow untuk Apache Airflow seperti yang Anda lakukan saat ini. Namun, sebaiknya Anda memulai dengan Amazon SageMaker untuk memanfaatkan alat terpadu, tata kelola data bawaan, dan arsitektur Amazon SageMaker Lakehouse yang disederhanakan.
Tidak ada dampak terhadap kode, kueri, pekerjaan, dan sumber daya lain yang telah Anda buat dan gunakan dengan Amazon EMR, Amazon Athena, atau AWS Glue. Anda dapat terus memanfaatkan layanan ini untuk beban kerja baru, jika mau. Sumber daya yang dibuat dalam layanan ini, seperti Amazon EMR pada klaster EC2, terlihat di Amazon SageMaker untuk menyederhanakan pengembangan aplikasi analitik dan AI. Pengalaman pengembangan yang ada yang dibangun di Amazon EMR, AWS Glue, dan Amazon Athena akan terus ada selain pengalaman pengembangan baru di Amazon SageMaker.
Versi terbaru dari AWS Glue, Glue 5.0, tersedia di Amazon SageMaker. Glue 5.0 mempercepat beban kerja pemrosesan data dan menghadirkan runtime Apache Spark 3.5.2 terbaru yang dioptimalkan untuk performa sehingga Anda dapat mengembangkan, menjalankan, dan menskalakan untuk wawasan yang lebih cepat. Untuk mempelajari selengkapnya, kunjungi AWS Glue.
Setiap layanan AWS yang Anda gunakan melalui Amazon SageMaker ditagih dengan harga individu masing-masing. Untuk detail selengkapnya, silakan lihat halaman harga AWS untuk Amazon Athena, Amazon EMR, AWS Glue, dan Amazon Managed Workflow Apache Airflow