Stockez des données tabulaires à grande échelle dans S3
Les tables Amazon S3 fournissent un premier magasin d’objets dans le cloud avec la prise en charge intégrée d’Apache Iceberg et rationalisent le stockage des données tabulaires à mise à échelle. L’optimisation continue des tables analyse et réécrit automatiquement les données des tables en arrière-plan, ce qui permet d’obtenir des performances de requête jusqu’à 3 fois plus rapides que celles des tables Iceberg non gérées. Ces optimisations des performances continueront de s’améliorer au fil du temps. En outre, les tables S3 incluent des optimisations spécifiques aux charges de travail Iceberg qui génèrent jusqu’à 10 fois plus de transactions par seconde que les tables Iceberg stockées dans des compartiments S3 à usage général. Pour plus de détails sur l’amélioration des performances des requêtes sur les tables S3, consultez le blog.
Grâce à la prise en charge de tables S3 pour la norme Apache Iceberg, vos données tabulaires peuvent être facilement interrogées à l’aide de moteurs de requête AWS et tiers populaires, notamment Amazon Athena, Redshift, EMR et Apache Spark. Utilisez les tables S3 pour stocker des données tabulaires telles que les transactions d’achat quotidiennes, les données des capteurs de streaming ou les impressions d’annonces sous forme de table Iceberg dans S3, et optimisez les performances et les coûts à mesure que vos données évoluent grâce à la maintenance automatique des tables. Consultez le blog pour en savoir plus.
Avantages
Le principe est le suivant :
Les tables S3 fournissent un stockage S3 spécialement conçu pour stocker des données structurées au format Apache Parquet. Dans un compartiment de tables, vous pouvez créer des tables en tant que ressources de première classe directement dans S3. Ces tables peuvent être sécurisées par des autorisations au niveau de la table définie dans des politiques basées sur l’identité ou les ressources et sont accessibles par des applications ou des outils qui prennent en charge la norme Apache Iceberg. Lorsque vous créez une table dans votre compartiment de tables, les données sous-jacentes dans S3 sont stockées sous forme de données Parquet. Ensuite, S3 maintient les métadonnées nécessaires pour rendre ces données Parquet interrogeables par vos applications. Les compartiments de tables comprennent une bibliothèque client utilisée par les moteurs de requête pour naviguer et mettre à jour les métadonnées Iceberg des tables de votre compartiment de tables. Cette bibliothèque, associée aux API S3 mises à jour pour les opérations sur les tables, permet à plusieurs clients de lire et d’écrire en toute sécurité des données dans vos tables. Au fil du temps, S3 optimise automatiquement les données Parquet sous-jacentes en réécrivant ou en « compactant » vos objets. Le compactage optimise vos données sur S3 afin d’améliorer les performances des requêtes et de minimiser les coûts. Consultez le guide de l’utilisateur pour en savoir plus.
Clients
-
Genesys
Genesys est un leader mondial du cloud en matière d’orchestration d’expériences basée sur l’IA. Grâce à des fonctionnalités avancées d’IA, de numérique et de gestion de l’engagement du personnel, Genesys aide plus de 8 000 organisations dans plus de 100 pays à proposer des expériences personnalisées et empathiques à leurs clients et à leurs employés, tout en bénéficiant d’une agilité et de résultats commerciaux améliorés.
-
SnapLogic
SnapLogic est un pionnier de l’intégration pilotée par l’IA. La plateforme SnapLogic pour l’intégration générative accélère la transformation numérique au sein de l’entreprise pour concevoir, déployer et gérer des agents d’IA et une intégration qui automatisent les tâches, prennent des décisions en temps réel et s’intègrent sans effort aux flux de travail existants.
-
Zus Health
Zus est une plateforme de données de santé partagée conçue pour accélérer l’interopérabilité des données de santé en fournissant des données sur les patients faciles à utiliser via une API, des composants intégrés et des intégrations directes des dossiers médicaux électroniques.