Fonctionnalités d'Amazon Athena

Pourquoi choisir Athéna ?

Amazon Athena est un service de requêtes interactif qui facilite l'analyse de données directe dans Amazon S3 grâce au SQL standard. Athena fonctionne sans serveur, il n'y a donc aucune infrastructure à configurer ou à gérer. Vous pouvez choisir de payer en fonction des requêtes que vous exécutez ou du calcul requis pour vos requêtes. Vous pouvez utiliser Athena pour traiter des journaux, réaliser des analyses de données et exécuter des requêtes interactives. Athena s'adapte automatiquement, en exécutant les requêtes en parallèle. Les résultats sont donc rapides, même avec de grands ensembles de données et des requêtes complexes.  

Page Topics

Avantages clés

Avantages clés

Amazon Athena fonctionne sans serveur. Il n'y a donc aucune infrastructure à gérer. Vous n'avez pas à vous soucier de la configuration, des mises à jour logicielles, ni du dimensionnement de votre infrastructure à mesure que les ensembles de données et le nombre d'utilisateurs augmentent. Athena s'en charge automatiquement à votre place. Vous pouvez donc vous concentrer sur les données et pas sur l'infrastructure.

Pour démarrer, connectez-vous à la console Athena, définissez votre schéma à l'aide de l'assistant de la console ou en saisissant des instructions DDL, et commencez immédiatement à lancer vos requêtes à l'aide de l'éditeur de requêtes intégré. Enfin, AWS Glue peut aussi analyser automatiquement des sources de données afin de découvrir des schémas et alimenter votre catalogue de données avec des tables nouvelles ou mises à jour tout en partitionnant les données. Les résultats s'affichent dans la console dans les secondes qui suivent et sont automatiquement écrits dans l'emplacement de votre choix dans S3. Vous pouvez également les télécharger sur votre bureau. Avec Athena, inutile d'exécuter des tâches ETL complexes pour préparer vos données en vue de leur analyse. Cela permet à quiconque ayant des compétences en SQL d'analyser rapidement des jeux de données à grande échelle.

Amazon Athena est basé sur Trino et Presto, des moteurs SQL distribués open source optimisés pour une analyse de données interactive à faible latence. Vous pouvez ainsi exécuter des requêtes sur de grands jeux de données dans Amazon S3 à l'aide du SQL ANSI, avec prise en charge totale des liaisons de volumes importants, des fonctions de fenêtre et des tableaux. Athena prend en charge un large éventail de formats de données tels que CSV, JSON, ORC, Avro ou Parquet. Avec les connecteurs de sources de données fédérées d’Athena, vous pouvez interroger des banques de données supplémentaires et associer les données aux données stockées dans Amazon S3. Vous pouvez accéder à Athena et exécuter des requêtes à partir de la console Athena, API, CLI, SDK AWS et des applications d’informatique décisionnelle et de développement SQL prises en charge via les pilotes JDBC et ODBC d’Athena.

Amazon Athena propose deux modèles de tarification flexibles. Par défaut, les requêtes sont facturées en fonction des données analysées par requête en téraoctets (To). Cela vous permet de soumettre des requêtes sans planifier le calcul à l'avance. Si vous préférez payer en fonction du calcul consommé par vos requêtes ou si vous souhaitez contrôler la simultanéité et hiérarchiser les charges de travail, utilisez la tarification basée sur la capacité disponible avec la capacité provisionnée. Pour plus de flexibilité, vous pouvez utiliser simultanément la facturation par requête et la tarification basée sur la capacité sur le même compte.

Avec Amazon Athena, vous n'avez pas à vous soucier de la gestion ou du réglage des clusters pour obtenir des performances élevées. Athena est un service optimisé pour offrir des performances rapides avec Amazon S3. Athena exécute automatiquement les requêtes en parallèle pour vous offrir des résultats en quelques secondes, même dans le cas de grands ensembles de données.  

Amazon Athena est une solution hautement disponible qui exécute des requêtes à l'aide de ressources de calcul situées dans différentes installations, en acheminant correctement les requêtes lorsqu'une installation spécifique n'est pas disponible. Athena utilise Amazon S3 comme banque de données sous-jacente, ce qui garantit des données hautement disponibles et durables. Amazon S3 fournit une infrastructure durable pour stocker les données importantes et est conçu pour offrir une durabilité de 99,999999999 % des objets. Vos données sont stockées de manière redondante sur plusieurs installations et sur plusieurs appareils au sein de chaque installation.

Amazon Athena vous permet de contrôler l'accès à vos données à l'aide de stratégies AWS Identity and Access Management (IAM), de listes de contrôle d'accès (ACL) et de stratégies de compartiment Amazon S3. À l'aide des stratégies IAM, vous pouvez accorder aux utilisateurs IAM un contrôle précis de vos compartiments S3. En contrôlant l'accès aux données dans S3, vous pouvez empêcher les utilisateurs de les interroger à l'aide d'Athena. Athena vous permet de consulter facilement des données chiffrées stockées dans Amazon S3 et de réécrire les résultats chiffrés dans votre compartiment S3. Le chiffrement côté serveur et le chiffrement côté client sont tous les deux pris en charge.

Amazon Athena s'intègre clé en main à AWS Glue. Grâce au catalogue de données Glue, vous serez en mesure de créer un référentiel de métadonnées unifié pour divers services, d'analyser des sources de données pour découvrir des schémas et alimenter votre catalogue de données avec des tables nouvelles ou mises à jour tout en partitionnant les données ainsi que de maintenir les versions de schéma. Vous pouvez également utiliser les capacités ETL entièrement gérées de Glue pour transformer les données ou les convertir sous forme de colonnes afin d'optimiser les performances des requêtes et réduire les coûts. En savoir plus sur AWS Glue.

Athena fournit des connecteurs intégrés à plus de 30 magasins de données AWS, sur site et autres magasins de données cloud populaires, notamment Amazon Redshift, Amazon DynamoDB, Google BigQuery, le stockage dans le cloud Google, Azure Synapse, le stockage de lac de données Azure, Redis, Snowflake et SAP Hana. En utilisant les connecteurs de source de données Athena, vous pouvez générer des informations à partir de plusieurs sources de données à l'aide de la syntaxe SQL d'Athena, sans avoir à déplacer ou à transformer vos données. Les connecteurs de données s’exécutent en tant que fonctions AWS Lambda et peuvent être activés pour permettre l’accès intercompte, pour adapter les requêtes SQL à des centaines d’utilisateurs finaux. Pour connaître la liste des sources prises en charge, consultez Available data source connectors. Pour savoir comment créer un connecteur de source de données personnalisé, consultez le SDK du connecteur Athena.

Vous pouvez désormais appeler vos modèles de Machine Learning SageMaker dans une requête Athena SQL afin d'exécuter une inférence. La possibilité d’utiliser des modèles ML dans les requêtes SQL rend les tâches complexes, par exemple la détection des anomalies, l’analyse des cohortes de clients et les prévisions de ventes, aussi simples que l’écriture de la requête SQL. Grâce à Athena, toute personne possédant des connaissances dans le langage SQL pourra exécuter facilement ses modèles de machine learning déployés sur Amazon SageMaker.