Amazon S3 Metadata (versão prévia)

Acelere a descoberta de dados com metadados de objetos praticamente em tempo real

Localize e organize os dados de que você precisa no S3

O Amazon S3 Metadata (versão prévia) aproveita todo o potencial dos dados no S3 ao transformar os metadados dos objetos em itens facilmente acessíveis e mais simples de consultar. Disponibilize, armazene e consulte metadados detalhados para os objetos armazenados no S3. Isso permite que você localize rapidamente os dados necessários para analytics de negócios, aplicações de inferência em tempo real e muito mais. O S3 Metadata fornece suporte a metadados de objetos, incluindo detalhes definidos pelo sistema, como tamanho e origem do objeto, além de metadados personalizados, que permitem o uso de etiquetas para fazer anotações nos objetos com informações como SKU do produto, ID da transação ou classificação de conteúdo. Leia mais no blog

Benefícios

Encontre e recupere de maneira rápida os dados necessários em até trilhões de objetos no S3.

Use as etiquetas para anotar seus objetos com metadados específicos de negócios a fim de aprimorar a organização e a capacidade de pesquisa dos dados.

Projetado para capturar e organizar automaticamente os metadados dos objetos no S3 Tables gerenciado, com suporte incorporado para o Apache Iceberg.

É possível analisar metadados usando serviços bem conhecidos da AWS, como o Amazon Athena, o Redshift, o EMR e o QuickSight, por meio da integração prévia do S3 Tables com o Catálogo de Dados do AWS Glue. O S3 Metadata é compatível com ferramentas conhecidas de código aberto.

Casos de uso

Use os metadados enriquecidos para catalogar os dados armazenados, facilitando sua localização e utilização.

Rastreie e gerencie os vídeos gerados por IA, incluindo a origem, o horário de criação e o modelo de IA usado, com o Amazon Bedrock.

Analise os metadados dos objetos para identificar oportunidades de redução de custos e aprimoramentos de performance.

Identifique e analise rapidamente conjuntos de dados relevantes para business intelligence e tomada de decisões.

Aperfeiçoe a organização dos dados e a conformidade por meio de anotações personalizadas de metadados.

Clientes

  • Cambridge Mobile Telematics

    A Cambridge Mobile Telematics (CMT) é a maior provedora de serviços de telemetria do mundo. Sua missão é aumentar a segurança das rodovias e dos motoristas em todo o mundo. A plataforma orientada por inteligência artificial da empresa, DriveWell Fusion®, coleta dados de sensores de milhões de dispositivos de IoT, incluindo smartphones, etiquetas proprietárias, veículos conectados, câmeras de painel e dispositivos de entidades externas, e os combina com dados contextuais para criar uma visão unificada do comportamento do veículo e do motorista.

    Na CMT, armazenamos e analisamos uma grande quantidade de dados, na ordem de múltiplos petabytes, provenientes de dispositivos móveis de IoT globalmente, visando aprimorar a segurança de motoristas e das rodovias. Conforme ampliamos nossas operações, localizar dados específicos para o desenvolvimento de novos insights e modelos se torna cada vez mais desafiador. O S3 Metadata, particularmente com a funcionalidade de metadados personalizados, possibilita a anotação de todos os nossos dados e a manutenção dos metadados em uma tabela gerenciada e consultável. Agora, a localização de dados relevantes requer apenas uma consulta SQL eficiente e econômica. Isso torna o S3 Metadata uma verdadeira revolução, possibilitando-nos a introduzir novas funcionalidades para nossos clientes.

    Tim Vogel, diretor de informações, Cambridge Mobile Telematics
  • PayPal

    O PayPal está revolucionando o comércio global há mais de 25 anos. Ao criar experiências inovadoras que tornam a movimentação de dinheiro, as vendas e as compras mais simples, personalizadas e seguras, o PayPal capacita consumidores e empresas em cerca de 200 mercados a se conectarem e prosperarem na economia global.

    O S3 Metadata nos oferece um mecanismo simples e sem complicações para analisar trilhões de objetos do S3 usando ferramentas padrão como o Amazon Athena e o Amazon QuickSight. Com essa funcionalidade, podemos dedicar nosso tempo à tomada de decisões, em vez de desenvolver nossos complexos pipelines de dados para acessar e consultar os metadados dos objetos do S3.

    Jon Southall, vice-presidente de engenharia para o departamento de plataformas empresariais de grande escala, PayPal
  • Roche

    A Roche é uma empresa do setor de biotecnologia que combina produtos farmacêuticos e diagnósticos para alcançar avanços na saúde personalizada e proporcionar melhorias na vida das pessoas.

    Com o S3 Metadata, aceleramos nossas iniciativas de IA generativa. À medida que desenvolvemos aplicações de LLM, como chatbots internos para nossas equipes, dados não estruturados, como PDFs, tornam-se uma parte cada vez mais essencial. Precisamos ingerir uma grande quantidade de documentos específicos de domínio em uma aplicação de geração aumentada via recuperação (RAG) para que o chatbot possa se adaptar aos contextos específicos de negócios da Roche. Entretanto, isso também resulta em um aumento significativo na quantidade de dados não estruturados que devemos gerenciar. Precisamos de um sistema de metadados para descrever nossos dados não estruturados de forma eficiente, permitindo que os usuários filtrem rapidamente nosso extenso data lake e identifiquem os conjuntos de dados relevantes para a aplicação específica de IA generativa que estão desenvolvendo. Com o S3 Metadata, o desenvolvimento de um sistema robusto de metadados foi simplificado para apenas alguns cliques no Console de Gerenciamento da AWS. À medida que continuamos a ingerir mais dados não estruturados, o S3 Metadata identifica automaticamente os metadados e os mantém atualizados. Além disso, empregamos nossa própria função do Lambda para extrair metadados específicos do negócio, como a classificação de documentos segundo uma taxonomia relevante para a Roche, e armazenamos esses metadados no mesmo catálogo do Glue, juntamente com a tabela do S3 Metadata. Isso nos permite, por meio de uma simples junção SQL, acessar todos os metadados necessários. O S3 Metadata nos ajuda a criar aplicações de IA generativa mais rapidamente, permitindo que concentremos nossos esforços no desenvolvimento em vez de na organização dos dados.

    Yannick Misteli, diretor do departamento de engenharia comercial no setor farmacêutico, Roche
  • SmugMug / Flickr

    A SmugMug e o Flickr disponibilizam plataformas on-line para que fotógrafos realizem upload e compartilhem fotos e vídeos. A empresa mantém bilhões de fotos e vídeos armazenados em sua aplicação.

    Imagine conduzir uma máquina do tempo pelos dados no Amazon S3. Na SmugMug e no Flickr, temos mais de 22 anos de fotos dos nossos clientes, totalizando centenas de bilhões de objetos, armazenados no S3. O novo recurso S3 Metadata simplifica e torna mais acessível a exploração dos metadados dos nossos objetos no S3, permitindo consultas sobre informações como o tamanho dos objetos ao longo do tempo. Isso facilita a compreensão da evolução dos nossos dados, eliminando a necessidade de combinar consultas complexas e custosas de banco de dados com inventários de objetos. Compreender como nossos fotógrafos usam o armazenamento fortalece nosso compromisso em criar um mundo melhor por meio da capacidade da fotografia.

    Andrew Shieh, engenheiro principal, SmugMug
  • A Solink disponibiliza sistemas confiáveis de segurança por vídeo em nuvem para empresas de diversos portes. O hardware e software da empresa fornecem visibilidade para as equipes de TI, prevenção de perdas, operações e segurança em mais de 40 países e em dezenas de milhares de locais.

    A Solink processa mais de 500 milhões de horas de vídeo mensalmente, integrando imagens de segurança com dados essenciais para os negócios de mais de 350 fontes. A AWS fornece suporte à infraestrutura que utilizamos, e o Amazon S3 Metadata levará isso a um novo patamar ao disponibilizar insights em tempo real que aprimoram o gerenciamento do nosso conteúdo, desde o monitoramento de armazenamento e uso até a análise em tempo real dos impactos das alterações nas configurações dos clientes.

    Martin Soukup, diretor técnico, Solink
  • Commvault

    A Commvault é a referência em resiliência cibernética, auxiliando mais de 100 mil organizações na proteção de dados e no fortalecimento da resiliência dos negócios em constante evolução. No momento, a Commvault disponibiliza a única plataforma de resiliência cibernética que combina a melhor segurança de dados com a recuperação ágil em grande escala, para qualquer workload, em qualquer local, além de fornecer o menor TCO.

    O Amazon S3 se destacou como um dos principais provedores de armazenamento em nuvem para diversos tipos de dados. O Amazon S3 Metadata possibilitará que fornecedores, como a Commvault, ajudem proativamente na identificação e na proteção informações confidenciais, além de automatizar elementos, como a classificação de dados, e melhorar os resultados para nossos clientes em comum. O S3 Metadata facilita a organização eficiente dos dados e contribui para simplificar a descoberta de dados, permitindo a anotação detalhada de objetos, o que é essencial para a resiliência cibernética em ambientes que priorizam a nuvem.

    Pranay Ahlawat, diretor de tecnologia e de IA, Commvault
  • New Relic

    A Intelligent Observability Platform da New Relic fornece aos clientes analytics detalhadas da performance para cada parte do ambiente de software. Os clientes podem visualizar e analisar grandes volumes de dados com facilidade e obter insights acionáveis em tempo real.

    Como uma referência em observabilidade, o mecanismo de dados da New Relic processa aproximadamente 1,3 exabytes de dados do Amazon S3 a cada dia. O S3 Metadata acelerará nossa inovação ao gerar metadados avançados de objetos automaticamente por meio da simplificação da exploração de dados necessária pelas nossas equipes para realizar experimentos de produto e desenvolver provas de conceito, como o desenvolvimento de novos indicadores úteis para nossos clientes. O S3 Metadata diminuirá o esforço necessário para desenvolver e gerenciar um sistema de metadados robusto, reduzindo de centenas de horas para apenas alguns cliques no console de gerenciamento do S3, possibilitando que nossos engenheiros se concentrem na análise de dados, em vez de na organização dos dados.

    Siva Padisetty, diretor de tecnologia, New Relic