Amazon SageMaker Data and AI Governance

Descubra, governe e colabore em dados e IA de forma segura

Visão geral

A próxima geração do Amazon SageMaker simplifica a descoberta, a governança e a colaboração de dados e de IA em todo o lakehouse, os modelos de IA e as aplicações. Com o Amazon SageMaker Catalog, desenvolvido no Amazon DataZone, os usuários podem descobrir e acessar dados e modelos aprovados de forma segura ao usar a pesquisa semântica com metadados criados por IA generativa, ou simplesmente solicitar ao Amazon Q Developer, em linguagem natural, que encontre seus dados. Os usuários podem definir e aplicar políticas de acesso de maneira consistente, por meio de um único modelo de permissões com controles de acesso granulares, de forma centralizada no Amazon SageMaker Unified Studio (versão prévia). Compartilhe e trabalhe de forma colaborativa sem complicações em ativos de dados e de IA por meio de fluxos de trabalho simples de publicação e de assinatura. Com o SageMaker, é possível proteger e salvaguardar seus modelos de IA ao usar as barreiras de proteção do Amazon Bedrock e implementar políticas de IA responsável. Desenvolva a confiança em toda a sua organização com o monitoramento de qualidade de dados, a automação, a detecção de dados confidenciais e a linhagem de dados e de machine learning (ML).

Benefícios

Descubra seus ativos de dados e de IA em grande escala com o SageMaker Catalog, uma solução desenvolvida no Amazon DataZone. Aprimore a descoberta de dados com a IA generativa para enriquecer os dados e os metadados de forma automática com o contexto de negócios, facilitando a busca, a compreensão e o uso dos dados por todos os usuários. Compartilhe os dados, os modelos de IA, os prompts e os ativos de IA generativa, com a possibilidade de filtragem por nomes de tabelas e colunas ou por termos do glossário de negócios. Realize a recomendação automática de colunas importantes e de aplicações analíticas relevantes para cada conjunto de dados, possibilitando o uso adequado dos dados para o desenvolvimento dos modelos certos com rapidez. Forneça suporte tanto para modelos de governança centralizados quanto para modelos descentralizados com o compartilhamento contínuo de dados e de IA por meio de fluxos de publicação e de assinatura em uma única experiência usando os Projetos.

Conquiste a confiança por meio da visibilidade em tempo real da qualidade dos dados e da linhagem de dados e de ML no SageMaker. Automatize o processo de criação de perfil de dados e o fornecimento de recomendações de qualidade, monitore as regras de qualidade dos dados e receba alertas. Resolva desafios complexos de detecção relacionados à qualidade dos dados ao usar abordagens baseadas em regras e em ML para reconciliar entidades, garantindo a entrega de dados de alta qualidade para a tomada de decisões empresariais assertivas. Promova a transparência em pipelines de dados e em projetos de IA com o monitoramento de modelos integrado para detectar viés ou relatar como os recursos contribuem para a predição de modelo.
Centralize a segurança dos dados e da IA no SageMaker com controles de acesso granulares, classificação de dados e barreiras de proteção para garantir que dados, analytics e modelos de IA sejam usados de forma apropriada. Defina as permissões uma única vez e aplique-as a todos os dados e modelos. Com a integração nativa do IDE do Amazon Bedrock (versão prévia), os clientes têm a possibilidade de usar as Barreiras de Proteção do Amazon Bedrock em suas aplicações de IA generativa ao bloquear conteúdos prejudiciais, filtrar alucinações e habilitar salvaguardas personalizáveis para privacidade, segurança e precisão. Identifique informações confidenciais de maneira automática em seus pipelines usando o Amazon Comprehend.
Garanta a conformidade com auditorias e regulamentações por meio do registro em log e do monitoramento do uso de dados e de modelos. Forneça suporte ao uso aceitável dos ativos de analytics e de IA em toda a empresa com o isolamento baseado em projetos. Compreenda o uso de dados e de modelos em seu lakehouse para a obtenção de uma segurança aprimorada. Use o Amazon SageMaker Clarify para monitorar os modelos em relação a viés, precisão e robustez, em conformidade com os padrões de IA responsável. Alinhe os custos às iniciativas empresariais e forneça uma visão transparente dos investimentos empresariais.

Recursos

Dados selecionados para contexto e facilidade de localização

O SageMaker Catalog fornece contexto empresarial aos metadados técnicos e permite aprimorá-los com as informações de negócios. Você pode tornar os dados visíveis no contexto comercial para que todos os seus usuários encontrem, entendam e confiem nos dados com rapidez e facilidade.

Recomendações automatizadas de metadados

Automatize a adição de descrições e nomes empresariais aos dados, o que ajuda a entender facilmente o contexto e a evitar lidar com nomes técnicos enigmáticos. Essa automação é alimentada por grandes modelos de linguagem (LLMs) para aumentar a precisão e a consistência.

Ofereça um nível consistente de segurança de IA em todas as suas aplicações

As barreiras de proteção do Amazon Bedrock ajudam a avaliar as entradas fornecidas pelos usuários e as respostas dos modelos de base (FMs) com base em políticas específicas para cada caso de uso. Além disso, elas fornecem uma camada adicional de proteção, independentemente dos FMs subjacentes.

Faça a auditoria e o acompanhamento de modelos com rapidez

Audite e solucione rapidamente a performance de todos os modelos, endpoints e tarefas de monitoramento de modelos por meio de uma exibição unificada. Rastreie desvios do comportamento esperado do modelo e trabalhos de monitoramento ausentes ou inativos, com alertas automatizados.

Qualidade dos dados

Por meio das estatísticas de qualidade de dados, os consumidores de dados podem visualizar métricas de qualidade provenientes da AWS ou de sistemas de entidades externas. Os consumidores de dados podem confiar nas fontes de dados que utilizam para tomar decisões e ter um contexto de qualidade de dados enquanto pesquisam ativos. Além disso, os produtores de dados e as equipes de TI podem usar APIs para incorporar as estatísticas de qualidade de dados de sistemas de entidades externas em um portal unificado e externo ao console.

Linhagem de dados e de ML

Compreenda a movimentação de dados e de modelos ao longo do tempo. A linhagem pode aumentar a confiança e a alfabetização em dados e em IA de uma organização ao ajudar os consumidores de dados a compreenderem a origem dos dados, as alterações realizadas e os padrões de consumo. É possível diminuir o tempo dedicado ao mapeamento de ativos de dados e de IA e suas relações, à solução de problemas e ao desenvolvimento de pipelines, e à implementação de práticas de governança de dados e de IA.