O que é o aprendizado profundo?

O aprendizado profundo é um método de inteligência artificial (IA) que ensina computadores a processar dados de uma forma inspirada pelo cérebro humano. Os modelos de aprendizado profundo conseguem reconhecer padrões complexos em imagens, texto, sons e outros dados para produzir insights e previsões precisas. É possível usar métodos de aprendizado profundo para automatizar tarefas que normalmente exigem inteligência humana, como descrever imagens ou transcrever um arquivo de som em texto. 

Por que o aprendizado profundo é importante?

A inteligência artificial (IA) tenta treinar computadores para pensar e aprender como os humanos. A tecnologia de aprendizado profundo impulsiona muitas aplicações de IA usadas em produtos cotidianos, como:

  • Assistentes digitais
  • Controles remotos de televisão ativados por voz
  • Detecção de fraudes
  • Reconhecimento facial automático

Também é um componente essencial das tecnologias emergentes, como carros autônomos, realidade virtual e muito mais. 

Os modelos de aprendizado profundo são arquivos de computador treinados por cientistas de dados para executar tarefas usando um algoritmo ou um conjunto predefinido de etapas. As empresas usam modelos de aprendizado profundo para analisar dados e fazer previsões em várias aplicações.

Quais são os usos do aprendizado profundo?

O aprendizado profundo tem vários casos de uso, como no setor automotivo, aeroespacial, de manufatura, eletrônico, de pesquisa médica, entre outros. Estes são alguns exemplos de aprendizado profundo:

  • Os carros autônomos usam modelos de aprendizado profundo para detectar sinais de trânsito e pedestres automaticamente.
  • Os sistemas de defesa usam aprendizado profundo para sinalizar automaticamente áreas de interesse em imagens de satélite.
  • A análise de imagens médicas usa aprendizado profundo para detectar automaticamente células cancerosas para diagnóstico médico.
  • As fábricas usam aplicações de aprendizado profundo para detectar automaticamente quando pessoas ou objetos estão a uma distância de risco das máquinas.

É possível agrupar esses vários casos de uso de aprendizado profundo em quatro grandes categorias: visão computacional, reconhecimento de fala, processamento de linguagem natural (PLN) e mecanismos de recomendação.

Visão computacional

A visão computacional é a capacidade dos computadores de extrair informações e insights de imagens e vídeos. Os computadores podem usar as técnicas de aprendizado profundo para compreender imagens da mesma forma que os humanos. A visão computacional tem várias aplicações, como:

  • Moderação de conteúdo para remover automaticamente conteúdos inapropriados ou perigosos de arquivos de vídeos e imagens
  • Reconhecimento facial para identificar rostos e reconhecer atributos como olhos abertos, óculos e barba
  • Rótulo de imagens para classificar logotipos de marcas, roupas, equipamentos de segurança e outros detalhes de imagens

Reconhecimento de voz

Os modelos de aprendizado profundo podem analisar a fala humana mesmo existindo diversos padrões de fala, tom, altura, idioma e sotaque. Assistentes virtuais como a Amazon Alexa e software de transcrição automática usam o reconhecimento de fala para realizar estas tarefas:

  • Ajudar atendentes de centrais de atendimento e classificar chamadas automaticamente.
  • Converter conversas clínicas em documentação em tempo real.
  • Criar legendas de vídeos e gravações de reuniões com precisão para permitir um maior alcance do conteúdo.

Processamento de linguagem natural

Os computadores usam algoritmos de aprendizado profundo para reunir insights e significados de dados e documentos de texto. A capacidade de processar texto natural criado por humanos tem vários casos de uso, inclusive nestas funções:

  • Atendentes virtuais e chatbots automatizados
  • Resumo automático de documentos ou artigos jornalísticos
  • Análise de business intelligence de documentos longos, como e-mails e formulários
  • Indexação de expressões-chave que indicam sentimentos, como comentários positivos e negativos em mídias sociais

Mecanismos de recomendação

As aplicações podem usar métodos de aprendizado profundo para rastrear a atividade do usuário e desenvolver recomendações personalizadas. Podem analisar o comportamento de vários usuários e ajudá-los a descobrir novos produtos ou serviços. Por exemplo, muitas empresas de mídia e entretenimento, como Netflix, Fox e Peacock, usam aprendizado profundo para oferecer recomendações personalizadas de vídeo.

Como funciona o aprendizado profundo?

Os algoritmos de aprendizado profundo são redes neurais modeladas conforme o cérebro humano. Por exemplo, o cérebro humano contém milhões de neurônios interconectados que trabalham juntos para aprender e processar informações. Da mesma forma, redes neurais de aprendizado profundo, ou redes neurais artificiais, são compostas por muitas camadas de neurônios artificiais que trabalham juntas dentro do computador.

Os neurônios artificiais são módulos de software chamados nós, que utilizam cálculos matemáticos para processar dados. As redes neurais artificiais são algoritmos de aprendizado profundo que usam esses nós para solucionar problemas complexos.

Quais são os componentes de uma rede de aprendizado profundo?

Os componentes de uma rede neural profunda estão listados abaixo.

Camada de entrada

Uma rede neural artificial conta com vários nós que inserem dados nela. Esses nós compõem a camada de entrada do sistema.

Camada oculta

A camada de entrada processa e transmite os dados para camadas mais distantes na rede neural. Essas camadas ocultas processam informações em diferentes níveis, adaptando o comportamento à medida que recebem novas informações. As redes de aprendizado profundo têm centenas de camadas ocultas que podem ser usadas para analisar um problema por vários ângulos diferentes.

Por exemplo, se recebesse a imagem de um animal desconhecido e precisasse classificá-lo, você o compararia aos animais que já conhece. Por exemplo, observaria o formato dos olhos e das orelhas, tamanho, número de pernas e padrão de pelo. Você tentaria identificar padrões, tais como:

  • O animal tem cascos, então pode ser uma vaca ou um cervo.
  • O animal tem olhos de gato, então pode ser algum tipo de gato selvagem.

As camadas ocultas em redes neurais profundas funcionam da mesma forma. Se um algoritmo de aprendizado profundo está tentando classificar uma imagem de animal, cada uma de suas camadas ocultas processa uma característica diferente do animal e tenta categorizá-la com precisão.

Camada de saída

A camada de saída consiste nos nós que emitem dados. Modelos de aprendizado profundo que geram respostas “sim” ou “não” têm apenas dois nós na camada de saída. Por sua vez, aqueles que produzem uma gama maior de respostas têm mais nós. 

O que é aprendizado profundo no contexto do machine learning?

O aprendizado profundo é um subconjunto do machine learning. Os algoritmos de aprendizado profundo surgiram na tentativa de tornar as técnicas tradicionais de machine learning mais eficientes. Os métodos tradicionais de machine learning exigem um esforço humano considerável para treinar o software. Por exemplo, no reconhecimento de imagens de animais, é necessário:

  • Rotular manualmente centenas de milhares de imagens de animais.
  • Fazer com que os algoritmos de machine learning processem essas imagens.
  • Testar esses algoritmos em um conjunto de imagens desconhecidas.
  • Identificar por que alguns resultados são imprecisos.
  • Aprimorar o conjunto de dados rotulando novas imagens para melhorar a precisão dos resultados.

Esse processo é chamado de aprendizado supervisionado. No aprendizado supervisionado, a precisão dos resultados só melhora quando há um conjunto de dados amplo e bastante variado. Por exemplo, o algoritmo pode identificar gatos pretos com precisão, mas não gatos brancos, pois o conjunto de dados de treinamento continha mais imagens de gatos pretos. Nesse caso, seria necessário rotular mais imagens de gatos brancos e treinar os modelos de machine learning mais uma vez.

Quais são os benefícios do aprendizado profundo em relação ao machine learning?

Uma rede de aprendizado profundo apresenta os benefícios a seguir em relação ao machine learning tradicional. 

Processamento eficiente de dados não estruturados 

Os métodos de machine learning consideram dados não estruturados, como documentos de texto, difíceis de processar porque o conjunto de dados de treinamento pode ter infinitas variações. Por sua vez, os modelos de aprendizado profundo podem compreender dados não estruturados e fazer observações gerais sem extrair recursos manualmente. Por exemplo, uma rede neural pode reconhecer que essas duas frases de entrada diferentes têm o mesmo significado:

  • Você pode me explicar como fazer o pagamento?
  • Como eu transfiro o dinheiro? 

Relacionamentos ocultos e descoberta de padrões

Uma aplicação de aprendizado profundo pode analisar grandes quantidades de dados mais profundamente e revelar novos insights para os quais talvez não tenha sido treinada. Por exemplo, pense em um modelo de aprendizado profundo treinado para analisar as compras do consumidor. O modelo tem dados somente de produtos que você já comprou. Porém, a rede neural artificial pode sugerir novos produtos que você não comprou, comparando seus padrões de compra aos de outros clientes semelhantes.

Aprendizado sem supervisão

Os modelos de aprendizado profundo podem aprender e melhorar ao longo do tempo com base no comportamento do usuário. Não necessitam de grandes variações de conjuntos de dados rotulados. Por exemplo, considere uma rede neural que corrija ou sugira automaticamente palavras por meio da análise do comportamento de digitação de um usuário. Digamos que tenha sido treinado na língua inglesa e possa corrigir erros ortográficos de palavras em inglês. Porém, se você digita frequentemente palavras em outros idiomas, como danke, a rede neural aprende automaticamente e corrige essas palavras também.

Processamento de dados voláteis

Conjuntos de dados voláteis têm grandes variações. Um exemplo são os valores de reembolso de empréstimos de um banco. Uma rede neural de aprendizado profundo também pode categorizar e classificar esses dados, por exemplo, analisando transações financeiras e sinalizando algumas delas para detecção de fraudes.

Quais são os desafios do aprendizado profundo?

Como o aprendizado profundo é uma tecnologia relativamente nova, sua implementação prática traz certos desafios.

Grandes quantidades de dados de alta qualidade

Algoritmos de aprendizado profundo fornecem melhores resultados quando são treinados em grandes quantidades de dados de alta qualidade. Exceções ou erros no conjunto de dados de entrada podem afetar consideravelmente o processo de aprendizado profundo. Por exemplo, em nosso exemplo de imagem animal, o modelo de aprendizado profundo pode classificar um avião como uma tartaruga, se imagens não animais forem acidentalmente introduzidas no conjunto de dados.

Para evitar essas imprecisões, é necessário limpar e processar grandes quantidades de dados antes de treinar modelos de aprendizado profundo. O pré-processamento de dados de entrada requer grandes quantidades de capacidade de armazenamento de dados.

Grande capacidade de processamento 

Os algoritmos de aprendizado profundo fazem uso intensivo de computação e necessitam de infraestrutura com capacidade computacional suficiente para funcionar adequadamente. Senão, demoram muito para processar os resultados. 

Quais são os benefícios do aprendizado profundo na nuvem?

Executar algoritmos de aprendizado profundo na infraestrutura de nuvem pode solucionar muitos desses desafios. É possível usar o aprendizado profundo na nuvem para criar, desenvolver e treinar aplicações de aprendizado profundo com mais rapidez. 

Velocidade

Treine modelos de aprendizado profundo mais rapidamente usando clusters de GPUs e CPUs para realizar as operações matemáticas complexas que suas redes neurais exigem. Depois, você pode implantar esses modelos para processar grandes quantidades de dados e produzir resultados cada vez mais relevantes.

Escalabilidade

Com a ampla variedade de recursos sob demanda disponíveis por meio da nuvem, você pode acessar recursos de hardware praticamente ilimitados para trabalhar com modelos de aprendizado profundo de qualquer porte. Suas redes neurais podem tirar proveito de vários processadores para distribuir workloads de maneira contínua e eficiente entre diferentes tipos e quantidades de processadores.

O que é o aprendizado profundo na AWS?

Os serviços de aprendizado profundo da AWS usam o poder da computação em nuvem para que você possa escalar as redes neurais de aprendizado profundo com custos reduzidos e otimizá-las para obter maior velocidade. Você também pode usar os produtos da AWS, como os seguintes, para gerenciar totalmente aplicações específicas de aprendizado profundo:

  • O Amazon Rekognition para adicionar recursos de visão computacional personalizados ou pré-treinados à aplicação
  • O Amazon Transcribe para reconhecer automaticamente e transcrever falas com precisão
  • O Amazon Lex para criar chatbots inteligentes que entendem a intenção, mantêm o contexto da conversa e automatizam tarefas simples em vários idiomas

Comece a usar o aprendizado profundo na AWS com o Amazon SageMaker e crie, treine e implante redes neurais em escala de forma rápida e fácil. Você também pode usar as AMIs de aprendizado profundo da AWS para criar ambientes e fluxos de trabalho personalizados para o aprendizado profundo. Crie uma conta da AWS gratuita para começar agora mesmo!

Próximas etapas do aprendizado profundo na AWS

Confira outros recursos relacionados a produtos
Saiba mais sobre os serviços de Aprendizado profundo 
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

Cadastre-se 
Comece a criar no console

Comece a criar no Console de Gerenciamento da AWS.

Faça login