Logotipo da empresa Genentech

Genentech maximiza valor dos dados de biomarcadores clínicos usando a AWS

2022

Quando a maioria das pessoas pensa em pesquisa translacional, o que se imagina é a tradução do laboratório para a prática clínica: insights que começam no laboratório e em algum momento chegam à clínica como novos tratamentos ou estratégias terapêuticas. Porém, na era de big data nas ciências biológicas, os pesquisadores também podem considerar a “tradução reversa”, em que as informações coletadas na clínica levam a novas descobertas no laboratório. No entanto, a coleta desses insights exige que os dados clínicos sejam seguros, acessíveis, estáveis e pesquisáveis, o que muitas vezes é mais fácil na teoria do que na prática. 

“Você precisa ter os dados certos de alta qualidade. Se você inserir um monte de lixo de dados em um algoritmo analítico sofisticado, ainda assim vai obter lixo como resultado”, disse Christina Lu, chefe de gerenciamento de dados e engenharia do grupo de informática de ciências de desenvolvimento da Genentech. 

A Genentech, membro do Grupo Roche, é uma empresa líder em biotecnologia e farmacêutica. Ao longo de vários anos de ensaios clínicos e investigações, a empresa acumulou um acervo significativo de dados biológicos do mundo real. Em 2017, o grupo de ciências de desenvolvimento da Genentech implementou uma estratégia a fim de otimizar esses dados para pesquisa e desenvolvimento, com o objetivo de responder a perguntas importantes, como “Qual é o nosso próximo alvo terapêutico?” e “Como os dados de ensaios clínicos concluídos podem embasar projetos de estudos futuros?” Essa estratégia envolveu a criação de um ecossistema de dados nas plataformas da AWS para organizar os dados retrospectivamente em repositórios pesquisáveis e implementar ferramentas e processos para o futuro gerenciamento dos dados.

HCLS Symposium 2021: Genentech, membro do Grupo Roche (12:46)
kr_quotemark

Análises de dados clínicos que costumavam levar semanas agora podem ser feitas em apenas algumas horas pelos pesquisadores. É assim que aproveitamos cada ponto de dados para fornecer o medicamento certo ao paciente certo no momento certo.”

Christina Lu
Chefe de gerenciamento e engenharia de dados, informática em ciências de desenvolvimento, Genentech

A seleção dos dados revela insights clínicos

“Estamos em um momento decisivo para a pesquisa clínica: agora, se você não tiver seus dados organizados, estará realmente perdendo oportunidades significativas de desenvolver novos tratamentos e melhorar o atendimento aos pacientes”, afirmou Christina. No caso da Genentech, muitas dessas oportunidades se concentram na análise de biomarcadores (moléculas mensuráveis no corpo humano associadas a estados biológicos específicos) para compreender processos de doenças e mecanismos moleculares.

O objetivo de “ter dados organizados” é atender aos padrões que os tornam localizáveis, acessíveis, interoperáveis e reutilizáveis. Um relatório de 2018 estimou que a economia da União Europeia, por si só, perde EUR 10,2 bilhões por ano devido ao uso de dados de pesquisa não localizáveis, acessíveis, interoperáveis e reutilizáveis. No entanto, do jeito que as coisas estão, os cientistas de dados gastam até 80% do tempo coletando, limpando e organizando dados manualmente, quando sua experiência poderia ser melhor aproveitada na construção de modelos ou na realização de outras tarefas especializadas.

“A seleção de dados legados é um processo caro, demorado e não escalável”, revelou Christina. Para economizar custos e alcançar escalabilidade e eficiência, a Genentech consolidou e transferiu dados de biomarcadores existentes de sua rede de organizações de pesquisa contratadas (CROs) para um repositório centralizado e bem gerenciado hospedado no Amazon Simple Storage Service (Amazon S3), um serviço de armazenamento de objetos. Isso proporciona aos cientistas da Genentech e pesquisadores externos acesso simplificado a uma quantidade maior de informações, o que, por sua vez, acrescenta poder estatístico a estudos capazes de revelar novos alvos para terapias genéticas ou medicamentos contra o câncer.

“Se conseguirmos aplicar essas estratégias de seleção de dados com uma visão para o futuro, poderemos fazer muito mais para impactar a saúde humana”, declarou Christina.

Criação de um ecossistema de dados na AWS

“O repositório de dados de biomarcadores que construímos na AWS abriga petabytes de dados exploratórios de biomarcadores e fornece uma interface na qual os cientistas podem encontrar facilmente os dados de que precisam para um estudo específico”, disse Christina.

O repositório de biomarcadores é armazenado no Amazon S3, enquanto o Amazon Relational Database Service (Amazon RDS), um serviço gerenciado de banco de dados relacional, manipula os metadados associados, com indexação e pesquisas rápidas habilitadas pelo Amazon Elasticsearch Service. A Genentech usa o Amazon API Gateway para criar APIs que oferecem aos pesquisadores acesso seguro e específico para estudos, conforme necessário.

“Graças a essa arquitetura simplificada, análises de dados clínicos que costumavam levar semanas agora exigem apenas algumas horas dos pesquisadores”, observou Christina. “É assim que fazemos cada ponto de dado valer para entregar o medicamento certo ao paciente certo no momento certo.”

Saiba mais


Sobre a Genentech

A Genentech, membro do grupo Roche, é uma empresa de biotecnologia dedicada ao desenvolvimento de novos tratamentos para doenças graves e potencialmente fatais.

Benefícios da AWS

  • Petabytes de dados exploratórios de biomarcadores armazenados com segurança
  • Dados selecionados para serem localizáveis, acessíveis, interoperáveis e reutilizáveis, tanto em relação ao passado quanto ao futuro


Serviços da AWS usados

Amazon RDS

O Amazon Relational Database Service (Amazon RDS) facilita a configuração, a operação e a escalabilidade de bancos de dados relacionais na nuvem.

Saiba mais »

Amazon S3

O Amazon Simple Storage Service (Amazon S3) é um serviço de armazenamento de objetos que oferece escalabilidade, disponibilidade de dados, segurança e performance líder do setor.

Saiba mais »

Amazon API Gateway

O Amazon API Gateway é um serviço totalmente gerenciado que simplifica para os desenvolvedores as atividades de criação, publicação, manutenção, monitoramento e proteção de APIs em qualquer escala.

Saiba mais »

AWS Lambda

O AWS Lambda é um serviço de computação que permite criar aplicativos que respondem rapidamente a novas informações e eventos.

Saiba mais »

Amazon EC2

O Amazon Elastic Compute Cloud (Amazon EC2) oferece a plataforma de computação mais ampla e profunda, com mais de 500 instâncias e opções de processadores, armazenamentos, redes, sistemas operacionais e modelos de compras mais recentes para ajudar você a atender melhor às necessidades de sua workload.

Saiba mais »

Amazon Elasticsearch Service

O Amazon Elasticsearch Service é um serviço totalmente gerenciado que facilita a implantação, a segurança e a execução do Elasticsearch de forma eficaz e em grande escala.

Saiba mais »


Comece a usar

Empresas de todos os portes em todos os setores estão transformando seus negócios diariamente usando a AWS. Entre em contato com nossos especialistas e comece sua própria jornada para a Nuvem AWS hoje mesmo.