Genentech massimizza il valore dei dati dei biomarcatori clinici con AWS
2022
Quando la maggior parte delle persone pensa alla ricerca traslazionale, pensa alla traslazione dal tavolo da lavoro al letto del paziente: approfondimenti che iniziano in laboratorio e raggiungono infine la clinica sotto forma di nuove terapie o strategie terapeutiche. Tuttavia, nell'era dei big data nelle scienze della vita, i ricercatori pensano anche alla “traslazione inversa”, in cui le informazioni raccolte in clinica consentono di effettuare nuove scoperte in laboratorio. Tuttavia, per raccogliere questi approfondimenti occorre che i dati clinici siano sicuri, accessibili, stabili e ricercabili - il che è spesso più facile a dirsi che a farsi.
“Sono necessari dati corretti di qualità. Inserendo un'enorme quantità di dati inutili in un sofisticato algoritmo analitico, si ottiene come risultato altrettanti dati inutili”, ha affermato Christina Lu, responsabile della gestione e dell'ingegneria dei dati nel reparto di informatica delle scienze dello sviluppo presso Genentech.
Genentech, membro del Gruppo Roche, è una delle più importanti società biotecnologiche e farmaceutiche. Ha accumulato una grande quantità di dati biologici reali derivanti da anni di studi clinici e ricerche. Nel 2017, il gruppo di scienze dello sviluppo all'interno di Genentech ha implementato una strategia per ottimizzare i dati per la ricerca e sviluppo, con l'obiettivo di rispondere a domande fondamentali come “Qual è il nostro prossimo obiettivo farmacologico?” e “In che modo i dati delle sperimentazioni cliniche completate possono contribuire alla progettazione delle sperimentazioni future?” Questa strategia prevedeva la creazione di un ecosistema di dati su piattaforme AWS, per gestire in modo retrospettivo i dati nei repository ricercabili e mettere in atto strumenti e processi per la futura gestione dei dati.
Le analisi dei dati clinici che prima necessitavano di settimane ora richiedono ai ricercatori solo poche ore. In questo modo, facciamo sì che ogni punto dati sia importante per fornire il farmaco giusto al paziente giusto al momento giusto.”
Cristina Lu
Christina Lu, Head of Data Management and Engineering, Development Sciences Informatics presso Genentech
La gestione dei dati sblocca gli approfondimenti clinici
“Siamo a un punto di svolta nella ricerca clinica: oggi, se non si dispone di dati, si sta effettivamente rinunciando a opportunità significative per sviluppare nuove terapie e migliorare la cura del paziente”, ha affermato Lu. Nel caso di Genentech, molte di queste opportunità sono incentrate sull'analisi dei biomarcatori, molecole misurabili nel corpo umano associate a specifici stati biologici, per comprendere i processi patologici e i meccanismi molecolari.
L'obiettivo per “disporre dei dati” è soddisfare gli standard di equità sintetizzati da FAIR: Findable, Accessible, Interoperable, Reusable, ovvero reperibili, accessibili, interoperabili e riutilizzabili. Un report del 2018 ha stimato che l'economia dell'Unione europea da sola perde 10,2 miliardi di euro all'anno utilizzando dati di ricerca non equi. Tuttavia, per come stanno le cose, i data scientist dedicano fino all'80% del tempo a raccogliere, pulire e organizzare i dati manualmente, invece di utilizzare le loro competenze nella creazione di modelli o nell'esecuzione di altre attività specializzate.
“La gestione dei dati legacy è costosa, richiede tempo e non è scalabile”, ha affermato Lu. Per risparmiare sui costi e ottenere scalabilità ed efficienza, Genentech ha consolidato e trasferito i dati dei biomarcatori esistenti dalla propria rete di organizzazioni di ricerca a contratto a un repository centralizzato e correttamente gestito ospitato su Amazon Simple Storage Service (Amazon S3), un servizio di archiviazione di oggetti. Ciò consente agli scienziati di Genentech e ai ricercatori esterni un accesso ottimizzato a una maggiore quantità di informazioni, il che a sua volta aggiunge potenza statistica agli studi rivelatori di nuove terapie geniche o bersagli per farmaci antitumorali.
“Applicando queste strategie di gestione dei dati in maniera prospettica, otteniamo molto di più per avere un impatto sulla salute umana”, ha affermato Lu.
Creazione di un ecosistema di dati su AWS
“L'archivio di dati sui biomarcatori che abbiamo creato su AWS contiene petabyte di dati esplorativi sui biomarcatori e fornisce l'interfaccia in cui gli scienziati trovano facilmente i dati di cui hanno bisogno per uno studio specifico”, ha affermato Lu.
Il repository dei biomarcatori è archiviato su Amazon S3, mentre Amazon Relational Database Service (Amazon RDS), il servizio di database relazionale gestito, si occupa dei metadati associati, con l'indicizzazione e la ricerca rapida abilitate da Amazon Elasticsearch Service. Genentech utilizza il Gateway Amazon API al fine di creare API che forniscono accesso sicuro e specifico per lo studio ai ricercatori, secondo necessità.
“Grazie a questa architettura ottimizzata, le analisi dei dati clinici prima necessitavano settimane ora richiedono ai ricercatori solo poche ore”, ha affermato Lu. “In questo modo, facciamo sì che ogni dato sia importante per fornire il farmaco giusto al paziente giusto al momento giusto.”
Ulteriori informazioni
Scopri come AWS trasforma la gestione dei dati per altre aziende del settore delle scienze della vita.
Informazioni su Genentech
Genentech, membro del gruppo Roche, è l'azienda biotecnologica dedicata allo sviluppo di nuovi trattamenti per malattie gravi e potenzialmente letali.
Vantaggi di AWS
- Petabyte di dati esplorativi sui biomarcatori archiviati in modo sicuro
- Dati gestiti per essere reperibili, accessibili, interoperabili e riutilizzabili (FAIR), sia retrospettivamente che prospetticamente
Servizi AWS utilizzati
Amazon RDS
Amazon Relational Database Service (Amazon RDS) semplifica l'impostazione, il funzionamento e il dimensionamento di database relazionali nel cloud.
Amazon S3
Amazon Simple Storage Service (Amazon S3) è un servizio di storage di oggetti che offre scalabilità, disponibilità dei dati, sicurezza e prestazioni all'avanguardia nel settore.
Gateway Amazon API
Gateway Amazon API è un servizio completamente gestito che semplifica per gli sviluppatori la creazione, la pubblicazione, la manutenzione, il monitoraggio e la protezione delle API su qualsiasi scala.
AWS Lambda
AWS Lambda è un servizio di elaborazione che consente di creare applicazioni che rispondono rapidamente a nuove informazioni ed eventi.
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) offre la piattaforma di calcolo più ampia e approfondita, con oltre 500 istanze e la selezione dei più recenti processori, sistemi di archiviazione, reti, sistemi operativi e modelli di acquisto per aiutarti a soddisfare al meglio le esigenze del tuo carico di lavoro.
Amazon Elasticsearch Service
Amazon Elasticsearch Service è un servizio completamente gestito che semplifica distribuzione, protezione ed esecuzione di Elasticsearch con costi ridotti e su vasta scala.
Inizia
Le aziende di tutte le taglie e di tutti i settori stanno trasformando ogni giorno la propria attività grazie ad AWS. Contatta i nostri esperti e inizia subito il tuo viaggio in AWS Cloud.