Genentech 利用 AWS 最大限度地提高临床生物标记物数据的价值
2022 年
大多数人想到转化研究时,想到的是从实验室的洞察开始,最终作为新的治疗方法或治疗策略进入临床这一“从实验桌到病床”的转化。但在生命科学大数据时代,研究人员也可以考虑“逆向转化”,即临床收集的信息带来实验室的新发现。然而,获得这些洞察需要安全、可访问、稳定和可搜索的临床数据,往往说起来容易做起来难。
“您必须拥有正确的高质量数据。如果把一堆垃圾数据放入一个复杂的分析算法中,得到的仍然是垃圾。”Genentech 发展科学信息学数据管理和工程主管 Christina Lu 表示。
罗氏集团旗下的 Genentech 是一家领先的生物技术和制药公司。该公司从多年的临床试验和研究中积累了大量真实世界的生物数据。2017 年,Genentech 的发展科学小组实施了一项战略,以优化研究与开发数据,旨在回答诸如“我们的下一个药物目标是什么?”和“已完成的临床试验数据如何为未来的试验设计提供信息?”等关键问题。 该战略涉及在 AWS 平台上构建数据生态系统,以便将数据追溯整理到可搜索的存储库中,并为未来可能的数据管理提供工具和流程。
研究人员过去需花费几周时间进行的临床数据分析现在只需几小时。因此,我们可以使每个数据点发挥作用,才能在正确的时间向正确的患者交付正确的药物。”
Christina Lu
Genentech 数据管理和工程、发展科学信息部经理
通过数据管理解锁临床洞察
Lu 表示:“我们正处于临床研究的转折点,现在,如果没有数据,实际上就失去了开发新疗法和改善患者护理的重要机会。”在 Genentech 的案例中,许多机会都围绕着分析生物标志物(即人体中与特定生物状态相关的可测量分子),来理解疾病过程和分子机制。
“数据到位”的目标是满足 FAIR 的标准:可查找、可访问、可互操作和可重复使用。2018 年的一份报告估计,仅欧盟经济体每年就因使用不满足 FAIR 标准的研究数据导致被罚没 102 亿欧元。但事实上,数据科学家 80% 的时间都用在手工收集、清理和组织数据上,而原本他们的专业知识能够更好地用于构建模型或执行其他专业任务。
Lu 表示:“传统数据管理成本高昂、耗时且不可扩展。”为了节省成本并实现可扩展性和高效率,Genentech 将现有的生物标志物数据从其合同研究组织(CRO)网络整合并转移到一个管理良好的集中存储库中,该存储库托管在对象存储服务 Amazon Simple Storage Service(Amazon S3)上。这使 Genentech 的科学家和外部研究人员能够简化获取更多信息的过程,从而为可能揭示新基因疗法或癌症药物靶点的研究增加了统计能力。
Lu 表示:“如果我们能够前瞻性地应用这些数据管理策略,我们就可以在影响人类健康方面取得更多成就。”
在 AWS 上构建数据生态系统
Lu 表示:“我们在 AWS 上构建的生物标志物数据存储库存储了数 PB 的探索性生物标志物数据,并提供了一个交互界面,使科学家可以轻松地找到特定研究所需的数据。”
该生物标志物存储库存储在 Amazon S3 上,而 Amazon Relational Database Service(Amazon RDS)(一种托管关系数据库服务)负责通过 Amazon Elasticsearch 服务实现的索引和快速搜索来处理相关的元数据。Genentech 使用 Amazon API Gateway 创建 API,根据需要为研究人员提供安全的、特定于研究的访问。
“由于这种精简的架构,研究人员过去需花费几周时间进行的临床数据分析现在只需几小时。”Lu 表示,“因此,我们可以使每个数据点发挥作用,才能在正确的时间向正确的患者交付正确的药物。”
了解更多
关于 Genentech
罗氏集团旗下的 Genentech 是一家生物技术公司,致力于为严重和危及生命的疾病开发新疗法。
AWS 的优势
- 安全存储数 PB 级的探索性生物标志物数据
- 处理的数据应回顾性和前瞻性地具有可查找、可访问、可互操作和可重复使用(FAIR)性
使用的 AWS 服务
Amazon RDS
Amazon Relational Database Service (Amazon RDS) 让您能够在云中轻松设置、操作和扩展关系数据库。
Amazon S3
Amazon Simple Storage Service (Amazon S3) 是一种对象存储服务,提供行业领先的可扩展性、数据可用性、安全性和性能。
Amazon API Gateway
Amazon API Gateway 是一项完全托管式服务,可以帮助开发人员轻松创建、发布、维护、监控和保护任意规模的 API。
AWS Lambda
AWS Lambda 是一种计算服务,允许您构建能够快速响应新信息和事件的应用程序。
Amazon EC2
Amazon Elastic Compute Cloud(Amazon EC2)提供最广泛、最深入的计算平台,拥有超过 500 个实例,可选择最新的处理器、存储、网络、操作系统和购买模型,以帮助您最好地满足工作负载的需求。
Amazon Elasticsearch Service
Amazon Elasticsearch Service 是一项完全托管的服务,方便您大规模经济高效地部署、保护和运行 Elasticsearch。
开始使用
不同行业和规模的公司都在使用 AWS,将其日常业务运营进行转型。联系我们的专家,立即踏上您的 AWS 云之旅。