Regeneron 使用 AWS 将大规模基因组带入药物研发
2022 年
仅在 2020 年,12 家规模最大的生物制药公司在医药产品研发上就花费了超过 960 亿美元,药物研发成本持续稳步增长。由于绝大多数实验药物未能上市,每年只有少数新药成功获得批准并实现商业化。为了提高成功率,生物制药组织正在将基因组学纳入药物研发过程,利用基因数据更好地了解药物反应。虽然仍处于早期的采用阶段,但这种称为药物基因组学的做法已使成功率提高了一倍。如今,获批药物的靶点只占了人类基因组的 5%,但实际上有更多的基因与疾病有关。
Regeneron 是一家国际生物技术和制药公司,该公司通过使用 Amazon Web Services(AWS) 整合基因组洞察,帮助行业迈向加速和改进药物研发。Regeneron 遗传学中心(RGC)是一项研究计划,专注于对人类基因组外显子基因编码区域进行测序,并能够对基因组和健康数据进行大规模分析,以产生可操作的科学结果,用于 Regeneron 自身药物研发计划和更广泛研究群体。
“如果没有 AWS Cloud 基础设施无与伦比的可扩展性,我们就无法进行深入的大规模不可知分析。”
Jeffrey Reid 博士
Regeneron 遗传学中心首席数据官
在 AWS 支持的平台上进行大规模基因组发现
通过一次分析数千个甚至数百万个基因组,研究人员可以发现疾病与特定遗传变异之间的联系,而这种联系在少数人群中并不明显。数据集越大、越多样化,科学发现适用于广泛患者的确定性就越大。为了在全球范围内建立这些全面的数据集,Regeneron 与英国生物银行和 AWS 合作伙伴 DNAnexus 等组织密切合作,从数百万志愿者中获取基因样本和健康信息。
使用 Amazon Elastic Compute Cloud(Amazon EC2)这一 Web 服务,Regeneron 及其合作者能够在云中提供安全、可调整大小的计算容量,从而加快这些基因样本的外显子组测序和处理。使用对象存储服务 Amazon Simple Storage Service(Amazon S3)可以安全地存储由此产生的 PB 级去识别化健康和基因组数据。与本地服务器相比,将这些信息存储在 Amazon S3 上可为 Regeneron 节省 90% 的成本。到 2021 年,RGC 已以 10 倍于本地存储和计算的速度为 100 多万个基因组进行了测序。
一旦获得基因组数据,AWS 提供的分析能力将帮助 Regeneron 基于数据进行科学发现。特别是,RGC 是执行深度分析过程(“全面分析”)的领导者,该过程涉及对大量基因组数据集的搜索,用以识别数据库中存在的任何表型和基因型之间的每一种关联,最终为药物发现和开发工作提供信息。
“全面分析的关联结果表包含超过一万亿个细胞。”RGC 首席数据官 Jeffrey Reid 博士表示,“如果没有 AWS Cloud 基础设施无与伦比的可扩展性,我们就无法进行深入的大规模不可知分析。”
RGC 已与广泛的学术和制药行业团体开展研究合作,为基于项目的定制分析提供数据。研究人员可以使用 Amazon Elastic File System(Amazon EFS)安全地访问 Amazon S3 上的数据,并管理其项目所需的文件。Amazon EFS 是一种简单、无服务器、设置即用的弹性文件系统,允许个人共享文件数据,而无需调配或管理存储。
“我们使用 AWS 能够提供一箭双雕的结果,让研究能够像在学术环境中一样进行,同时提供给研究人员对他们使用的基础设施的更多控制,例如他们启动的计算实例。”Reid 表示,“为了最大限度地发挥数据的影响,必须最大限度地对数据进行访问。这就是我们使用 AWS 所做的工作。如果没有 AWS 解决方案,我们不可能在这个时间线上向世界各地的众多合作伙伴提供如此规模的数据。”
使用 AWS 实现全球合作以改善人类健康
国际产业合作是加速基因组新发现的关键。“我们需要一种跨多个机构和地点的工作方式,这也是我们专注于云计算的一个原因。”Reid 表示,“使用 AWS 帮助我们提供了一个安全的数据科学平台,我们可以在该平台上生成数据并与世界各地的合作者共享数据,应用大规模分析,然后传播这些结果。”
最大限度地提高基因组数据的影响,意味着最大限度地提高样本和正在进行的不同研究项目的代表性。RGC 在世界各地有 100 多名合作者共同努力,收集不同的基因组数据集,这将使分析能力更强大,结果的适用性更广泛。
“我们正在积极努力改善我们数据库中基因祖源的多样性,因为我们知道,由于历史上对欧洲祖源的关注更多,因此还有很多洞察尚未被发现。”Reid 表示,“通过在 AWS 上进行构建,我们可以实现全球访问的民主化,以确保在未来,精准医疗和多基因风险评分能够真正公平地改善对所有祖源人士的护理。”
关于 Regeneron
Regeneron 是一家生物技术和制药公司,致力于加速和改进传统的药物研发过程。
AWS 的优势
- 以 10 倍的速度测序了 100 多万个外显子
- 在 AWS 上存储基因组数据,与本地存储相比节省了 90% 的成本
- 支持不可知的全面数据分析,以揭示基因组洞察
- 民主化获取以提高基因组数据集的多样性,为精准医疗提供信息
- 发现了基于基因靶点的新药
使用的 AWS 服务
Amazon Elastic File System
Amazon Elastic File System 是一个简单、无服务器、设置即用的弹性文件系统,使您能够为 AWS 计算服务快速简单地创建和配置共享文件系统。
Amazon Elastic Compute Cloud
Amazon Elastic Compute Cloud(Amazon EC2)提供最广泛、最深入的计算平台,拥有超过 475 个实例,可选择最新的处理器、存储、网络、操作系统和购买模型,以帮助您最好地满足工作负载的需求。
Amazon S3
Amazon Simple Storage Service (Amazon S3) 是一种对象存储服务,提供行业领先的可扩展性、数据可用性、安全性和性能。
开始使用
不同行业和规模的企业都在使用 AWS 对其业务进行转型,以实现自身愿景。
联系我们的专家,立即踏上您的 AWS 之旅。