支持
在 24 小时内运行超过 510 亿次统计测试
在 2020 年
支持扩展或缩减
为科学探索
概览
在首个人类基因组图谱发表大约 20 年后,基因组学开始从研究密集型实践转变为个性化医学的驱动力。在此过渡期内,全球生物制药公司 AstraZeneca 正在加速推进基因组在精准医学中的应用,并推动基因组的解读以改变药物发现。
AstraZeneca 使用 PB 级基因组测序数据为药物研发提供信息。为了大规模地快速处理数据,AstraZeneca 使用 Amazon Web Services (AWS) 构建了一个快速、高效的解决方案,以提取有影响力的基因组见解。
我们已经利用这些能力为 AstraZeneca 2020 年的 40 多个药物研发项目提供了遗传学方面的信息。”
Slavé Petrovski
AstraZeneca 研发部基因组研究中心副总裁兼基因组分析与信息学主管
机会 | 构建一个让科学家能够自由创新的解决方案
除了从基因组数据中快速收集见解外,AstraZeneca 还希望将资源重新分配给科学探索,并避免将用于研究生物信息学的时间浪费在价值相对较低的数据管理活动上。由于该公司通过多个来源大量收集 PB 级的数据,因此它需要强大、可扩展的计算容量。
由于之前已在 AWS 上进行了构建,因此 AstraZeneca 决定扩大 AWS 工具的使用范围,以开发基于云的生物信息学解决方案,从而进行快速基因组处理和分析。
解决方案 | 在 AWS 上进行自动化以提供快速见解
AstraZeneca 的高吞吐量解决方案可执行基因组数据处理和分析的许多步骤。基因组二次分析着眼于原始测序读数,以重建基因组并识别可以在随后阶段进一步分析的基因组变异。为自动化这些步骤的数据编排,该架构会使用 AWS Lambda,这是一种无服务器计算服务,可让用户无需预置或管理服务器即可运行代码。要构建任务执行层,该架构会使用 AWS Batch,该工具可根据提交的批处理作业的卷和特定资源需求,动态预置最佳的计算资源(如 CPU 或内存优化型实例)数量和类型。在此过程中,该架构会使用对象存储服务 Amazon Simple Storage Service (Amazon S3) 将数据分类到存储桶中。
在 AWS 上,AstraZeneca 通过扩展、计算能力和访问丰富技术服务实现加速及生产力提升。因为公司可以在需要时大规模运行分析,所以数据可以更快地用于分析。“我们现在可以在 24 小时内运行超过 510 亿次统计测试,研究单个突变或单个基因的影响,其中每个突变或基因都有各种表现型,”AstraZeneca 基因组研究中心副总裁兼基因组分析与信息学主管 Slavé Petrovski 说道。该公司的举措已日渐成效。“我们已经利用这些能力为 AstraZeneca 2020 年的 40 多个药物研发项目提供了遗传学方面的信息。”Petrovski 如是说道。
结果 | 推动科学创新
AstraZeneca 生产了一条快速、高效的基因组生物信息学管道,使其科学家能有时间和资源追求创新。因此,该公司的基因组研究中心已将其目标设定为到 2026 年能完成 200 万个基因组分析。
关于 AstraZeneca
AstraZeneca 是一家致力于开发可用于各治疗领域的创新药物的全球性生物制药公司。基因组研究中心是 AstraZeneca 的一项举措,旨在到 2026 年完成 200 万个基因组分析。
更多 AstraZeneca 案例
行动起来
无论行业无论规模,每天都有各种机构在使用 AWS 实现自身业务转型、实现企业愿景。欢迎您联系我们的专家,立即踏上您的 AWS 之旅。