Fabric Genomics 案例研究
2018 年
Fabric Genomics 是一家软件基因组公司,为临床实验室、医院实验室、生命科学公司、国家测序计划和研究机构提供端到端基因组数据分析、注释、审编、分类和报告解决方案。借助该组织的机器学习技术和高级专有算法 VAAST 和 Phevor,科学家可以快速准确地处理和分析遗传性疾病和肿瘤的全基因组、外显子组和基因组合。Fabric Genomics 总部位于加利福利亚州奥克兰市,致力于帮助客户加快研究与遗传性疾病的致病因子相关的问题。
使用 AWS 上的 Fabric Genomics 解释软件和其他软件工具,我们可以在数分钟内解释全基因变种组,而其他平台可能需要花费数小时。这意味着我们可以快速开始分析,并从数百万个数据点中提取少量具有明显儿童疾病标记的数据点。”
Shareef Nahas
挑战
使用 Fabric Genomics 平台的客户每天都可能通过标识疾病致病变种来帮助拯救生命。利用这些信息,临床医生可根据患者的基因组为患者确定最佳的治疗方法和药物疗法。
强大的性能是该平台成功的关键。Fabric Genomics 首席执行官和联合创始人 Martin Reese 介绍,“速度对于我们的软件来说是非常重要的,因为我们的客户正在致力于精确定位重症患者所患疾病的遗传学致病因子。例如,瑞迪儿童基因组医学研究所使用 Fabric Genomics 解释和临床报告软件作为其生物信息学管道的一部分,用于标识儿童基因组的致病变种。该机构的临床实验室高级运营总监 Shareef Nahas 介绍,“我们进行快速基因组测序,找出导致住进新生儿或小儿科重症监护室的重症儿童患病的遗传性疾病。“我们对基因组测序并将数据提供给医疗人员的速度越快,这些儿童就能越早受到治疗。”
除了性能之外,Fabric Genomics 还需要其软件具有高度的可扩展性。“可扩展性对我们来说非常重要,尤其是考虑到临床实验室通常需要对患者父母和兄弟姐妹的 DNA 进行测序。”Reese 说道,“数据文件非常大,有数百万个文件,每个文件大小高达 200G,这些文件需要非常快速地进行比较,因此,我们需要支持大型文件并能够同时分析所有文件的工具。”
为什么选择 Amazon Web Services
为了获得所需的性能和可扩展性,Fabric Genomics 选择了在 Amazon Web Services (AWS) 云上运行其软件。“通过使用 AWS,我们获得了处理和分析大型基因组数据集所需的计算能力和功能。”Reese 说道,“在目前的典型实验室中,解释一个基因组需要花费 12 周。而使用我们的软件,可将这一时间减少到两个小时。”
该公司使用在最新 Intel® Xeon® 处理器上运行的 Amazon Elastic Compute Cloud (Amazon EC2) 实例在 AWS 上运行两种计算工作负载:变种发现和变种解释。“Intel 处理器对我们的工作负载性能至关重要。”Reese 说道,“在某些复杂的变种发现过程中,我们会同时在所有处理内核中使用最多 200GB RAM,而 Intel Xeons 在此繁重的负载下性能极佳。” Fabric Genomics 将基因组测序结果存储在 Amazon Simple Storage Service (Amazon S3) 存储桶中,并将高吞吐量 Amazon Elastic Block Store (Amazon EBS) 卷用于参考数据库。
对基因组数据测序后,将 FASTQ 或 VCF 文件上传到 Fabric Genomics 平台以便分析变种。使用机器学习技术和高级算法对变种进行排序。实验室主管可以查看数据并生成可自定义的临床报告。
Fabric Genomics 平台提供全面的数据和网络安全,并全面支持符合 HIPAA、ISO 27001 和 FDA 21 CFR Part 11 等法规。此外,组织在很大程度上将依赖于 AWS 的安全性功能和额外的加密技术来保护患者数据。“这是世界上最敏感的一部分数据,它实际上就是一个人的代码。”Reese 说道,“AWS 为我们提供了增强的安全性,帮助我们符合严格的患者健康信息 (PHI) 数据保护要求。”
优势
AWS 和 Intel 技术赋予了 Fabric Genomics 为客户提供快速的计算速度和安全性的能力。Reese 说道,“由于使用 AWS 和 Intel 而获得的性能,我们的软件可以非常快速的执行基因组测序和分析。”因此,瑞迪儿童基因组医学研究所等客户可以更快地将数据提供给医生。“使用 AWS 上的 Fabric Genomics 解释软件和其他软件工具,我们可以在数分钟内解释全基因变种组,而其他平台可能需要花费数小时,”Nahas 说道。“这意味着我们可以快速开始分析,并从数百万个数据点中提取少量具有明显儿童疾病标记的数据点。”Nahas 说道,“正是基于此,我们有时可以在数分钟内做出诊断,并立即将信息提供给瑞迪儿童医院的医疗人员,以便他们治疗重症儿童。”
在某些情况下,使用瑞迪儿童基因组医学研究所的生物信息管道进行快速全基因组测序的瑞迪儿童医院医疗团队发现,患者所患疾病与最初所想的不同。Nahas 说道,“我们可以更准确地诊断,因为我们的分析已表明疾病是什么,医生可以知道有帮助的精确药物疗法和治疗方法。”
Fabric Genomics 利用 AWS 的可扩展性可满足具有极大量数据分析需求的客户。“通过使用 AWS,我们可以根据需要扩展我们的平台规模。”Reese 说道,“如果客户要处理 10,000 个基因组,我们能够同时处理所有这些基因组。我们的计算能力可以无限扩展。如果没有 AWS 的可扩展性,那将无法在两天内提供 10,000 份报告。” 此外,该公司正在全球范围内使用多个 AWS 可用区来满足其客户的需求。“AWS 遍布很多地区,我们可以根据需要在全球部署我们的软件。”Reese 说道,“这对我们非常有帮助,因为由于当地法规要求,我们的部分客户的敏感数据不能离开其所在地区。我们可以帮助他们通过使用 AWS 将这些数据存储在他们的国家或地区。”
Fabric Genomics 的平台正在被众多临床实验室用来分析全基因组、外显子组和基因组合,公司很高兴与很多实验室合作,因为这些实验室将他们的测试量扩展到 NGS 测试。“精确医疗刚刚起步。”Reese 说道,“使用 AWS 的人越多,分享数据越方便,因此,人们可以发现新的见解,我们可以更早地治疗患者并找出患病原因。这样我们可以提供更高效的治疗方案,使患者更健康。”
Fabric Genomics 案例研究
Fabric Genomics 是一家软件基因组公司,为临床实验室、医院实验室、生命科学公司、国家测序计划和研究机构提供端到端基因组数据分析、注释、审编、分类和报告解决方案。
使用的 AWS 服务
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) 是一种 Web 服务,可以在云中提供安全并且可调整大小的计算容量。该服务旨在让开发人员能够更轻松地进行 Web 规模的云计算。
Amazon S3
Amazon CloudFront 是一项快速内容分发网络 (CDN) 服务,可以安全地以低延迟和高传输速度向全球客户分发数据、视频、应用程序和 API,全部都在开发人员友好的环境中完成。
Amazon EBS
Amazon Elastic Block Store (EBS) 是一种易于使用的高性能数据块存储服务,旨在与 Amazon Elastic Compute Cloud (EC2) 一起使用,适用于任何规模的吞吐量和事务密集型工作负载。
了解更多 »
开始使用
各行各业中所有规模的公司都在使用 AWS 对其日常业务进行转型。联系我们的专家,立即踏上您的 AWS 云之旅。