Janssen Pharmaceuticals が Amazon SageMaker を利用して機械学習の精度を 21% 向上

2022 年

1961 年から Johnson & Johnson の製薬企業グループに属する Janssen Pharmaceuticals (Janssen) は、機械学習 (ML) を活用して、Janssen の治療を受けている患者の体験をより深く理解しています。Janssen のデータサイエンティストは、デプロイワークフローを自動化し、開発環境と本番環境の間のより良いインターフェイスを構築するために、Amazon Web Services (AWS) を利用しました。Janssen は、ほぼすべてのユースケースに対応できる ML モデルを構築、トレーニング、デプロイするために使用可能な ML サービスである Amazon SageMaker などの AWS のサービスを採用して、自動化された ML オペレーション (MLOps) プロセスを実装しました。これにより、モデル予測の精度が 21% 向上したほか、特徴量エンジニアリングの速度が約 700% 向上しました。その結果、Janssen は効率性を高めながらコストを削減することができました。

Challenging research. Determined experienced scientist working with her microscope and wearing a uniform
kr_quotemark

プロセスの各ステップを順番に調整する代わりに、AWS Glue と AWS Step Functions を併用することで、データの準備と特徴量エンジニアリングのジョブ、およびそれらのオーケストレーション方法を並列処理できました”  

Jenna Eun 氏
Janssen Pharmaceuticals、Principal Data Scientist

研究を加速するための MLOps におけるオートメーションを求めて

Janssen の製品ポートフォリオは、免疫学、感染症、神経科学、腫瘍学など、幅広い治療分野をカバーしています。「複雑な治療過程で患者に最善のケアを提供することは重要です。そのため当社は病気の経過を通して、人々の治療体験を理解し、患者のニーズにより良く応えられるように、人工知能と機械学習を使用しています」と Janssen の Principal Data Scientist である Jenna Eun 氏は述べています。

ML に基づいて構築されたソリューションが患者体験に与える影響を加速化するため、Janssen の Business Technology Commercial Data Sciences チームは、MLOps に重点的に取り組むことにしました。MLOps とは、本番環境における ML モデルの確実で効率的なデプロイと維持、オートメーションの促進、ビジネスとテクノロジーの要件を満たすことを目的とした一連のプラクティスです。「MLOps で、実験とモデルパフォーマンスの追跡が時間とともに容易になることを目指しています」と Eun 氏は述べています。「機械学習モデルへの信頼を確立するには、実験が簡単であることと、ハイパーパラメータスペースの徹底的な調査が重要です」

自社のテクノロジーニーズと社内のセキュリティ要件を整合させることが重要であると考えた Janssen は、自動化された MLOps プロセスを構築するために部門横断的なチームを編成することにしました。「当社が構築するプロセスは医療データを利用しているため、テクノロジーソリューションを開発して実装する際には、厳格なセキュリティ対策とプライバシー対策を講じる必要があります」と Eun 氏は述べています。2020 年後半から、Janssen の Business Technology Commercial Data Sciences チームと Johnson & Johnson の Technology CloudX チームは、Amazon SageMaker ソリューションアーキテクチャチーム、および AWS で企業が望むビジネス成果をあげるようサポートできるエキスパートで構成されたグローバルチームである AWS プロフェッショナルサービスと協力して取り組みを進めました。

AWS での ML のスピードと精度が向上

Janssen の Business Technology Commercial Data Sciences チームと Johnson & Johnson の Technology CloudX チームは、Amazon SageMaker ソリューションアーキテクチャチームおよび AWS プロフェッショナルサービスと連携し、データ準備と特徴量エンジニアリングのモジュールを 3 か月未満で自動化しました。特徴量エンジニアリングとは、教師あり ML モデルのトレーニングを目的として、患者データから入力変数を作成するプロセスです。これらのステップを自動化することで、チームはデータ準備のスピードを約 600%、特徴量エンジニアリングのスピードを約 700% 向上させることができました。Janssen はこれを実現するために、ソースデータの収集、処理、および正規化に必要なステップを簡単に順序付けできるローコードのビジュアルワークフローサービスである AWS Step Functions を利用しました。AWS Step Functions は、サーバーレスのデータ統合サービスである AWS Glue を利用して仕事を調整しています。AWS Glue は、開発環境と本番環境を簡単に同期する機能を備えており、実験および最適化された ML ソリューションをより迅速にデプロイできます。「プロセスの各ステップを順番に調整する代わりに、AWS Glue と AWS Step Functions を併用することで、データの準備と特徴量エンジニアリングのジョブ、およびそれらのオーケストレーション方法を並列処理できました」と Eun 氏は述べています。「これにより、開発環境と本番環境をシームレスに接続することが簡単になり、実験しているあらゆるものを AWS Glue ジョブに迅速に変換できるようになりました。これらは、AWS Step Functions によって起動されます」

AWS で MLOps ソリューションを実装した結果、Janssen は予測モデリングの精度を 21% 向上させることができました。「データパイプラインはより自動化され、必要な時間を短縮できたため、モデルのパフォーマンスにより多くの時間を割くことができるようになりました」と Eun 氏は述べています。ML モデルの精度を向上させるためには、ハイパーパラメータの最適化が不可欠です。Janssen のチームは、モデルとデータを定義した後、Amazon SageMaker を利用して、何千ものアルゴリズムパラメータの組み合わせを調整することによってモデルを自動的に調整し、モデルが生成できる最も正確な予測を取得します。このオートメーションとベイズ最適化アルゴリズムを組み合わせることで、パラメータの検索時間を大幅に短縮できます。「詳細なハイパーパラメータ検索を実行した結果、ML モデルにより自信が持てるようになりました」と Eun 氏は述べています。

Janssen チームと Johnson & Johnson の Technology CloudX チームは、このプロジェクトを文書化し、同様の ML プロジェクトに従事している他の Johnson & Johnson チームと共有しました。学習の結果を共有することで、Johnson & Johnson のセキュリティポリシーに準拠する必要のあるプロジェクトが加速し、組織全体で MLOps 文化を育むことができます。「他の人々が従うことのできるパターンを作成することで、さまざまな AWS サービスを接続して Johnson & Johnson の環境内で完全な ML パイプラインを構築する方法を実証することができました」と Eun 氏は述べています。「以前の ML 開発およびデプロイプロセスの一部を効率化したり、効率を高めたりできるようになったことで、より高い柔軟性とスケーラビリティを実現できることに気付きました」

世界中の患者のための治療の改善

Janssen の MLOps ソリューションを利用することで、データサイエンスソリューションを大規模に提供することが可能になります。Eun 氏は次のように述べています。「当社では、実際の世界でソリューションをデプロイし、それがどのように変化をもたらすことができるのかを示す中で、より広い地域への拡張と、Johnson & Johnson の他のビジネスユースケースへの適用についての構想を練っています」。


Janssen Pharmaceuticals について

1961 年以来、Johnson & Johnson のグループ企業である Janssen Pharmaceuticals は、心血管健康、免疫学、神経科学、腫瘍学など、6 つの治療分野にわたる重篤疾患の患者の転帰の予測の改善に焦点を当てた研究開発に取り組んでいます。

AWS の利点

  • データ準備のスピードが約 600% 向上
  • 特徴量エンジニアリングのスピードが約 700% 向上
  • ML モデルの精度が 21% 向上
  • Johnson & Johnson の他のチーム向けに標準的な MLOps リファレンスアーキテクチャを確立

利用している AWS サービス

Amazon SageMaker

Amazon SageMaker は、機械学習専用に構築された幅広い一連の機能をまとめて提供することにより、データサイエンティストとデベロッパーが高品質の機械学習 (ML) モデルを迅速に準備、構築、トレーニング、およびデプロイするのを支援します。

詳細 »

AWS Step Functions

AWS Step Functions は、デベロッパーが分散アプリケーションの構築、IT およびビジネスプロセスの自動化、AWS のサービスを利用したデータと機械学習のパイプラインの構築に使用するローコードのビジュアルワークフローサービスです。

詳細 »

AWS Glue

AWS Glue は抽出、変換、ロード (ETL) を行う完全マネージド型のサービスで、お客様の分析用データの準備とロードを簡単にします。

詳細 »

AWS プロフェッショナルサービス

AWS プロフェッショナルサービス組織は、AWS クラウドを利用する際に、期待するビジネス上の成果を実現するようお客様をサポートできる、専門家からなるグローバルチームです。

詳細 »


使用を開始する

あらゆる業界のさまざまな規模の組織が AWS を活用してビジネスを変革し、日々ミッションを遂行しています。当社のエキスパートにお問い合わせいただき、今すぐ AWS ジャーニーを開始しましょう。