Evolve logo オンデマンド配信 Evolve 2023 Tokyo|AI、データと分析の先進事例を紹介
  • Cloudera Cloudera
  • GlaxoSmithKline logo
    臨床分析: 数ヶ月から数分へ

    概要

    Category

    • ヘルスケア
    • 医薬品業界
    • バイオテック

    ロケーション

    本社:英国ブレントフォード

    ソリューション概要

    • 最新のデータプラットフォーム: Cloudera Enterprise
    • ワークロード: データウェアハウス、データサイエンスおよびエンジニアリング
    • 主要コンポーネント: Apache HBase、Apache Impala、Apache Kafka、Apache Sentry、Apache Spark、Cloudera Data Science Workbench、Cloudera Navigator、Cloudera Search、Kerberos
    • データサイエンスツール: Anaconda、Hail、IPython、JupyterHub、RStudio
    • データベース:MongoDB
    • BI および 分析ツール:AtScale、Kinetica、SpotFire、Trifacta、Waterline Data、Zoomdata
    • データ取り込みおよびキュレーションツール: StreamSets、Tamr
    • 構築パートナー: Modak Analytics、+tellic、Cloudwick

    主な用途

    • R&D 情報プラットフォーム

    データソース

    • 2,000以上のデータベースが、ディスカバリ、臨床、ゲノミクス、その他の R&D データをカバーしています。

    インパクト

    • データのサイロを大幅に削減
    • 新薬の開発を迅速化
    • 臨床試験のデータが利用可能になるまでの時間を、数ヶ月から数分にまで短縮
    • 臨床試験における被験者選定の時間とコストを削減

    ビッグデータの規模

    • Over 5 PB

    GlaxoSmithKlineの R&D 情報プラットフォームは、Clouderaおよびパートナーのテクノロジーを使って、同社のサイエンティストに対して、新製品の開発やコストの削減、医薬品の安全性向上、最終的に生命力の向上や寿命の延長、生命の救済に貢献するインサイトを提供しています。

    GlaxoSmithKline (GSK) は、グローバルな製薬会社として、世界150ヶ国で事業を展開し、87の製造拠点ネットワークを持ち、英国、米国、ベルギー、中国に R&D センターを構えています。

    課題

    新薬やワクチンを市場に提供する際には、研究からテスト、臨床試験、当局の承認という必要な全ての手順の実施に、6年から12年以上を要する場合もあります。一旦新製品が市場に出回ると、製薬会社は特許が切れる迄のわずかな期間に開発コストを回収する必要があります。このような課題に加え、医薬品の製造にかかるコストはここ数年変化しておらず、収益の大幅な低下を招く結果となっています。

    GSKでは、これらの課題に対処するため、研究開発 (R&D) 全体のデータ活用方法の変革を目指しました。「データがサイロ化しているため、R&Dのパイプライン全体で把握した内容を活かして構築作業を進めることが困難な状態にありました。コストを削減し開発スピードを向上させ、新たなレベルの効率性やインサイトを得るためには、全ての非構造化と構造化 R&D データを取り込み、より優れた分析機能を提供できるプラットフォームを構築する必要がありました」と GSK のシニアバイスプレジデント兼チーフデータオフィサー、Mark Ramsey 氏は述べてています。

    ソリューション

    Clouderaパートナーテクノロジー、そして自社開発のツールを使った GSK R&D 情報プラットフォームは、R&D内に存在する全てのデータに対する包括的なビューを実現すると共に、研究者には多くの分析上のメリットを提供します。例えば、様々な臨床試験から上がって来るデータを収集して分析するまで、以前は数ヶ月かかることもありました。今では、臨床試験データは標準化され、すぐに分析可能な状態となっており、同じ分析を数分で終わることができるようになりました。数ヶ月が数分に短縮されたことには大きな価値があります。

    同プラットフォームには、創薬、臨床、ゲノミクス、および 2,000 を超えるサイロからの R&D データなど、10もの異なるデータドメインの 5ペタバイト以上のデータが集約されています。結果的にデータがいつ、どのように、どこで発生したかに関わらず、研究者はデータを組み合わせて分析を行うことが可能です。GSK の R&D 組織全体のユーザーが、このプラットフォームを利用しています。Ramsey 氏は、次のように述べています。「このような大規模なデータ戦略が策定されたのは、GSK 始まって以来のことです。当プラットフォームは、これまでの状況を一新するようなインサイトを提供しています」

    実装

    ヘルスケア業界では、個人情報保護やセキュリティが特に重要視されるため、GSK は同プラットフォームが「医療保険の相互運用性と説明責任に関する法律 (HIPPA)」を含め、厳しい業界や内部の基準に対応できることを確認する必要がありました。「Cloudera を選択した重要な理由の1つは、エンタープライズクラスのセキュリティ対応が可能である点です。Cloudera SDX の機能を活用することで、全てのメタデータやポリシー情報を集中的に管理することができます」とRamsey 氏は説明しています。

    成果

    GSK の研究者は、新しいプラットフォームを使って、R&D のあらゆるプロセスの合理化に役立つ、次のようなインサイトを取得することができます。

    • 創薬。サイエンティストは、企業全体で実施された実験に関する全ての詳細なデータを確認することができます。このような情報は、新薬の開発加速に重要となります。

    • ゲノミクス分析。GKSの研究者は、レガシーなプラットフォームでは非現実的だった、50万人に及ぶゲノムデータの関連性分析を実施することができます。彼らは、最初の分析でボディマス指数など、特定の特性に関連するDNA変異体を調査しました。

    • 臨床試験。臨床試験チームは、幅広いデータと分析機能を組み合わせることで、臨床試験での被験者の最適な組み合わせを決定するための時間と費用を削減することができました。

    多くの R&D プロセスにおいて極めて優れた効率が達成され、新たなインサイトを手に入れることができたことにより、GKSのエグゼクティブは、患者を支援するために、最終的に市場投入までの時間の短縮、つまり、新薬やワクチンをさらに迅速かつ低コストで市場に投入できることを期待しています。

    私達は、サイエンティストのために、製品提供の時間やコストを削減し、市場を拡大して安全性を高め、最終的に生命力の向上や寿命の延長、そして生命の救済に貢献するインサイトを提供できるプラットフォームを構築しました。

    -GSK、R&D チーフデータオフィサー Mark Ramsey 氏