この記事は、2026/3/12に公開された「How Cloudera and Salt AI Deliver a Flagship AI Foundation for Life Sciences」の翻訳です。
ライフサイエンス分野のチームは、これまで以上に多くのデータ、モデル、および規制当局による厳格な審査に対応しながら取り組んでいます。そうしたデータの多く(オミックス、画像、電子カルテ、治験プロトコル、実世界のエビデンスなど)は、検索や管理が難しい非構造化形式で保存されています。
AI は、ライフサイエンス分野で可能なことを再定義する可能性を秘めています。分断された膨大な生物学データや臨床データを実用的な情報へと変換すれば、発見を促進し、意思決定を迅速化し、最終的には命を救うイノベーションをより早く患者に届けることができます。しかし、まず組織は、AI による意思決定が説明可能で、安定しており、法令を遵守していることを証明しなければなりません。
このような環境では、一度きりの概念実証(POC)だけでは不十分です。AI を活用した知見に対する適切なレベルのガバナンスと信頼性を実現するには、ライフサイエンス関連組織は、信頼できるデータおよびコンピューティング基盤と、モデルやワークフローを大規模に調整できるインテリジェンス層を組み合わせる必要があります。
Cloudera と Salt AI はパートナーシップを組み、ライフサイエンスチーム向けに強力なリファレンスソリューションを統合して提供します。
Clouderaは、データストリーミング、データエンジニアリング、データウェアハウス、ML・生成AI を統合し、SDX を通じて統一されたガバナンスとセキュリティレイヤーを備えた、オープンなデータレイクハウスおよびエンタープライズ AI プラットフォームを提供します。このフレームワークは、属性ベースのデータアクセス制御、データ系統管理、アクティブなメタデータの拡充およびカタログ化といった機能を備えています。
Salt AI は、これらの基盤となるセキュリティメカニズムを活用し、AI モデルおよびデータ全体にわたるオーケストレーション層を追加します。拡張性の高いインフラストラクチャは、プロンプト、システムプロンプト、ワークフロー設計、実行パフォーマンス、ユーザーロール、データソースといったコンテキストを継続的に取得し、専門的な AI モデルと汎用的な AI モデルの両方から最大限の価値を引き出す複雑なユースケースを可能にします。エージェント操作のツール呼び出しは、Salt の txt2 アシスタントを通じて簡単に起動でき、パイプラインはキャンバス上で視覚的に表示され、データの流れを正確に示します。
このパートナーシップにより、ライフサイエンス関連組織は、オンプレミス、パブリッククラウド、ハイブリッド環境全体にわたってきめ細かな制御を適用し、特定のタスクに適したあらゆるモデルを使用し、AI システムがどのように意思決定を行うかを監査可能な視覚的な記録として残すことが可能になります。
さらに、Cloudera と Salt AI はどちらも、データライフサイクル全体で計算と運用の効率を高めます。GPU アクセラレーションフレームワークを活用して、Cloudera はデータエンジニアリングと LLM 推論ワークロードにおいて、それぞれ最大 20 倍および 36 倍の改善を実現します。同様に、Salt AI は CPU と GPU のプロセスをバランスよく行う分割コンピューティングアーキテクチャ、高度なキャッシュシステム、AI モデルのスワップ、混合、ワークフローへの統合機能などの最適化を提供します。パイプラインが複雑になるほど、また実行回数が増えるほど、Salt 上で実行した場合の計算効率は向上します。
Cloudera と Salt AI のソリューションは、クラウド、データプラットフォーム、AI ツールから成る各顧客の既存のエコシステム内でシームレスに機能するように明確に設計されています。顧客の仮想プライベートクラウド(VPC)内に導入でき、パブリックインターネットへのデータ通信を行わない構成にも対応しています。さらに、さまざまなモデルプロバイダー、ベクトルストア、データシステムとも連携します。
Apache Iceberg 上に構築された Cloudera のオープンデータレイクハウスは、多機能な分析と自動化されたデータ管理機能(スキーマやパーティションの進化など)を組み合わせた柔軟でパフォーマンスの高いテーブル形式を提供します。このアプローチにより、多様なデータソースにわたる特徴量エンジニアリングのワークフローが標準化され、ライフサイエンス分野における GxP コンプライアンスが促進されます。
さらに、Cloudera Iceberg REST カタログを使用すると、Apache Iceberg テーブルをサポートする他のパブリッククラウドデータプラットフォーム(Databricks、Snowflake など)とのデータ共有が可能になります。Salt AI は、テキストクエリを、LLM、グラフデータベース、モデリングツール、および社内システムをオーケストレーションする研究開発ワークフローに変換するメカニズムを提供します。さらに、研究者がコード(例えば Python スクリプト)を視覚的なワークフローに変換できるようにし、研究チーム間の部門横断的なコラボレーションを向上させます。これらの機能により、孤立しがちな研究プロジェクトをより多くの人にとって利用しやすいものにし、カスタムの連携・オーケストレーションロジックを地道に構築する労力を必要とせずに複雑なシステムを自動統合できるため、イノベーションのサイクルが加速します。
Cloudera を標準で利用しようとしている組織にとって、このパートナーシップは迅速な導入経路になります。ガバナンスされたデータとコンテキストに応じたオーケストレーションの組み合わせで、分子設計、ドラッグリポジショニング、トランスレーショナルメディシン、プロトコルオーサリング、メディカルアフェアーズアシスタントなどのユースケースにすぐに活用できます。他の組織には、既存のデータプラットフォームとコンテキスト優先の AI オーケストレーションレイヤーを融合させるためのブループリントとなります。
図1. Cloudera と Salt AI のパートナーシップがライフサイエンス分野のイノベーションを加速させる方法
企業環境への導入では、Cloudera と Salt AI の組み合わせにより、組織は前例のない規模の運用を実現できるようになりました。具体的には、1 時間あたり数千件のデータエンジニアリングジョブの処理能力、複雑な研究開発ワークフローの迅速なプロトタイピング、そして AlphaFold2 のような機械学習ワークロードにおける飛躍的なパフォーマンスとコストの改善などが挙げられます。例えば Salt AI は、AlphaFold2 について、従来のベンチマークと比べて処理時間を 22 倍高速化しました。同様に重要なのは、これらの成果には、包括的なテレメトリ、ガバナンスの継承、さらにすべてのワークフロー実行について明確な監査証跡を伴って得られる点です。最終的にチームは、既存のデータや技術ソリューションの統合作業ではなく、科学的成果に集中することができます。
Salt AI は、クラウド、データプラットフォーム、モデルの幅広いエコシステムとの相互運用性に投資し続けるとともに、Cloudera などのパートナーと協力して、規制対象業界が採用・適応できる具体的なパターンを公開していく予定です。ライフサイエンスチームにとって、これは AI 実験を耐久性があり信頼できるシステムへと転換するための、より多くの選択肢とより明確な事例が得られることを意味します。Cloudera の機能や Salt AI プラットフォームについて詳しくは、各ページをご覧ください。
This may have been caused by one of the following: