クラウド環境に最適化された機械学習と分析向けの最先端のプラットフォームを提供するCloudera(本社:米国カリフォルニア州パロアルト市、CEO: Tom Reilly(トム・ライリー)/以下、Cloudera)は本日、Microsoft Azureクラウドプラットフォーム向けCloudera Altus Data Engineeringのベータ版を近日中に提供開始することを発表しました。Cloudera Altusとは、エンタープライズグレードのClouderaディストリビューションを元に構築された、PaaS(Platform-as-a-Service)製品です。これによりデータエンジニアは、オンデマンドのクラウドインフラストラクチャーを使用して、データパイプラインを迅速に構築・運用することができ、データドリブンの高度なアプリケーションに対応することが可能になります。今回AltusがAzure環境に対応することで、使い勝手に優れ、統一感のある、エンタープライズ対応のデータエンジニアリング体験が実現し、エンドユーザーにとっては、クラウドインフラストラクチャーのプロバイダーの選択肢が広がります。

Clouderaとマイクロソフトはこれまでも提携を重ねてきましたが、今回の提携拡大により、Altusに加えて、ビジネスアナリストはIoT Hubを通じてセンサーデータを取得、Polybaseを通じてClouderaで処理したデータをMicrosoft SQL Serverに入れたり、Microsoft Power BI for Impalaを利用して洞察を可視化することができます。こうしたマイクロソフトとの連携を通して、Clouderaは大規模のデータ分析や予測分析をコスト効果の高い方法で支援できる、ビジネス向け機械学習ツールを提供していきます。

Azure環境のCloudera Altus Data Engineeringは、データパイプラインの開発・運用を簡素化することで、データエンジニアリングのワークロードにフォーカスしつつ、時間のかかる複雑なインフラストラクチャーの管理・運用を削減します。顧客は、データ分析向けのハイパースケール・クラウド・ストレージシステムであるAzure Data Lake Store (ADLS)上でデータレイクをホストし、Azureのインフラストラクチャー容量をオンデマンドで利用することで、エンドユーザーのセルフサービス機能に対応できます。計算リソースとストレージの分離により、ADLSはリソースのスケーリングを独立して行うことができ、要求の厳しい顧客の利用に対応できます。Altusは、エンタープライズグレードのClouderaディストリビューションによって構成されており、クラウドプロバイダー間のクラウドやワークロードの移行に伴うリスクを軽減します。Altusはユーザーに使い慣れたツールをe提供し、データパイプラインを通じてデータストレージとメタデータの管理を共有化します。

KPMG社によると、PaaSの採用は、クラウドプラットフォームの中で最も高成長の分野となり、2017年の32%から2020年には56%に拡大すると予想されます。さらに、企業がデータ集約型の運用をクラウドへとシフトする中、クラウドの採用が現在主流となっており、加速を続けています[注1]。Clouderaの顧客企業にとって、クラウドは最も急成長中の導入環境の1つであり、今回の提携により、企業にとっては、実績あるデータエンジニアリングソリューションがAzure環境に対応することなります。

Azure向けAltus Data Engineeringの主な特長とメリットは、以下の通りです。

  • ワークロード指向(オリエンテッド):Altusにより、ユーザーは、クラスタやインフラストラクチャー管理を気にすることなく、パイプラインのサブミット、クローン、トラブルシューティングを容易に行うことができます。
  • データのサイロ化を排除:データエンジニアはAltusを使用することで、ADLSに直接読み書きする形で、データ処理のジョブを実行できます。データの複製やETL、ファイル形式の変更をすることなく、これらのデータをほかのClouderaワークロードでただちに使用することが可能になり、同一のデータを何度も保存する際の間接費が発生しません。これによりユーザーは、データサイエンスやBI、リアルタイムDBアプリケーションに対し、データエンジニアリングをより効率的に導入することできます。
  • 広く採用されているサードパーティツールとの連携により、非互換性のリスクを抑えつつ各種機能を強化できます。
  • 組み込みのワークロード分析機能:Altusは、ワークロード分析機能によってデータパイプライン向けに、モニタリング機能とトラブルシューティング機能を提供します。ワークロード分析機能により、ユーザーは問題のあるジョブのトラブルシューティングを簡単に行えます。さらに、Altusのワークロード分析機能により、ワークロードパフォーマンスの異常状態を検知し、根本原因の分析結果を提供します。その結果、顧客はより高い信頼性と、低コストでデータパイプラインを実行できます。

Clouderaの製品管理担当シニアバイスプレジデントであるCharles Zedlewskiは、次のように述べています。「Clouderaはクラウドの柔軟性、低コストなストレージと計算リソースオプションおよび迅速なプロビジョニングを適切に活かして、Microsoft Azureのようなクラウドプロバイダー上でのデータ分析ワークロードの展開を簡単かつ使いやすく、そして高いコスト効果で実現します。Clouderaは現在、クラウド上で優れた体験を提供するためにClouderaの完全なスタックとの相互運用が可能なサービスの提供に取り組んでいます。」

Talend社の最高技術責任者(CTO)であるLaurent Bride氏は、次のように述べています。「このマルチクラウド時代における、お客様の技術スタックの変化の規模とスピードは、ITの運用のみならず、急速に進化するビジネスニーズへの総合的な対応能力に対しても、甚大な影響を及ぼしています。当社は現在、お客様がマルチクラウド戦略の立案に成功できるよう、その支援に取り組んでいます。データドリブンの高度なアプリケーションに対応した、クラウドデータパイプラインの構築をお客様が模索する中、Clouderaとの提携を通じ、両社共通のお客様に対して、クラウド・インフラストラクチャー・プロバイダーの選択肢を拡充できることを嬉しく思います。」

Informatica社のクラウド/ビッグデータ/データ統合担当シニアバイスプレジデント兼ジェネラルマネージャーであるRonen Schwartz氏は、次のように述べています。「エンタープライズ向けクラウドデータ管理のリーダーとして、Informaticaは、データレイクのクラウドへの容易な導入を支援するため、投資を継続していきます。Informaticaは、Microsoft Azure環境での実行の認定を取得した、データ管理製品の包括的な製品を取り揃えています。Cloudera Altusの早期からの戦略的開発パートナーとして、当社は今後も、Microsoft Azureによるデータレイク環境のサポートに向け、Clouderaとの緊密な協業を継続したいと考えています。」

Microsoft Azureのコンピュート担当ディレクターであるCorey Sanders氏は、次のように述べています。「エンタープライズのお客様の間では、大規模なデータ処理ワークロード向けに、Microsoft Azureの採用が進んでいます。エンタープライズグレードの実績あるClouderaディストリビューションのサポートを得て、Cloudera Altusが、使い勝手に優れたエンドユーザー指向のマネージドサービス体験をAzure環境にもたらしてくれることを、非常に嬉しく思います。Azureは、クラウドスケールでのビッグデータに対応したAzure Data Lake Storageを提供する唯一のパブリッククラドです。Cloudera Altusとの連携により、当社は分析ソリューションの構築・導入・共有でお客様を支援します。」

現在、Cloudera Altus Data Engineeringは、Apache Spark、Apache Hive、Hive on Spark、MapReduce2に対応しています。リファレンスアーキテクチャに関する詳細やレビューは、www.cloudera.com/altusをご覧ください。

[注1] 出典:「KPMG Journey to the Cloud | The Creative CIO Agenda」

 

■Clouderaについて

Clouderaは、データの力によって、今日不可能なことを明日可能にできると考え、明確でかつ行動につながるインサイトを複雑なデータの中から得ようとする企業を支援し、クラウドに最適化された機械学習および高度な分析のための最先端のプラットフォームを提供します。Clouderaは最も困難なビジネス上の課題を解決する際のパートナーとして世界中の大企業から信頼を得ています。詳細については、http://jp.cloudera.comをご覧ください。

 

Clouderaに関する情報は、下記でご覧いただけます

※Cloudera、Hueおよびその他の関連する商標はCloudera Inc.の商標または登録商標です。その他の会社名および製品名は一般に各社の商標です。