2016年9月30日

Amazon Redshiftとのベンチマーク比較の結果、Apache Impala(incubating)がAWS上でより優れたクラウドネイティブな機能とプライスパフォーマンスを提供できることが明らかに

2016年9月22日 米国カリフォルニア州パロアルト発 - Apache Hadoopと最新のオープンソーステクノロジーをベースに、最高速で最も使い易くセキュアなデータ管理と分析のためのプラットフォームを提供するClouderaは、本日、Apache Impalaを使ったClouderaの最新分析データベースソリューションが、クラウドネイティブなワークロードに優れた機能を提供するだけでなく、他製品に比べ卓越したコストパフォーマンスを発揮したというベンチマーク結果を発表しました。Impalaは、自在に拡張および縮小が可能な柔軟性を持ち、Amazon S3に直接クエリを発行することも可能です。このような対応は、Redshiftなど従来のアーキテクチャーに依存したシステムでは不可能です。最新の設計思想を持つImpalaは、データと処理を分離させることで、S3のデータに限らずオンプレミスやクラウドストレージに対しても同様に、ハイパフォーマンスなSQL分析機能を提供します。さらにImpalaでは、これらの機能をAmazonの分析データベースやRedshiftに比べ、最大275% のコスト効率と10倍ものパフォーマンスで実現することができ、オープンプラットフォームの中では最も優れた付加価値を提供するものとなっています。

Clouderaは、業界標準のTPC-DSベンチマークによるクエリを使って、クラウド上で稼動するImpala(S3に対するクラウドネイティブとローカルEBSストレージ上の両方で実行)とAmazon RedShift(専用のAWSインスタンスのストレージのみで実行可能)の比較を実施しました。ベンチマークの結果、以下が明らかになりましました:

  • S3上でのImpalaは、汎用的なチューニングを行なったRedshiftに比べ200% もコストを抑えることができ、10倍以上高速であった
  • S3上でのImpalaは、特定のレポーティング向けて特化した形でのチューニングを施したRedshiftと比較しても、8% 以上コストを抑えることができ、90% 以上高速であった
  • EBS上でのImpalaは、汎用的なチューニングを行なったRedshiftに比べ、28%~275% コストを抑えることができ、42%~ 400% 高速であった

Clouderaの製品担当バイスプレジデント、Charles Zedlewskiは、次のように述べています。「拡張性能や柔軟性による優れたコスト効果を求め、BIや分析ワークロードをクラウド環境に移行しようというお客様が増えています。しかし、これまでのようにオンプレミスで実現していた高い分析パフォーマンスやビッグデータの俊敏性を、クラウド環境にも求めています。最新のアーキテクチャーを持つImpalaの場合、従来のオンプレミスにある分析データベースの優位性をそのままクラウドに取り込むことが可能で、データがどこに存在しようと優れた俊敏性を発揮できます。この比較結果は、Impalaがクラウド上のBIや分析ワークロードと比べても、明らかに優位性を持っていることの証拠と言えるでしょう」

新しいソースからより多くのデータを取り込み、ニーズの変化に応じて積極的にモデルを調整し、様々なユースケースにも臨機応変に対応しようとすれば、業務生産性を落とすことなくこれらの要件に対応できる最新の分析データベースが必要となります。従来のアーキテクチャーをベースにした固定的で柔軟に拡張できない融通の利かないシステムでは、例えオンプレミスであろうとクラウドであろうと、現在の絶えず変化し続けるビジネスニーズに応えることはできません。ビッグデータに対して高パフォーマンスなSQL分析を行なえるインタラクティブSQLエンジンとしてImpalaを採用したClouderaの分析データベースは、必要に応じてクラウドにもオンプレミスにも、柔軟な拡張性をもって導入することが可能です。

Impalaは、Amazon S3 オブジェクトストアなど、様々なストレージエンジンにストアされたデータに対するネイティブな処理が可能なため、Impalaクラスターにデータを移したりロードしたりする必要がありません。特にクラウドの場合、BIやレポーティング用のワークロードのためのクラスターは、必要な時だけ立ち上げればよいため、コスト削減や効率化につながります。また、コスト効率の高いS3のストレージを使い、分析のためにより多くのデータをよ迅速に提供できます。

Impalaのパフォーマンスや並行処理性能、拡張性などをさらに高めることが、Clouderaの一貫した目標です。シングルあるいはマルチユーザーのワークロードのいずれに対しても、Impalaの分析データベースアーキテクチャーは、他社製品とのパフォーマンスにおける差をますます広げています。最新のリリースでは、2つ前のバージョンに対して、ワークロードのパフォーマンスを12倍向上させました。Clouderaは、パブリッククラウドの他のオブジェクトストアに対するサポートを追加することで、今後もImpalaの価値やコストパフォーマンスを向上させていく予定です。

参考リソース:

 

【Clouderaについて】

Clouderaは、Apache Hadoopや最新のオープンソーステクノロジーに基づく、今の時代に則したデータ管理や分析のためのプラットフォームを提供する企業です。世界の名だたる企業が、Clouderaの高速で容易に扱うことができる、優れたセキュリティ機能を持つデータプラットフォームであるCloudera Enterpriseを利用し、もっとも困難な業務課題の解決にあたっています。Clouderaのカスタマーは、膨大な量のデータを効果的に収集、ストア、処理、分析し、高度な分析機能に応用することで、以前では成し得ないほど迅速で柔軟な業務上の意思決定を、低コストで実現しています。またClouderaは、カスタマーの確実な成功を支援するため総合的なサポートやトレーニング、プロフェッショナルサービスを提供しています。

Cloudera の情報は下記よりご覧いただけます。

・ウェブサイト : http://jp.cloudera.com
・Twitter : http://twitter.com/#!/clouderajp

Cloudera、Cloudera Inc.の米国および他国の管轄権における商標または登録商標です。その他の社名および製品名は一般にその商標です。

【報道関係者の方からのお問い合わせ先】

Cloudera株式会社
マーケティング&PR:風間・木林
press-jp@cloudera.com