Evolve logo オンデマンド配信 Evolve 2023 Tokyo|AI、データと分析の先進事例を紹介
  • Cloudera Cloudera
  • 2016年4月15日

    2016年4月7日 米国カリフォルニア州パロアルト発 - Apache Hadoopと最新のオープンソーステクノロジーをベースに、最も高速で最も使いやすく、セキュアなデータ管理と分析を実現するプラットフォームを提供するClouderaは、本日、Cloudera Enterprise 5.7 の一般リリースを開始したことを発表しました。新リリースでは、Hive-on-Sparkがサポートされてデータ処理能力が平均3倍向上し、また、最新のApache Impala(インキュベーション中)の適用によって、ビジネスインテリジェンス分析処理能力も平均2倍向上しています。さらに本リリースでは、マルチテナントへの対応も強化され、管理機能の強化やリソースの最適化も図られています。Cloudera Enterprise 5.7のリリースは、ClouderaがHadoopの適用範囲をさらに拡大・多様化し、企業があらゆる業務に同プラットフォームを活用できるようにするため、業界でリーダシップを発揮している証拠だと言えます。

    Clouderaの製品担当VPであるCharles Zedlewskiは、次のように述べています。

    「Hadoopは過去10年で大きな進化を遂げました。この進化によって、既に存在する機能の向上だけでなく、新しいアプリケーションや応用分野を見出すことができるでしょう。Hive-on-SparkによるデータエンジニアリングやETL開発は、この進化の中の重要なマイルストーンとして、Hadoopの標準データ処理エンジンとしてのSparkの地位を確固たるものにしています。今のビジネス環境にあってデータエンジニアリングは、全体のほんの一部にしか過ぎませんが、お客様は5.7のリリースにより、優れたパフォーマンスや容易な管理性能、コンプライアンス対応済みのセキュリティ機能などはそのままに、プラットフォームをより幅広いユーザーに活用してもらえるようになります」

    ELT開発やバッチ処理が、Hadoopの最も一般的な適用例であることに変わりはありません。Apache Hiveは、長期にわたり、これらのワークロードに対して重要な役割を果たしてきましたが、使用している処理エンジンはMapReduceのままでした。しかし、これらのワークロードを対象に、MapReduceに比べ開発が容易で、パフォーマンスにも優れているApache Sparkの役割はますます高まり、MapReduceを置き替える勢いとなっています。昨年Clouderaは、MapReduceからSparkに移行するためのロードマップとして、One Platform Initiative を立ち上げ、エンタープライズが求める大規模な業務向けワークロードの要件にも耐えられるよう、HadoopとSparkの統合に向けた開発を進めています。Cloudera 5.7でHive-on-Sparkをリリースしたことで状況はさらに一歩前進し、開発者は慣れ親しんだHiveに限らず、Sparkの強力なデータ処理機能を利用でき、平均3倍ものパフォーマンス向上を図ることができるようになりました。Hive-on-Sparkは、Cloudera、IBM、Intel、MapRなどが共同で立ち上げた、コミュニティ主体の取り組みであり、また、今後の開発に向けたアーリーアクセスプログラムの一貫として、広告業界、金融サービス、保険会社など、さまざまな業界のお客様もこの取り組みに参加しています。

    Clouderaでは、お客様が業務を中断することなく、Hive-on-Sparkで先端のデータ統合やデータ整備ツールを使用し続けられるよう、2,300を超えるパートナーエコシステムと共同で作業を行なっています。こうしたパートナーには、BMC、ClearStory Data、Elastic、NGDATA、Solix、Trillium Software、Zementisなどが含まれ、各社のテクノロジーをシームレスに移行できるようClouderaと共同で作業を進めています。(以下の各社からの支持を参照ください)

    同じクラスタ上において、さまざまなユースケースで同じデータを共有できることがHadoopの特長です。Cloudera Enterpriseを使用することで、システム管理者(アドミニストレータ)は、ユーザーやアプリケーションのSLA要件を満足するよう、適切にリソースを提供することができます。また最新のリリースによって、ユーザーやテナント、アプリケーションの使用率や、効率性の変化状況を完全に把握することが出来るようになります。さらに、Cloudera Managerに組み込まれた、新しいCluster Utilization Reporting(クラスタ使用率レポート)機能を使用することで、効率的な運用と、ワークロードのグループやタイプに応じて適切なリソース配分を行なうことが可能となり、また、SLAの遵守をサポートし、さらに、ジョブのトラブル対応やクエリのパフォーマンス問題にも容易に対応できるようになります。

    さらに、Cloudera 5.7 には次のような機能が含まれています:

    • BI分析のパフォーマンスが2倍に向上: Impalaは、動的パーティション・プルーニング、高速クエリスタートアップ、ランタイムフィルタといった機能による優れたパフォーマンスで、Hadoop向け分析SQLエンジンとして、最高の速度を維持しています。
    • 業務環境への移行が容易に: Cloudera Managerが、シンプルなワークフローを実現するクラスタテンプレートを提供。新規クラスタに構成設定を容易にレプリケートできるようになり、十分にチューニングされたテスト環境を異なる地域に存在する業務環境に移設したり、問題が発生した場合でも、元の正常な状態に素早く戻すことができます。
    • データガバナンスの最適化: Cloudera Navigatorは、ビジネスユーザーに対してもデータ管理とガバナンス機能を提供。データの信頼性と出所を容易に遡って確認できると共に、マネージド・メタデータの追加によって、システム全体でデータを発見しやすくなり、また、データの一貫性も向上します。

    Cloudera 5.7は、www.cloudera.com/downloads からダウンロードすることができます。

    Cloudera 5.7に関するリソース

     

     

    Cloudera 5.7 へのパートナーからの支持

    BMC
    「ClouderaのHive-on-Sparkに対する投資は、既存のHiveテクノロジーやユーザーに非常に大きな価値を提供するものです。当社は、業界最先端のHadoop向けControl-Mにより、この新しい革新をサポートします。Hive-on-Sparkのジョブスケジューリング機能を併用することで、Control-Mのお客様は、Spark SQL、Spark Streaming、Shell Scriptingといった機能を利用できるようになります。当社はClouderaとのパートナーシップによって、世界のHadoopユーザーに引き続き新しい価値を提供して参ります」
    — BMC Workload Automation社、ソリューションマーケティング担当シニアディレクター、Tim Eusterman氏

    ClearStory Data
    「当社では、クラウドベースデータ分析ソリューションをHive-on-Sparkでサポートすることで、Sparkに対するコミットをさらに強化していきます。HiveとSpark処理エンジンが統合されることで、多様性に富む大規模なデータを、一体化、調和させて分析サイクルを早め、データ投入やクエリ、推論機能のシームレスなエクスペリエンスの提供が可能となり、より高度なビジネスインサイトが得られるようになります」
    — CTO、Tim Howes氏

    Elastic
    「Elasticは、Cloudera EnterpriseのHive-on-Sparkにリアルタイム検索機能を提供します。MapReduceからSparkに移行しつつも、Elasticsearchの使用を望んでいるユーザーには朗報となるでしょう。この連携は、Elasticsearch HadoopとSparkの導入に関するこれまでのElasticとClouderaの協業関係をさらに深める結果になります」
    — Elastic社 エンジニアリングリード、Costin Leau氏

    NGDATA
    「NGDATAは、顧客分析とCX(カスタマーエクスペリエンス)最適化のための完全なソリューションによって、銀行、メディア、テレコムなどに、次善の提案シナリオの提供を推進しています。当社のNBOパイプラインは、お客様の行動データをリアルタイムに処理できるよう設計、最適化されており、ビジネスマネージャーは、アドホックなレポーティングでも同様のパフォーマンスを得ることができます。Hive-on-Sparkのおかげで、実質的に再構成する必要もなく、レポーティング処理のスピードを劇的に向上することができました。エコシステムへのSparkの適用をClouderaと共同で推進し、カスタマーに具体的なメリットを提供していく所存です」
    — CTO、共同創業者、Steven Noels氏

    Solix
    「Cloudera 5.7によって、Solix Big Data Suiteのパフォーマンやお客様の使い勝手が向上しました。Hive-on-Sparkのおかげで、ほぼどんな構造化データを使用するワークロードでも、Apache Hadoopで稼働できるようになりました」
    — CEO、Sai Gundavelli氏

    Trillium Software
    「企業は、大規模で複雑なデータの処理をますますHadoopに依存するようになり、データ駆動型のビジネスを推進する上で、成果提供までの時間をさらに短縮したいと考えています。Cloudera Enterprise 5.7のリリースは、Hadoopを使用したデータ移行やデータ統合、実務的なデータ処理のスピードと効率を最適化できる、革新的なソリューションを提供しながら、Hadoopの管理を簡素化するという、Clouderaのコミットを裏付けるものです。Hive-on-Sparkによって強化されたTrillium RefineTMで、データをいち早く準備して、処理と分析ができるようになり、成長を助ける迅速な意思決定を行なうことができるようになります」
    — 製品管理担当 VP、Keith Kohl氏

    Zementis
    「ClouderaがHadoopエコシステムにHive-on-Sparkが追加したことで、ユーザーはより効率的にデータサイエンスを適用できるようになりました。小規模なビジネスアプリケーションにとって、データサイエンスが差別化要因であり、Clouderaとパートナーシップを組み、Hive、Spark、Stormに共通な標準ベースの処理エンジンとして、Zementis Universal PMML Plug-in (UPPI) を、実務的な機械学習と高度な予測分析機能のために提供できることを、誇りに思っています」
    — CEO、Dr. Michael Zeller氏

    Clouderaについて
    Clouderaは、Apache Hadoopや最新のオープンソーステクノロジーに基づく、今の時代に則したデータ管理や分析のためのプラットフォームを提供する企業です。世界の名だたる企業が、Clouderaの高速で容易に扱うことができる、優れたセキュリティ機能を持つデータプラットフォームであるCloudera Enterpriseを利用し、もっとも困難な業務課題の解決にあたっています。Clouderaのカスタマーは、膨大な量のデータを効果的に収集、ストア、処理、分析し、高度な分析機能に応用することで、以前では成し得ないほど迅速で柔軟な業務上の意思決定を、低コストで実現しています。またClouderaは、カスタマーの確実な成功を支援するため総合的なサポートやトレーニング、プロフェッショナルサービスを提供しています。

    Cloudera の情報は下記よりご覧いただけます
    ・ウェブサイト : http://www.cloudera.co.jp/
    ・ブログ : http://www.cloudera.co.jp/blog
    ・正規販売代理店ご紹介ページ :http://www.cloudera.co.jp/company/partner.html
    ・Hadoop10周年記念ページ:http://www.cloudera.co.jp/promos/hadoop10.html
    ・Twitter : http://twitter.com/#!/clouderajp
    ・Facebook : http://www.facebook.com/Cloudera.Japan

    Cloudera、Cloudera’s Platform for Big Data、Cloudera Enterprise Data Hub Edition、Cloudera Enterprise Flex Edition、Cloudera Enterprise Basic Edition、Cloudera Navigator OptimizerおよびCDHはCloudera Inc.の米国および他国の管轄権における商標または登録商標です。その他の社名および製品名は一般にその商標です。