どんなに要求が厳しいデータパイプラインにも対応できる、より高速な分析機能や強化された検索機能、そして優れた拡張性
生産性
より迅速に成果を手にすることができます。以下に示す機能強化によって、データサイエンティストや業務アナリストの生産を向上し、リソース使用を最適化することで分析作業を加速させます。
- 機械学習によって、ディープラーニング向けにGPUを使用するなど最適化されたハードウェアリソースに特化したジョブの割り当てが容易になり、処理速度も10倍近く加速されます
- Apache Hive 2.0 のベクトル化によって、分析ワークロードのパフォーマンスが最大80%向上します
- 標準 API とデバッグ機能が開発者の生産性を向上させます
- Apache HBase 2.0 では、パフォーマンスと安定性の向上に加え、マルチテナントアプリケーションの分離によって、さらに強力で信頼性の高いリアルタイムなオペレーショル・アナリティクスが可能となりました
- Apache Oozie 5.0では、繰返し実施されるジョブのスケジュール機能を提供し、オペレーショナル・アナリティックアプリケーションのプロセスをシンプル化します
- シンプルで最適化された SQL エクスペリエンスによって、開発効率を向上し、10倍も高速にデータを発見することができます。
革新性
最も性能が高く安定性に優れたオープンソースを、Clouderaの包括的なディストリビューションに取り込むことで、これまで以上に統一化された分析アプリケーションを構築できるようになりました。
- Apache Solr 7.0 におけるネスト化データタイプに対する総合的な検索機能の向上と、JSONファセットのサポートにより、これまで活用されることがなかった非構造化データに対しても、理解を深めることができるようになりました
- Apache Kafka 1.0 と Apache Spark 2.2 が、完全にネイティブなプラットフォームのコンポーネントになり、ストリーミングデータのパイプラインに関する、さらに容易で堅牢な管理が可能となりました
エンタープライズ品質
Clouderaのエンタープライズ顧客は、純粋なオープンソースプロジェクトよりも、完璧なプラットフォームだけが提供できる品質管理と安全性に信頼を寄せています。コンポーネント単独でのテストに加え、スタック全体における広範なテストを実施することで以下のメリットを得られます。
- 統合済みで十分な検証を経たソフトウェアスタックの品質と機能によって、ミッションクリティカルな分析にも対応できます
- お客様は、Cloudera Manager 6.0 のインターフェースを介して、最大2,500ノードもの超大規模なクラスタについても容易かつ確実に管理することができます
- 自動化された回線暗号化によって、デフォルトでセキュリティを確保します。

データ活用はお好みの方法で。
複雑なデータ駆動の課題に取り組むためには、サイロ化された機能ではなく、相互に連携可能な分析機能が必須です。Cloudera の Shared Data Experience (SDX) は、エンタープライズグレードの一元的なセキュリティ機能や、ガバナンスおよび管理機能と共有データカタログ機能を組み合わせることで、コストの無駄を招くサイロ化やプロプラエタリなフォーマットによるロックイン、さらに分析ユーザー間のリソース競合を排除することができます。データサイエンティストやデータエンジニアは、オンプレミス上の SDX によるコラボレーションの優位性を、クラウドベースのアプリケーションに対するセルフマネージド・フレームワークとして、また Cloudera Altus のマネージド・サービスとしても活かすことができるようになりました。
Cloudera Enterprise 6.0 におけるメジャーバージョンアップ
SDX
|
Analytics and Machine Learning Workloads | Core Platform |
---|---|---|
Cloudera Manager 6.0 Cloudera Altus Director 6.0 Cloudera Navigator 6.0 Apache Sentry 2.0 |
Apache Solr 7.0 Apache Spark 2.2 Hue 4.2 Apache Kafka 1.0
|
Apache Hadoop 3.0 Apache Hive 2.1 Apache HBase 2.0 Apache Oozie 5.0 Apache Avro 1.8 Apache Parquet 1.9
|