概要
エッジからクラウドまでカバーする包括的なリアルタイムのストリーミングデータプラットフォーム。
Cloudera DataFlow (CDF) は、データを採取、キュレーション、分析して、重要な洞察やすぐに実行可能なインテリジェンスを得ることができる拡張性に優れたリアルタイムのストリーミングデータプラットフォームです。DataFlow は次の課題に対処できます。
- 大容量、大規模なリアルタイムストリーミングデータの処理
- ストリーミングデータの発生場所や来歴(リネージ)のトラッキング
- エッジアプリケーションやストリーミングソースの管理とモニタリング
- ストリーミングデータからリアルタイムな洞察と実行可能なインテリジェンスを獲得
DataFlow を Cloudera Data Platform に拡張
DataFlow 機能は CDP Public Cloud で利用でき、DataFlow for Data Hub と DataFlow for the Public Cloud という2つのデプロイメントオプションがあります (詳細は以下をご覧ください)。クラスタの迅速なプロビジョニング、管理、監視といった CDP Public Cloud の主要なメリットに加え、データライフサイクル全体で統合された SDX のセキュリティ機能とガバナンス機能を活用できます。
導入オプション
オンプレミス、パブリッククラウド、ハイブリッドクラウド環境全体で、エッジからクラウドまでカバーするストリーミングデータプラットフォーム。
DataFlow for Data Hub
- Apache NiFi クラスタを迅速に稼動し、Flow Management for Data Hub で大規模なデータを採取
- Data Hub の Streams Messaging で、オンプレミスの Apache Kafka クラスタをパブリッククラウドに拡張
- Data Hub の Streaming Analytics で、ハイブリッドクラウド上の Apache Flink によるリアルタイムのストリーム処理を高速化
DataFlow for the Public Cloud
- クラウドネイティブフローの自動拡張を可能にすることで、クラウドインフラストラクチャーのコストを削減
- 複数のクラウドクラスタにまたがるすべての NiFi フローを、一元化されたダッシュボードで管理および監視
- ReadyFlow のギャラリーからあらかじめ構築された NiFi フローを活用することでデプロイメントを加速
Cloudera DataFlow プラットフォーム
エッジおよびフロー管理
コーディング不要の採取と管理により、ストリーミングや IoT イニシアティブにおけるエッジの管理、統制、監視を行い、リアルタイムのストリーミングデータを提供します。
Streams Messaging
大量データ採取のバッファリングおよび拡張を行い、他のエンタープライズアプリケーションやクラウドアプリケーションのデータニーズを満たすことができます。
ストリーム処理と分析
リアルタイムな洞察を実現することで、重大イベントの検出と対応を改善し、ビジネスの成果を高めます。
ユースケース
ロギングの最新化
全方位からの顧客像
リアルタイムの洞察
ストリーム処理のワークロードを CDP にアップデート
Cloudera Data Platform (CDP) は、新しいエンタープライズデータクラウドです。Cloudera DataFlow を CDP の一部として使用することで、企業はエッジデータの収集からストリーミング分析まで、さまざまなストリーミングワークロードをクラウドで運用できるようになります。