Cloudera Data Platform について知る
CDP は容易に、そして迅速かつ安全にデータにコネクトし、データライフサイクル全体のセキュリティを確保しながら、データ駆動型の意思決定を支援します。
あらゆるクラウドやデータセンターについて、データライフサイクルの管理とセキュリティの確保が可能
-
DataFlow
-
データエンジニアリング
-
Data Warehouse
-
OpDB
-
機械学習
-
SDX
-
コントロールプレーン
DataFlow:ライフサイクルのフロー、ストリーム、分析結果を収集
エッジ、クラウド、データセンターでの保存データと移動中のデータを容易に取り込み、管理し、包括的なセキュリティとガバナンスを確保しながら、どんな下流システムにも提供することが可能。CDP Data Hub では、フロー管理に向けApache NiFiを、またストリームメッセージに向け Apache Kafka を使用しています。いずれも重要なインサイトやすぐに実行可能なインテリジェンスを提供する、包括的なリアルタイムのストリーミングデータプラットフォームである Cloudera DataFlow の提供機能の一部です。
データエンジニアリング: データライフサイクルに向け、データを強化、精緻化、構造化して準備
Cloudera Data Engineering によって、データの強化、変換、そしてクレンジングを支援することで、容易にエンド・ツー・エンドのデータパイプラインの作成や実行、さらに管理を実現します。Cloudera Data Engineering は、Apache HBase、Apache Kudu、クラウドオブジェクトストレージなど、様々なストレージをサポートし、Apache Spark と Spark Streaming を使ったバッチやリアルタイムストリーミング処理などの広範なデータ処理ワークロードを、極めて優れたパフォーマンスで実行することができます。
Data Warehouse: データライフサイクルに関するレポートへのセルフサービスでのアクセスを可能に
コンプライアンスを犠牲にしたり予算を浪費することなく、数千のユーザーに対して、極めて優れたスピードと規模で、膨大な量の検証済みデータに関するビジネスインサイトを提供することができます。クラウド環境に対してオンプレミスのワークロードを、シームレスかつ安全に移動できる Cloudera Data Warehouse では、セルフサービスでのレポート、ダッシュボード、高度な分析機能へのアクセス、さらに進化する業務要件やSLA に対応することで、シャドウ IT を凌ぐ優れた パフォーマンスを発揮することができます。
Control Plane:共通のツールを使って、ライフサイクル全体で CDP サービスを管理
1つの管理画面から、一貫性あるセキュリティとガバナンスをもって、全ての CDP サービスを管理、監視、オーケストレーションすることができます。Workload Manager、Replication Manager、Data Catalog および Management Console で構成される Control Plane は、データ管理、ワークロード分析、データの移動、データディスカバリといった機能を提供する強力なツールとして、どんな場所からでも多機能分析を実行できるようにします。