データ移動の問題を解決してデータの運用を加速化
Cloudera DataFlow は、Apache NiFi を搭載したクラウドネイティブのデータサービスで、データ移動のエンドツーエンドプロセスを効率化して、ユニバーサルデータ配信を促進します。
データソースに依存しない450以上のコネクターで、ハイブリッド環境のあらゆる構造のデータをあらゆるソースからあらゆる場所にシームレスに移動します。
シンプルなアーキテクチャーで効率を最大限に高め、データのロックインを回避しながら、ツールの急増を抑制し、データ移動の重複を減らします。
データパイプラインのライフサイクルのあらゆるフェーズで、ノーコード開発者にセルフサービスを提供することで、次のレベルの俊敏性を実現します。
パブリッククラウドの弾力性を活用して、スケーラブルなデータパイプライン構築とデプロイを迅速化
クラウドネイティブなデータサービスとして利用できる Cloudera DataFlow は自動拡張機能を備えており、コストを最小限に抑えながらパフォーマンスを高めることができます。

ユースケース
ビジネスクリティカルなデータを最大限の効率でリアルタイムに提供
-
オープンデータレイクハウスのストリーミングデータの取り込み
ストリーミングソースからデータを取り込み、効率的に保管してエンタープライズクラスのアクセスを実現します。
-
生成 AI のパイプライン
マルチモーダルデータを有効活用してリアルタイムの文脈を追加することで、生成 AI のアウトプットが的確で信頼性の高いものになります。
-
リアルタイムで把握
運用状況の把握と対応時間を改善します。
-
オープンデータレイクハウスのストリーミングデータの取り込み
ストリーミングソースからデータを取り込み、効率的に保管してエンタープライズクラスのアクセスを実現します。
-
生成 AI のパイプライン
マルチモーダルデータを有効活用してリアルタイムの文脈を追加することで、生成 AI のアウトプットが的確で信頼性の高いものになります。
-
リアルタイムで把握
運用状況の把握と対応時間を改善します。
柔軟なデプロイオプションで、あらゆるデータと場所に対応
Cloudera Public Cloud
パブリッククラウドの Cloudera で DataFlow をデプロイすると、弾力性を高めシンプルな管理を実現できます。
Cloudera Private Cloud
プライベートクラウドの Cloudera で DataFlow をデプロイすると、レイテンシを最小限に抑えながらデータとリソースを最大限に統制できます。
Kubernetes Operator として
DataFlow-Kubernetes Operator は、Kubernetes クラスタに独立してデプロイすることができ、最短時間で価値を実現できます。
機能とメリット
Cloudera DataFlow で、データパイプラインの開発からデプロイに至るエンドツーエンドのプロセスを効率化
運用の可視性を高め、重大イベントに対するプロアクティブな対応を実現。
- あらゆるシステムやデバイスからデータをキャプチャ
- データ分析のために、あらゆる種類のファイルを処理
- あらゆるユーザーやターゲットシステムにリアルタイムで提供
ReadyFlow の利用を今すぐスタートし、DataFlow Catalog にすばやくパブリッシュ
- ReadyFlows を使用した一般的なユースケース向けに、最小限の設定であらかじめ定義されたデータフローを迅速にデプロイ
- 1度作成すればあらゆる場所に機能をデプロイできるため、ビジネス成果をより迅速に達成
- ビジネス要件やデータ要件の変化に合わせて、バージョニングを簡単に管理
DataFlow Functions など、クラウドに最適化されたデプロイオプション
- サーバーレスで、効率と拡張性が高く、コストに最適化。あらゆるイベントドリブンなユースケースで NiFi フローを実行
- AWS Lambda、Azure Functions、Google Cloud Functions でほぼリアルタイムにファイルを処理
- HTTPS リクエストでトリガーされるマイクロサービスを構築するための使いやすいノーコード UI
一元化されたコントロールペインで KPI を効率的にモニター
- 実行場所にかかわらず、すべての NiFi フローデプロイメント環境を単一のダッシュボードでモニター
- フローデプロイメント環境の KPI アラートを定義して、重要なフローパフォーマンス指標を追跡
- 動的なスケーリングでパフォーマンスを維持し、SLA の達成を最大限に効率化
包括的なコネクティビティ
HTTP、Syslog、UDP、TCP など業界標準プロトコルを活用し、データストリーム、データベース、データレイク、エンタープライズアプリケーションなどの専用コネクターを介して、オンプレミスまたはあらゆるクラウドのあらゆるシステムに接続できます。
主要なコネクター
Apache Iceberg
データレイクとデータウェアハウス
Apache Kafka
データストリーム
Delta Lake
データレイクとデータウェアハウス
Google BigQuery
データレイクとデータウェアハウス

MongoDB
データベース
Salesforce
エンタープライズアプリケーション
Snowflake
データレイクとデータウェアハウス
Milvus
生成 AI
GigaOm Radar のストリーミングデータプラットフォーム部門
Cloudera は、2024年ストリーミングデータプラットフォーム部門でマーケットリーダーに認定されました。

顧客
さまざまな業界に本当の価値をもたらす DataFlow




ブログ
始める準備はできましたか?