Kubernetes でのデータ・イン・モーション (データのストリーミング) に関するリリースの詳細 ウェビナーを見る
概要
Streaming とは
Cloudera Streaming (旧 Cloudera Stream Processing) は、ストリーミングデータを分析し、複雑なパターンを特定して実用的なインテリジェンスを取得する機能を提供することで、ストリームをデータ製品に変えることを可能にします。
Streaming には Apache Flink と Kafka が搭載されており、包括的なエンタープライズグレードのストリーム管理およびステートフル処理ソリューションを提供します。開発者、データアナリスト、データサイエンティストは、ストリーミングのストレージ基盤として Kafka を、コアストリーミング処理エンジンとして Flink を、そして SQL や REST といった業界標準インターフェースのトップレベルのサポートを組み合わせて活用できます。そうすることで、リアルタイムデータ製品、ダッシュボード、ビジネスインテリジェンスアプリケーション、マイクロサービス、データサイエンスノートブックを強化するハイブリッドストリーミングデータパイプラインを簡単に構築できます。
不正行為の検知、ネットワーク脅威分析、製造インテリジェンス、コマースの最適化、リアルタイムのサービス提供、ローンの即時承認などのユースケースには、データ処理コンポーネントをストリーム上に移動することで、これらのニーズにリアルタイムで対応できるようになりました。
Cloudera Streaming によるハイブリッドストリーミングデータパイプライン

Cloudera Streaming のユースケース
- 不正行為の検知
- カスタマー分析
- 市場モニタリング
- ログ分析
カスタマー分析
リアルタイムな顧客分析により、エンゲージメント、定着率、満足度を向上。
顧客エンゲージメントを向上させるために、あらゆる組織がリアルタイム分析を必要としていますが、データ量が多すぎるため、その実現には苦心しています。Cloudera Streaming は1秒以下のレイテンシで大量のデータを処理することで、顧客分析を行いながら、顧客とのコミュニケーションも検出し、より良い商品やサービスをリアルタイムに推奨します。


Cloudera Streaming の機能
-
Apache Flink によるストリーミング分析
-
Apache Kafka による Streams Messaging
柔軟なデプロイオプションで、あらゆるデータと場所に対応
クラウドの Cloudera Streaming
Cloudera は、パブリッククラウドにデプロイして効率的に拡張できる、包括的な統合型ストリーム処理機能を搭載しています。
Cloudera Streaming は、Apache Kafka や Apache Flink エンジンをベースに構築されており、デプロイと管理を簡素化するエンタープライズクラスのツールを備えています。
Streams Messaging Manager は、スキーマガバナンスと監視、ディザスタリカバリ、インテリジェントなリバランス、堅牢なアクセス制御と監査に対応する一連の機能で、Apache Kafka を強化します。
SQL Stream Builder は、強力な SQL コンソールで Apache Flink を拡張します。このコンソールでは、SQL を使用するアナリストがストリーミングデータにクエリを実行したり、下流のアプリケーション用に処理ロジックに関してコラボレーションやバージョン管理を行ったりすることができます。
オンプレミスの Cloudera Streaming
ストリーミングデータに対応するために Cloudera をオンプレミスに導入すれば、リアルタイムでパイプラインとアプリケーションのコストを管理し、レイテンシを最小限に抑制できます。Cloudera Streaming は、Apache Kafka と Apache Flink を統合し、これらのデプロイの管理に必要なエンタープライズクラスのツールを提供します。
Cloudera Streaming - Kubernetes Operator
Cloudera Streaming 機能は、既存の Kubernetes クラスタを通じて独立してデプロイできる Kubernetes Operator としても利用でき、Kafka のデプロイと拡張をとても簡単に行えます。Kubernetes Operator は、Kafka、Cruise Control、Zookeeper と併せてデプロイされ、堅牢なメッセージブローカーサービスを利用したストリーミングユースケースが Kubernetes で実現します。さらに Flink の最新の分散ストリーム処理エンジンと SQL Stream Builder を活用すれば、コンテナ上でネイティブに稼動するリアルタイムのストリーミングアプリケーションを構築できます。
Cloudera Streaming の Community Edition
Cloudera Streaming の Community Edition を利用すると、ストリームプロセッサの開発を、デスクトップやその他の開発ノードから直接簡単に実行できます。
アナリスト、データサイエンティスト、および開発者は、新機能の評価、SQL ベースのストリームプロセッサのローカル開発、Kafka コンシューマー/プロデューサーおよび Kafka Connect コネクターの開発を、本番環境に移行する前にすべてローカルで行えるようになりました。
Streaming の Community Edition なら、5分で利用を開始できます。
参加する
GigaOm Radar のストリーミングデータプラットフォーム部門
Cloudera は、2024年ストリーミングデータプラットフォーム部門でマーケットリーダーに認定されました。
