概要
データレイクの柔軟性とデータウェアハウスのパフォーマンスを単一のプラットフォームで実現
オープンデータレイクハウスを導入すると、構造化および非構造化を問わず、あらゆるデータを迅速かつ大規模に分析できます。また、データサイロが解消され、データチームがパブリッククラウドとプライベートクラウドで好みのツールを使用して、同じデータに基づいてコラボレーションできるようになります。
このモダンデータアーキテクチャを使用すれば、データの信頼性が高まると同時にデータの管理が容易になります。データを移動したり、ロックしたりすることなく、同じデータに対して BI、AI、ML、ストリーミング分析を実行できます。

世界で唯一のオープンデータレイクハウスである Cloudera がもたらすメリット
オープンアーキテクチャー
Apache Iceberg を基盤とする Cloudera のデータレイクハウスは、100% オープン (オープンソース、オープンスタンダードベース) で、コミュニティで広く採用されています。複数のデータ形式を格納でき、同じデータを複数のエンジンで処理できます。
容易な導入
Cloudera では、Iceberg を Shared Data Experience (SDX) に直接統合することで、とても簡単にレイクハウスをデプロイできます。スキーマの進化、隠しパーティションなどの追加機能により、大規模なデータセットのデータ管理が簡素化されます。
マルチクラウド対応
パブリッククラウドでも自社のデータセンターでも、データレイクハウスを好きな場所に一度構築すれば、どこでもスムーズに運用できます。Cloudera は、すべてのクラウドで完全なポータビリティを備えた同一のデータサービスを提供します。
セキュリティとガバナンス
Cloudera の Iceberg テーブルを SDX 内で統合すれば、複数のクラウド間で統一されたセキュリティ、きめ細かいポリシー、ガバナンス、リネージ、メタデータ管理が可能になり、お客様はデータの分析に集中できるようになります。残りの仕事は Cloudera にお任せください。
Cloudera のオープンデータレイクハウスが、プライベートクラウドで利用できるようになりました。 詳細
エンドツーエンドのデータレイクハウスで AI を活用することで、データライフサイクルの効率が向上
主なコンポーネント
オープンレイクハウスでデータを強化
多機能分析
Cloudera が提供する広範なデータサービスを使えば、データレイクハウスで AI、ML、BI、ストリーミング分析、データエンジニアリングを実行できます。データの取り込みからストリーミング、処理、永続化、オーケストレーション、検出、アクセスまで、強力でスケーラブルなデータサービスで主な分析機能を活用できます。その際、自分の好きなツールを利用することも可能です。
オープンテーブル形式の Apache Iceberg
Apache Iceberg はオープンレイクハウスのビルディングブロックです。大規模な分析テーブル用の高性能なオープンテーブル形式を採用し、SQL テーブルの信頼性をビッグデータにもたらしながら、複数のコンピューティングエンジンを同時に動作させることができます。タイムトラベル、スナップショットの分離、スキーマの進化、隠しパーティションなどの豊富な機能を提供します。
Shared Data Experience (SDX)
SDX は Cloudera の不可欠な要素であり、メタデータを基盤とするセキュリティおよびガバナンスの統合テクノロジーを提供します。SDX を導入すると、あらゆる場所のあらゆるインフラストラクチャーでデータと分析を包括的に管理し、リスクと運用コストを軽減できます。安全性が高くガバナンスが効いたデータレイクハウスを短期間で展開することで、IT 部門はセキュリティを犠牲にすることなく、より多くのユーザーにより多くのデータを提供できます。
堅牢な Data Catalog
Cloudera Data Catalog を使えば、すべてのインフラストラクチャーのあらゆる場所でデータを検索、集約、タグ付けし、関連するインサイトを生成できます。
- データとその使用形態について理解し、ドキュメント化し、監視することができます
- 関連するデータに対して規則や基準を適用できます
- 組織的あるいは技術的なデータ保護対策を実装できます
- 完全なインサイトによって、責任を持ってデータを共有することができます
顧客
世界的な小売業者である NEW YORKER 社は顧客のニーズを予測し、実店舗での買い物体験を豊かにするためにデータレイクハウスを活用しています。
