概要
データレイクの柔軟性とデータウェアハウスのパフォーマンスを単一のプラットフォームで実現
オープンデータレイクハウスを導入すると、構造化および非構造化を問わず、あらゆるデータを迅速かつ大規模に分析できます。また、データサイロが解消され、データチームがパブリッククラウドとプライベートクラウドで好みのツールを使用して、同じデータに基づいてコラボレーションできるようになります。
このモダンデータアーキテクチャーを使用すれば、データの信頼性が高まると同時にデータの管理が容易になります。データを移動したり、ロックしたりすることなく、同じデータに対して BI、AI、ML、ストリーミング分析を実行できます。
世界で唯一のオープンデータレイクハウスである Cloudera Data Platform (CDP) がもたらすメリット
オープンアーキテクチャー
Apache Iceberg を基盤とする Cloudera のデータレイクハウスは、100% オープン (オープンソース、オープンスタンダードベース) で、コミュニティで広く採用されています。複数のデータ形式を格納でき、同じデータを複数のエンジンで処理できます。
容易な導入
Cloudera では、Iceberg を Shared Data Experience (SDX) に直接統合することで、とても簡単にレイクハウスをデプロイできます。スキーマの進化、隠しパーティションなどの追加機能により、大規模なデータセットのデータ管理が簡素化されます。
マルチクラウド対応
パブリッククラウドでも自社のデータセンターでも、レイクハウスを好きな場所に一度構築すれば、どこでもスムーズに運用できます。Cloudera は、すべてのクラウドで完全なポータビリティを備えた同一のデータサービスを提供します。
セキュリティとガバナンス
CDP の Iceberg テーブルを SDX 内で統合すれば、複数のクラウド間で統一されたセキュリティ、きめ細かいポリシー、ガバナンス、リネージ、メタデータ管理が可能になり、お客様はデータの分析に集中できるようになります。残りの仕事は Cloudera にお任せください。
主なコンポーネント
オープンレイクハウスでデータを強化