概要
あらゆる規模のデータパイプラインをセキュアに合理化して運用。
CDP Data Engineering は、エンタープライズデータエンジニアリングチーム向けに開発された唯一のクラウドネイティブサービスです。Apache Spark を基盤とする Data Engineering はあらゆるデータエンジニアリングツールを備えており、Apache Airflow によるオーケストレーション自動化、高度なパイプライン監視、視覚的なトラブルシューティングを実現し、包括的な管理ツールでエンタープライズ分析チームの ETL プロセスを合理化します。
Data Engineering は Cloudera Data Platform と完全に統合されており、SDX によるエンドツーエンドの可視性とセキュリティを実現できます。また、データウェアハウスや機械学習などの CDP サービスともシームレスに統合できます。ハイブリッドクラウドプラットフォーム上のあらゆる場所で、一貫性のある反復可能な自動データエンジニアリングワークフローを実現します。
CDP Data Engineering のユースケース
あらゆる場所でデータパイプラインを自動化
ETL の可視性と統制を確保
全体にわたりデータの整合性を維持
あらゆる場所でデータパイプラインを自動化
質の高いデータセットを CDP Data Warehouse や CDP Machine Learning などの分析ツールへセキュアに提供。
Data Engineering は、機械学習やデータウェアハウスなど、分析チームへのデータパイプラインを合理化します。パイプラインのオーケストレーションと自動化により、キュレーションされた質の高いデータセットをセキュアかつ透過的にあらゆるところへ提供することで、価値実現までの時間を短縮します。
ETL の可視性と統制を確保
データライフサイクルを透過的かつ包括的に管理。
データパイプラインをエンタープライズ全体で大規模に運用しようとすると、データライフサイクルの管理とコストの抑制はますます複雑化します。
運用統制と可視化機能を兼ね備えた Data Engineering により、さまざまなビジネスユースケースにおいてキャパシティプランニング、パイプライン自動化、自動リネージキャプチャ、トラブルシューティングを実現できます。
全体にわたりデータの整合性を維持
データパイプラインを完全に可視化してビジネスを保護。
データの量と複雑性が増大すると、分析ワークロードをビジネス全体に拡張しながら正確性と忠実性を維持することが困難になる場合もあります。
Data Engineering では、ネイティブなデータパイプライン監視とアラートにより、問題を早期に検出できます。また、視覚的なトラブルシューティングにより、問題がビジネスに影響を与える前に迅速に解決できます。