すべての構造化データと非構造化データを、安全に保存、処理、分析
Hortonworks Data Platform (HDP) は、分散ストレージと大規模なマルチソースのデータセットのためのオープンソースフレームワークです。HDP によって、IT インフラストラクチャーの最新化、クラウドやオンプレミスにあるデータのセキュリティ保護、新たな収益源の獲得、カスタマーエクスペリエンスの向上、コストの統制などが可能になります。
Cloudera Data Platform への移行
現在のプラットフォームを選択し、移行のための推奨事項と、お使いの環境に適したリソースをご確認ください。
使用しているプラットフォーム
HDPは、Apache Hadoop クラスタでの GPU をサポートするための基盤を提供し、データサイエンスや AI のユースケースに必要となる計算処理能力を向上させます。GPUをプールしてGPUリソースの共有化を図ることで、優れたコスト効果をもって、より多くのワークロードに対応することができます。また、GPU の隔離も可能です。GPU を特定のアプリケーションに割り当て、他のアプリケーションからは GPU にアクセスできないようにすることができます。
HDP には、コンテナ化した TensorFlow テクニカルプレビューが含まれており、GPU プーリングと組み合わせることによって、ディープラーニングモデルの設計、構築、トレーニングをより容易にします。
HDPでは、特定のクラウドアーキテクチャーにベンダーロックインすることなく、ハイブリッドおよびマルチクラウド環境に対し、自由にビッグデータワークロードを導入することができます。お客様は、クラウド環境に関わらず、シームレスにビッグデータクラスタを作成し、管理することができます。クラウド環境に依存しないHDP の自動プロビジョニング機能によって、容易なビックデータの導入と、クラウドリソースの使用に関する最適化を行うことができます。
クラウドストレージでは、Microsoft ADLS、WASB、AWS S3 および Google Cloud Storage など、ネイティブなフォーマットでデータを無制限に保存することができます。また Cloudbreak によって、HDP を好みのクラウドプロバイダーに導入し、クラウド上のクラスタを容易にプロビジョニングすることができます。
HDPにおけるクエリパフォーマンスの向上によって、さらに高速なクエリの実行が可能となります。最高速の Apache Hive エンジンである Hive LLAP は、リソースの競合を発生されることなく、マルチテナント環境で稼動します。この統合によって、JOIN や集計クエリなど、BI で一般的に使用されるクエリの速度を劇的に向上させることができます。クエリの最適化に加え、Hive を使ってリソースプールを作成し、きめ細かなリソース配分を行うことができます。
HDP は、デフォルトで ACID トランザクションを有効化し、Hive テーブルのアップデートを容易にして、GDPR の要件にも対応することができます。リアルタイムデータベースとしての Hive によって、低レイテンシと高スループットのワークロードの間に存在するパフォーマンスギャップを埋め、より速いレートでのデータ処理が可能になります。
HDP は、セキュリティおよびガバナンスのための包括的な機能を提供し続けます。HDP のセキュリティは、あらゆるレイヤに組み込まれ、認証、認可、信用性、データ保護のための機能を実装しています。セキュリティとガバナンスを統合することで、セキュリティの専門家は、分類ベースのセキュリティポリシーを設定することが可能になります。さらにデータガバナンスツールによって、データエコシステム全体で一貫したデータの分類が可能となります。
さらに監査担当者は、イベントの監査機能が提供するきめ細かで詳細な情報を使って、容易に監査を実施することが可能となります。監査担当者やユーザーは、データがエコシステムの中をどのように移動したかという点について、その完全な過程を把握できます。データにタグ付けを行うことで、監査担当者やユーザーは、データが企業の中をどのように移動したかについて把握し、機密データのコンテキストの一貫性を確保することができます。また、時間ベースのポリシーによって、特定のユーザーに対する一時的なアクセスを許可することもできます。