Your browser is out of date!

Update your browser to view this website correctly. Update my browser now

×

格納

(HDFSファイルシステムをベースとする)Hadoopの制限なく拡張可能で柔軟なアーキテクチャーでは、量と種類の制限なくデータの格納と分析の両方を業界標準ハードウェア上の単一オープンソースプラットフォームで実行できます。

HDFSの詳細

Apache Kuduの詳細


データの処理

既存システムやアプリケーションと素早く連携し、データ一括ロード処理 (Apache Sqoop) やストリーミング処理 (Apache Flume、Apache Kafka) によって、Hadoopにデータを取り込んだり、抽出したりすることができます。

バッチ(MR2)処理または高速インメモリ(Apache Spark)処理用の複数のデータアクセスオプション(Apache Hive、Apache Pig)を使用して、より大きい規模で複雑なデータを変換できます。Spark Streamingによりクラスタに到着した時点でストリーミングデータを処理できます。

Apache Sparkについてさらに詳しく知る


ディスカバリ

アナリストは、Hadoop用分析データベースのApache Impala(incubating)を使用して、完全忠実なデータとその場でやりとりすることができます。Impalaにより、BI品質のSQL性能と機能に加えて全ての主要なBIツールとの互換性を確保できます。

HadoopとApache Solrを統合したCloudera Searchを使用すると、特にImpalaと組み合わせた場合にあらゆる量と形式のデータでパターンを発見する処理を高速化することができます。

Apache Impalaの詳細

Cloudera Searchの詳細


モデリング

Hadoopにより、アナリストとデータサイエンティストは、パートナーテクノロジーを組み合わせて使用したり、Apache Sparkのようなオープンソースフレームワークを使用したりしながら、高度な統計モデルを作成して繰り返し適用する柔軟性を持つことができます。


データの提供 

Hadoop用の分散データストアであるApache HBaseは、オンラインアプリケーションに必要な高速ランダム読み書き(「高速データ」)をサポートしています。

Apache Hbaseの詳細

CDH:オープンソースとオープンスタンダードを土台に構築

世界で最も人気の高いHadoopディストリビューションであるCDHは、Clouderaの完全にオープンソースなプラットフォームです。CDHには、無制限のデータを格納、処理、発見、モデリング、および提供するための主要なHadoopエコシステムコンポーネントが全て含まれています。また、CDHは安定性と信頼性を実現する最高の企業水準を満たすように設計されています。

CDHは、長期的アーキテクチャー向けのオープンスタンダードに完全に準拠しています。また、Hadoopのオープンスタンダードの主な管理者であるClouderaは、最終的にエコシステム全体で採用される新しいオープンソースソリューションをプラットフォーム(Apache Spark、Apache HBase、Apache Parquetなど)に取り入れた実績があります。 

主なCDHコンポーネントの詳細

オープンソースおよびオープンスタンダードの詳細

今すぐ試す

今すぐ確認する

さらに詳しく

Cloudera Enterpriseでデータから特別な価値を引き出しましょう。

トレーニングを受ける

Hadoopのトレーニングを受けて、未来を見据えたキャリアアップを目指しませんか? 

CLOUDERAを試す 

Hadoopのチュートリアルを今すぐ始める