Your browser is out of date!

Update your browser to view this website correctly. Update my browser now

×

Cloudera Data Science & Engineering

行き当たりばったりの予測は予測とは言えません。

ClouderaCloudera Data Scienceは、近代的な予測アナリティクスのあらゆる側面に対応する使い慣れた高性能ツールで、Apache Hadoopへのより良いアクセスを可能にします。Clouderaを活用することで、お客様は高度なデータエンジニアリングや探索的データサイエンス、機械学習を大規模に実践できるようになります。しかも、オンプレミス、パブリッククラウド、ハイブリッドなど、データの管理環境に左右される心配はありません。最適なインサイトを今日獲得して、明日のより良い意思決定を実現してください。

Clouderaだけが提供できる柔軟性とパフォーマンス

バッチ、リアルタイム、ストリーミングワークロードの近代的データ処理ソリューションとして、Clouderaに勝るものはありません。 pache Sparkなどのテクノロジーを活用することで、従来テクノロジーよりも著しくスピーディに高度なデータ処理を実践できます—例えば、大規模分散データに高いスケーラビリティでSQLを高速に実行したり、関数スタイルのプログラミングAPIの柔軟な処理エンジンを利用したりできます。また、ストリーミングデータの 相互サーチ やSQLアクセスといった機能のおかげで、データの可視性も高まります。

Apache Sparkについてさらに詳しく知る

全てのワークロードをクラウド環境で

できる限り多くのワークロードをクラウド環境で実行しませんか?複数のワークロードをマルチテナント環境で実行するにせよ、クラウド環境を用いる特定のタスク(ETLや探索的データサイエンスなど)を設計するにせよ、Cloudera Enterpriseはコンピューティングとストレージの制約をなくして、所有コストを軽減しながら、ライフサイクル全体を通したデータの永続性を維持します。さらに、Amazonのスポットインスタンスで最も安いインフラストラクチャーを利用することにより、一層のコスト削減も可能です。

パブリッククラウド上でのデータエンジニアリングとデータサイエンス

あらゆる側面からパフォーマンスを改善

Clouderaは、大規模データセットへの探索的データサイエンスの実行を可能にし、同時に、エンジニアが必要なデータパイプラインを構築してマルチテナントアプリケーションを導入するためのツールを提供します。しかも全ての機能を、ポリシーやアクセス、セキュリティが安全に管理された単一の製品で提供するため、データのライフサイクル全体を通して可視性を高めることができます。

Cloudera Data Science Workbenchについてさらに詳しく知る

あらゆる障壁を取り払います

企業にとって、最も大きな目標に合わせてビジネスを拡張していくのは簡単なことではありません。Clouderaなら、お客様は大規模に探索的データサイエンスを実行し、大規模な並行コンピューティングや拡張データストリームを活用した機械学習モデルを導入できます豊富なプログラミングインターフェースと近代的なライブラリーを使って、プロダクション環境にモデルを展開し、安定させることができます。

動画を見る:機械学習とHadoop

主なユースケース

データプロセッシング
バッチ、リアルタイム、インタラクティブ――お客様のワークロードに最適なアプローチを選択できます:

  • 高速リアルタイムデータ取得:あらゆるソースから、あらゆるタイプのデータを取得
  • 拡張性に富むハイパフォーマンスなアーキテクチャー
  • 多様なデータタイプへの対応、優れたデータアクセシビリティ

機械学習
より多くのユーザーがハイパフォーマンスなアドホックアクセスを利用し、極めて迅速なインサイト獲得を支援します:

  • 分散機械学習
  • 使い慣れたAPI
  • バッチとストリーミングの統合

ストリームプロセッシング
データストリームの継続的なリアルタイム処理を実現します:

  • 耐障害性に優れたアプローチで継続的なデータストリームをハイパフォーマンスに処理
  • バッチ処理とストリーム処理に共通のAPIとプログラミングパラダイムを使用
  • 一般的なストリーミングタスクに簡易APIを使用
  • MLlibとの統合により、ストリーミングデータに予測分析を実行

探索的データサイエンス
統計的プログラミングを大規模データセットに拡張します:

  • 使い慣れたAPI
  • バッチとストリーミングの統合
Analyst Report

Taneja Group Spark market adoption report

Whitepaper

What is Data Science?