Evolve logo オンデマンド配信 Evolve 2023 Tokyo|AI、データと分析の先進事例を紹介
  • Cloudera Cloudera
  • Dell logo
    2.5PB以上のデータを分析

    Key highlights

    Category

    • テクノロジー
    • 製造

    Location

    本社:米国テキサス州ラウンドロック

    Solution highlights

    • 最新のデータプラットフォーム: Cloudera Enterprise
    • ワークロード:データウェアハウス、オペレーショナルデータベース
    • コンポーネント:Apache Flume、Apache HBase、 Apache Hive、Apache Impala、Apache Kafka、Apache Pig、Apache Sentry、Apache Spark、Cloudera Manager、Cloudera Navigator、Cloudera Search
    • BI および分析ツール: Tableau、Datameer、AtScale
    • ETL ツール: Informatica BDM、StreamSets
    • サーバー:Dell PowerEdge R730 および R730 XD

    Applications supported

    • マーケティング、カスタマー、サプライチェーン、HR、製品の品質に対するインサイト
    • リアルタイムの IoT データ処理
    • 長期間クエリ可能なアーカイブとストレージ

    Data sources

    • 運用システムからの温度センサーデータとマシンデータ
    • 工場、Microsoft Internet Information Services (IIS)、Internet Authentication Service (IAS)、システム連携および互換性テストからのログファイル
    • Dell.com Webログ
    • ソーシャルメディアデータ。Facebook、Twitterなど
    • リレーショナルマートの構造化データ
    • アプリーションデータ
    • PDF とテキストファイル
    • 部品サプライヤーからのデータ。例えば、シリアル番号、出荷日、歩留まりデータ、パラメータデータなど
    • 組立工程からのデータ。例えば、シリアル番号のスキャンデータ、テストログ、不具合など
    • お客様のディスパッチ、コールログ、「コールホーム (call home)」のログ
    • リペアセンターのデータ。例えば、部品の不具合、修理データなど

    Impact

    • 製品開発、製造およびサプライチェーンの問題にリアルタイムで対応
    • より優れた製品の品質と、全方位のカスタマービューによる顧客満足度の向上

    Big data scale

    • ~2.5 PB raw
    • Thousands of concurrent users

    Dell は、Cloudera の最新のデータプラットフォームを使用することで、全方位のカスタマービューを構築し、サプライチェーンの運用や品質管理、顧客満足度、そして人事 (HR) に関するインサイトの向上を図ることができました。

    Dell Technologies 傘下の一社である Dell Inc. は、PC からサーバー、プリンターに至るまで、IT 機器とインフラストラクチャーの多国籍プロバイダーとして、消費者や企業にサービスを提供しています。

    インパクト

    Dellでは、高度な分析機能を駆使することで、「何が起こっているのか?」という状況の把握から、「何が起こると予測できるか?」という段階にその焦点を切り替えようとしています。Cloudera が提供するインタラクティブな分析機能が、製造やサプライチェーンのプロセスを改善し、以下に示すような製品の品質や顧客満足度の向上に貢献しています:

    • センサーやマシンデータを利用したリスクモデルと、予測障害分析機能を組み合わせてメンテナンス計画を立てることでROI を最大化

    • マルチ構造化データセットを解析することで、Dell は、製品開発、テスト、品質管理サイクル全般を通じて発生する各種の課題やパターンに対するより優れた理解が可能に

    • これらのデータセットに対するインタラクティブな分析機能を提供する、Cloudera のプラットフォームで構築した最新のデータウェアハウスによって、Dellは、発生中の各種状況にその場で対処が可能に

    この分析環境は HR にも大きな影響を与えており、レガシーなソフトウェアよりもパフォーマンスが大幅に向上したため、当初は、驚いたスタッフがシステムの故障であると誤解したほどでした。

    また Dell は、全方位のカスタマービューによって、以下に示すような様々な業務機能を実現しています:

    • 営業 —カスタマイズした提案や推奨の促進

    • カスタマーサービス—例えば、インバウンドのコール中に、より効率的な対話を可能に

    Dell のビッグデータプラットフォームでは、マシンデータや温度センサーなど、大量で高速な IoT(モノのインターネット)データセットの取り込みや活用と共に、これらのデータの迅速な処理が可能です。現在同社は、コストのかかるアップグレードを回避しながら、業務ユーザーが過去データを利用できるようにするアーカイブ戦略を採用しています。

    (Apache) Impala をシステムのコアに据えることで、全てのログから素早く情報を取り出し、いつでもすぐに他のチームに引き渡すことができるようになりました」と Dell のエンタープライズビジネスインテリジェンス部門のDeepak Gattala 氏は述べています。 Cloudera の統合プラットフォームによって、過去のシステムでは利用できなかったあらゆる種類のデータを活用し、以前よりもはるかに高速にインタラクティブ SQL クエリを実行して、多くの新しいインサイトを取得できるようになりました。

    ビジネス推進要因

    Dell は、今後5年間でデータ量が8〜10倍に増加すると予想し、またそのデータを活用することで、製造やサプライチェーンのプロセスで大きなメリットが生まれるとの見込みに基づき、ビッグデータへの取り組みに着手しました。

    ビジネスユーザーは、全てのデータに対してリアルタイムにアクセスできることを要求していましたが、IT部門側は、データの可用性に関するSLAを満足させることができませんでした。例えば、リアルタイム分析は、運用コストの削減には役立ちますが、彼らは「休止中」のマシンデータを保存し分析することができるソリューションを必要としていました。高価なアップグレード費用を目のあたりにしたDell には、膨大な量のマルチ構造化データの保存や処理を行うキャパシティがありませんでした。データ変換の完了迄には何時間も必要な上、Dell が保存した多くのデータは、サイロ化して使われない状態のまま残っていました。EDW に対するアーカイブ戦略はありませんでしたが、規制に対応するためには、過去のデータへのアクセスが必要でした。それまで同社は、リレーショナルデータベースに依存してきました。これは構造化データには効果的ですが、現在のマルチ構造化データへの対応は困難です。

    Dell のチームでは、ビッグデータプラットフォームには次のような機能が必要だと結論付けました。

    • 高速、大容量のマルチ構造化データセットを長期間保存できること

    • ストリーミングデータを(バッチに比べ)ほぼリアルタイムに処理し、その場ですぐ問題の検知と解決を行えること

    • サイロ化したデータを1つの統合環境に集約できること

    ソリューション

    Cloudera Enterprise は、Dellにデータウェアハウスやオペレーショナルデータベース、クエリ可能なアーカイブといった、様々なワークロードをサポートする統合プラットフォームを提供しています。同社のチームは、Dell | Cloudera Apache Hadoop Solution を使って合理的にHadoop の実装を行い、Cloudera Support によって迅速に課題を解決することができました。

    また、Clouderaが提供するデータウェアハウス によって、次のような様々な領域でインサイトを引き出し、インタラクティブな分析をサポートできるようになりました。

    • マーケティング—Dell.com や Webログ、ソーシャルメディアによって、お客様に対するより優れた理解が可能となり、それぞれのお客様に応じたコミュニケーションが取れるようになりました

    • カスタマーリレーションシップマネージメント—レガシーなデータマート、コールログ、アプリケーションのデータを統合し、全方位のカスタマービューでユーザーエクスペリエンスを向上させることができました

    • サプライチェーンの運用—Dell のチームに加え、部品サプライヤーから組立工程、カスタマー、リペアセンターといったサプライヤーに対して、データへのアクセスとインサイトを提供することで、効率の向上を図ることができました

    • ハードウェアプロトタイプの検証と製品の品質—Microsoft Internet Information Services (IIS)、Internet Authentication Service (IAS)、システム連携ログ、互換性テストデータを使った包括的なビューを得ることで、故障やエラーの発生を最小限に抑えることができました。

    • 人事 -- レガシーなシステムに比べて、パフォーマンスを桁違いに向上させることができました

    また Dell は、Cloudera の オペレーショナルデータべ―ス を使って、分析アプリケーションのリアルタイム処理を実現しました。 オペレーショナルデータベースは、Apache Flumeおよび Apache Kafka を使ってリアルタイムのマシンデータやログデータを取り込み、 Apache HBase を使ってそれらのデータを顧客情報と関連付けます。

    データ検索は、Cloudera Search を使って実行することが可能であり、例えば、検索可能なテキストとしてコールログからお客様のコメントを取り出すことができます。同プラットフォームは、Dell の社員による、常時約 1,000の同時検索にいつでも対応できるようになっています。

    Cloudera は、Hadoop プラットフォームを中心に開発したツールやテクノロジーによって、高い付加価値を提供し、容易な健全性の維持に貢献しています。

    -Dell エンタープライズビジネスインテリジェンス部門、Deepak Gattala氏

    Cloudera が選ばれる理由

    Dellでは、Clouderaのプラットフォームでサポートされる様々なワークロードの価値に加え、マーケティング、製造、サプライチェーン、人事など、組織全体にわたる包括的な役割ベースのアクセスコントロール機能を評価し、Clouderaの選定を決定しました。

    Dell は、Cloudera Navigator が提供するデータリネージ機能によって、Apache Hadoop でどのようにデータが利用されているかをトラッキングしてその内容を理解すると共に、Apache Sentry によって、Dell の数千におよぶユーザーのロールベースでのアクセスを可能にしています。また近い将来、Cloudera の暗号化製品を使って PCI 準拠のデータセットを最新のデータプラットフォームに取り込み、管理を行うことを計画しています。

    さらに、シングルビューで全てのワークロードやサービス、パートナーのテクノロジーに対する監視やトラブル対応が可能な、Cloudera Manager によって、シンプルな運用と管理を実現しています。これらに加え、Dell は、ダウンタイムなしのメンテナンスとアップグレードによって、最もミッションクリティカルなワークロードでさえ、その稼動を持続することができると確認しています。