
このデジタル時代に、データの生成、キャプチャ、整理に多大な労力が費やされています。自動化、人工知能 (AI)、仮想現実 (VR) をはじめとする高度なテクノロジーに期待する有意義な成果を得られるかどうかは、結局のところデータをうまく管理できるかどうかにかかっています。使用できる場所へ移動するだけでも、複雑な分析を実行する場合も、意思決定はデータから始まります。
しかし、適切なデータ管理には、データの背後にあるデータ、つまりメタデータを確実に理解する必要があります。メタはギリシャ語で「自己」を意味し、メタデータとは、データ自体についての詳細と特性に関する情報です。
メタデータの追跡と記録は不可欠です。デジタル時代以前に図書館の本の検索をカード目録で行っていたように、メタデータによって必要なファイルやドキュメントを見つけるプロセスが簡素化されます。メタデータで、作成者、ファイルサイズ、データの作成日と修正日などの詳細を追跡できます。
明確に定義されたメタデータ管理戦略がなければ、ファイルを見つけるのに何時間も費やす可能性があります。システム内の隠しファイルを検索したことがある人なら誰でも、それがどれほど面倒であるかはご存じでしょう。ガレージで探し物をする場合と同じように、最初のステップはそこにあるものを整理することです。さらに、組織全体の複数のシステムで使用されているメタデータの基準や手順が異なると、イライラすることになる可能性があります。
メタデータ戦略では、組織のすべてのデータに関して次の基本的かつ不可欠な質問に答えることで、効率と生産性が向上します。
何のデータか?
どこから取得されたか?
誰が使用するか?
使用する目的は?
メタデータの種類
メタデータにはさまざまな種類があり、組織はどの種類のメタデータが目的に適しているかを把握する必要があります。そうすれば、それに応じて戦略を立てることができます。メタデータの最も一般的な種類は次のとおりです。
記述 — 作成者や作成日、修正日など、リソースを特定できるようにする詳細情報
構造 — リソースのコンポーネントの関係と、その組み合わせ方法に関する情報
管理 — アクセス許可や作成方法など、リソースに関する技術情報
参照 — コンテンツの品質およびデータ作成に使用された手法/基準に関する情報
メタデータのオーナーシップ
メタデータ戦略にとって不可欠なのは、組織内で誰がどのようにメタデータを使用するのかを決定することです。データエンジニアやアナリスト、ソフトウェア開発やデータベース管理の担当者などが、メタデータ関連の意思決定に関与するべきです。
ただし、一般社員であるシステムユーザーも忘れてはいけません。検索用語が意味をなさない場合、ユーザーが必要なデータにアクセスしようとしても、うまくいかずに時間が無駄になってしまう可能性があります。そのため、システムユーザーの意見を取り入れて、データが直感的な方法で整理され、簡単にアクセスできるようにすることが重要です。
メタデータは、企業の効果的なデータガバナンス戦略の極めて重要な部分です。適切にガバナンスに取り組まなければ、組織は多くのリスクの影響を受けやすくなります。次のブログ記事では、ガバナンスの重大な失敗と、適切に行う方法について取り上げています。

ソースと属性
メタデータ戦略の重要な要素は、データのソースと属性を識別することです。業務ではデータへの依存が増しており、データベース、アプリケーション、Web サイト、外部ファイルなどのソースの数が増え続けています。
ソースの品質が大きく異なる場合もあり、データの整理が複雑になっています。信頼できるソースを識別することが重要です。データは多くの場合、その起点や、企業の環境に取り込む方法に応じて、さまざまな方法で構造化されます。すべてのソースからのメタデータを統合し、組織全体での使用に適した構造と一致させるには、ある程度の労力が必要です。また、ユーザーがシステムやファイルに対してデータの検索や保存を行う方法に関する基準と手順を確立する必要があります。
ファイルに一貫した命名規則を使用することが重要です。タグと識別子は、関係者にとって適切で馴染みのある標準的な語彙を使用して、ファイル間で差のない簡潔なものにする必要があります。このシンプルなステップを達成できないと、やはりイライラにつながる可能性があります。
継続的な取り組み
メタデータ管理は継続的な取り組みです。データエンジニアとアナリストはデータソースを継続的に識別および評価する必要があり、そうすることでデータを追跡、分類、検索することができ、データが使いやすくなり、プロセスと手順が関連法規制に準拠するようになります。メタデータは意思決定の重要な要素であり、企業や政府機関のミッションの成果を後押しする信頼できるタイムリーな意思決定を行うためには、これを維持・管理することが不可欠です。
データガバナンスは企業にとって極めて重要であり、Cloudera Data Platform (CDP) などの Cloudera のソリューションは、ユーザーがメタデータ (およびデータ) をあらゆる場所で迅速かつ簡単に管理するのに役立ちます。
環境がより複雑になり、データソースが増大しているため、効果的なメタデータ戦略を持つことは、組織の日常業務と将来の計画に不可欠です。
著者

Rob Carey
Rob Carey は現在、Cloudera Government Solutions, Inc のプレジデントであり、Cloudera の公共部門担当上席副社長です。政府のミッションをサポートして組織の目標を達成するための強力なチームを構築することに専念しています。サイバーセキュリティ、クラウドコンピューティング、プログラム管理、システム/プロセス分析、企業アーキテクチャー、業務計画の専門知識があり、32年を超える連邦政府での指導の経験と、米国海軍の予備部隊で25年勤務した経験を持ちます。