この記事は、2025/10/22に公開された「Architecting for Data Resilience: Ensuring Business Continuity with Cloudera」の翻訳です。
最近、クラウドハイパースケーラーで起こった世界規模の IT 障害は、たとえ最小限であっても、ダウンタイムやサービスの中断は避けられないという、テクノロジーの普遍的な真実を思い出させてくれました。影響は広範囲に及び、小売、銀行、医療などの分野でサービスが中断されましたが、これは単一のプロバイダーやクラウドに固有の障害ではありませんでした。つまり、クラウドリージョンやプロバイダーに関係なく、どこでも中断が発生する可能性があるのです。
この経験により明らかになったことが一つあります。それは、絶え間ない変化の中でも適応し、繁栄できる、強靭なデータアーキテクチャを構築することで、組織は主導権を握ることが可能であり、また、握らなければならないということです。このブログでは、シームレスなフェイルオーバーやリカバリを保証するツールとポータブルなアーキテクチャにより、Cloudera の顧客をビジネス継続性を確保する上で有利な立場へ導く方法について説明します。Cloudera は、クラウド、データセンター、エッジを問わず、あらゆる場所のデータに AI の力をもたらす唯一のデータ AI プラットフォーム企業です。
データの回復力とは、組織がデータ関連の中断や障害に耐え、迅速に回復し、影響を最小限に抑える能力のことです。これは、ビジネス継続性を維持するためのバックアップやディザスタリカバリの範囲を超えた予防型アプローチであり、重要なデータが常に以下の状態であることを保証します。
利用可能:必要に応じてユーザーやアプリケーションにアクセスできる(目標復旧時間「RTO」を最小限に抑える)
完全または正確(データの完全性):破損や変更がない(目標復旧時点「RPO」を最小限に抑える)
安全:不正アクセス、紛失、盗難から保護されている
真の回復力を実現する設計には、ポータビリティを実現するテクノロジーとフェイルオーバーのための検証済みプロセスという、相互に関連する2つの中核的な柱が必要です。
単一のプロバイダー、単一のクラウド、またはクラウド内の単一のリージョンに依存すると、重大なビジネス上の脆弱性、つまり単一障害点が生じます。障害はハードウェアの故障、ソフトウェアの問題、人的ミス、自然災害、またはサイバー攻撃によって発生します。回復力を確保する上での目標は、1つの環境に障害が発生した場合でも、他の場所で操作をシームレスかつ自動的に継続できるようにすることです。
これは、クラウドリージョン間、クラウドプロバイダー間、さらにはデータセンターにまでフェイルオーバーできる必要があるということを意味します。最初の中断がどこで発生したかに関係なく、日々の業務を止めるわけにはいかず、重要なシステムは稼働し続けなければなりません。
テクノロジーは回復力をもたらしますが、ビジネス継続性を実現するにはプロセスが不可欠です。ディザスタリカバリ計画の多くは、一度作成されると、人やテクノロジーが進化してもほとんど見直されません。十分に吟味された計画を文書化し、実践し、定期的に見直し、障害発生時に組織で確実に実行できるようにする必要があります。計画には以下のような要素を含めます。
小売業におけるトランザクション処理や医療におけるリモート監視など、RTO や RPO のサービスレベル契約(SLA)が最も低いミッションクリティカルな操作を確実に実行するためにワークロードの優先順位付けをします。
環境間のフェイルオーバー機能を確立して運用を維持し、冗長性と高可用性を確保します。
重要なデータやメタデータをバックアップして、保持ポリシーとガバナンスを確立します。
Cloudera は、あらゆる場所のデータに対して一貫したクラウドエクスペリエンスを提供する唯一のデータおよび AI プラットフォームプロバイダーです。これにより、企業は、摩擦やベンダーのロックインなしに、クラウドとデータセンター間でデータと AI ワークロードを自由に移動できるようになり、特定のインフラストラクチャに縛られることがなくなります。その結果、Cloudera を活用して回復力のある設計を実現し、データの保存場所に関係なく一貫した運用とコンプライアンスを維持することで、ビジネスリスクを軽減できます。
Cloudera プラットフォームは、以下のようなソリューションとサービスを通じて、高可用性と耐障害性をサポートしています。
ポータブルデータサービス:Cloudera のプラットフォームは、クラウドネイティブのデータサービスやデータレイクを備えており、AWS、Azure、Google Cloud などのあらゆるクラウド上で安定して動作するだけでなく、Kubernetes でもオンプレミスで動作します。基盤となるインフラストラクチャから解放されることで、顧客はさまざまなクラウドとオンプレミスリソースを組み合わせて利用可能なサイトを構成でき、単一のプラットフォームやベンダーへの依存を大幅に減らすことができます。
流れているデータ:Cloudera Data Flow、 Cloudera Streaming Analytics、Cloudera Streams Messaging により、顧客はどこでもリアルタイムでデータを取得・処理・配信できます。不正行為の検出やネットワークの監視といったミッションクリティカルなリアルタイムのワークロードでは、停止の可能性がビジネスに重大な影響を及ぼすこともあります。Cloudera は、これらのサービス可用性を高く維持し、環境間で複製できることを保証します。
Replication Manager:Cloudera のコアコンポーネントで、バックアップとリカバリに対する簡素化されたアプローチを提供します。データだけでなく、メタデータやそれに紐づく重要なセキュリティおよびガバナンスポリシーも複製します。このレプリケーションにより、移行が容易になり、継続的な同期が可能になるだけでなく、データ損失を最小限に抑えながらプライマリ運用環境と並行してセカンダリ複製環境を推進することで、迅速なフェイルオーバーが可能になります。
オープンデータレイクハウス:Cloudera のオープンデータレイクハウスは、一度書き込めばどこでも実行できるアプローチで、安全なデータ管理機能とポータブルなクラウドネイティブデータ分析機能を提供します。これにより、異なるインフラストラクチャ間を移動するときに、アプリケーションまたはワークロードのリファクタリングに関連する時間とコストが削減されます。
図1.Cloudera は Cloud Experience Anywhere で「あらゆる場面で AI を活用」を実現します
これらの機能を組み合わせることで、Cloudera の顧客はミッションクリティカルなデータや AI ワークロードを自信を持って実行できるようになり、インフラストラクチャレベルの停止時でも、最も重要なビジネスプロセスのダウンタイムやデータ損失をほぼゼロに抑えることができます。
最近起こった障害は、多くの企業にとって一時的なものでした。しかし、戦争のような悲劇による中断だったらどうなるのでしょう。ウクライナに拠点を置く AM-BITS は、銀行、通信、小売分野向けの IT ソリューションプロバイダーであり、地政学的な混乱により組織がオンプレミスシステムからクラウドへの急速な移行を強いられる中、クライアントのミッションクリティカルなデータを喫緊に保護し、移行するよう求められました。一般的なクラウド移行には6か月以上かかる場合もありますが、多くの企業は待っている余裕がありません。
この事業継続性の危機に対処するため、AM-BITS は Cloudera を搭載した最新のマルチテナントデータおよび AI プラットフォームを構築しました。同社は Cloudera Shared Data Experience(Cloudera SDX)を活用して、顧客のデータ資産に「技術的なセーフハーバー」を迅速に提供し、データをクラウドに安全に移行する時間を50%も短縮しました。どんな環境でもシームレスに動作する Cloudera により、AM-BITS の顧客は真の柔軟性を手に入れました。また、クラウドに迅速に移行できるだけでなく、別のクラウドに移動したり、データをオンプレミスに戻したりするオプションも維持できました。同社は Cloudera を活用することで、ポータビリティを事業を継続させるための強力なツールに変えました。
データ関連の中断や停止は、ハードウェアの障害、ソフトウェアの問題、人為的エラー、自然災害、サイバー攻撃などによって引き起こされる可能性があります。システムを設計する際には、これらの障害点を考慮し、IT システムとデータを迅速に、かつ大きな混乱を伴わずに回復するための計画を立てることが極めて重要です。
Cloudera を使用して回復力を構築する方法について詳しくは、ディザスタリカバリに関するチェックリストとリソースをご覧ください。また、回復力の計画設計をサポートする弊社プロフェッショナルサービスチームにお問い合わせください。
This may have been caused by one of the following: