冗長性とは、システム内の重要なコンポーネント、機能、リンク、またはリソースを意図的に複製し、一部が故障してもサービスを継続できるようにすることを指します。実用的な工学および運用の観点では、冗長性は無駄ではありません。それは信頼性戦略です。目標は、単一障害点を減らし、障害、メンテナンスイベント、過負荷状態、または予期せぬ中断中にシステムが利用可能であり続ける能力を向上させることです。
この概念は多くの技術分野および運用分野に現れます。ネットワーキングでは、冗長性はデュアルアップリンク、バックアップスイッチ、または複数の伝送パスを意味する場合があります。電話およびユニファイドコミュニケーションでは、冗長SIPサーバー、スタンバイIP PBXプラットフォーム、複製ゲートウェイ、またはバックアップコールルーティングロジックを含むことがあります。電源システムでは、デュアル電源、バッテリーバックアップ、および冗長電源フィードを含めることができます。産業環境では、冗長性はさらに拡張されて、複製されたコントローラ、通信パス、フィールドデバイス、および高可用性運用をサポートするフェイルオーバーサーバーを含むことがよくあります。
冗長性はインフラストラクチャおよび重要なシステムの文脈で議論されることがよくありますが、根底にある考え方は単純です。単一の障害がサービス全体を停止させる可能性がある場合、システムは脆弱になります。冗長性は、代替のパス、デバイス、またはサービスインスタンスがすでに引き継ぐ準備ができていることを保証することで、その脆弱性を低減します。このため、冗長性は通信ネットワーク、セキュリティシステム、自動化プラットフォーム、公共安全システム、およびエンタープライズITアーキテクチャにおける最も重要な設計原則の1つです。
冗長性は、バックアップリソースを追加し、単一障害点を減らすことにより、サービス継続性を向上させます。
冗長性が実際に意味するもの
単純なバックアップ以上のもの
多くの人は冗長性とバックアップという言葉を同じ意味で使いますが、実際のシステム設計ではそれらは同一ではなく関連しています。バックアップは多くの場合、障害後に使用される予備のコピーまたはスタンバイリソースですが、冗長性は通常、複数のリソースが既にライブシステムアーキテクチャに組み込まれていることを意味します。言い換えれば、冗長性は何かがうまくいかなかった後の回復だけではありません。それは、何かがうまくいかなかったときにシステムが最小限の中断で動作を継続できるように設計することです。
たとえば、オフラインで保存されたバックアップ構成ファイルは便利ですが、リアルタイムのサービス継続性を生み出すわけではありません。対照的に、冗長サーバーペア、セカンダリネットワークパス、またはセカンダリ電源は、システムがまだ実行中に継続性をサポートできます。この区別は、病院、制御室、交通ハブ、産業プラント、緊急通信システム、大企業ネットワークなど、サービス中断が高コストまたは危険な環境で特に重要です。
そのため、冗長性は多くの場合、災害復旧の一部ではなく、可用性エンジニアリングの一部として扱われます。それは、障害がすでにダウンタイムを引き起こした後にどのように再構築できるかだけでなく、障害中にシステムがどのように動作するかという問題に対処します。
単一障害点の低減
冗長性を使用する最も一般的な理由は、単一障害点を排除または低減することです。単一障害点とは、その障害がより大きなシステムを停止させる可能性のある任意のコンポーネントです。これは、ネットワークスイッチ、電源モジュール、サーバー、ストレージデバイス、ゲートウェイ、コントローラ、またはケーブルパスでさえあり得ます。その要素が故障し、代替手段が存在しない場合、サービスは停止します。
冗長性はそのリスクモデルを変更します。単一の重要な要素に依存する代わりに、システムは別のコンポーネント、ルート、またはインスタンスがタスクを継続できるように設計されています。一部の設計では、予備リソースは必要になるまでアイドル状態のままです。他の設計では、両方のリソースがアクティブで負荷を共有します。いずれにしても、障害が発生した場合でもサービスを利用可能に保つことが目的です。
これが、冗長性が最新の通信システムで非常に価値がある理由です。音声、データ、制御、アラーム機能は、相互接続されたデジタルインフラストラクチャにますます依存しています。単一の障害が一度に複数のサービスに影響を与える場合、運用への影響は古い孤立したシステムよりもはるかに大きくなる可能性があります。冗長性はそのリスクを封じ込めるのに役立ちます。
冗長性とは、障害が発生することを想定し、それらの障害がサービスの崩壊にならないようにシステムを設計するという工学的決定です。
冗長性の仕組み
スタンバイモデルとアクティブ-アクティブモデル
冗長性はいくつかの方法で実装できますが、2つの一般的なモデルはアクティブ-スタンバイとアクティブ-アクティブです。アクティブ-スタンバイ設計では、一次リソースが通常の状態でサービスを処理し、二次リソースは予備として待機します。一次が失敗すると、二次が引き継ぎます。このアプローチは、簡素化されたフェイルオーバー動作が望ましいサーバー、コントローラー、ゲートウェイ、電源モジュール、通信ノードで一般的です。
アクティブ-アクティブモデルでは、複数のリソースが同時にアクティブです。それらはトラフィックを共有したり、リクエストを並行して処理したり、1つのインスタンスが失敗した場合に相互の継続性を提供したりします。この設計は可用性と容量の両方を向上させることができますが、多くの場合、より慎重な同期、状態処理、およびトラフィック管理が必要です。ネットワーキングおよびデータサービスでは、負荷分散と継続的な応答性の両方が重要な場合に、アクティブ-アクティブアプローチが特に一般的です。
最良の選択はアプリケーションに依存します。アクティブ-スタンバイは多くの場合、制御と検証がより簡単ですが、アクティブ-アクティブはより大きなシステムでより強力なパフォーマンスとよりスムーズな継続性を提供する可能性があります。両方のアプローチは冗長性の形式ですが、動作動作と設計の複雑さが異なります。
フェイルオーバー、スイッチオーバー、および復旧ロジック
冗長性は、システムが障害に反応する方法を知っている場合にのみ有用になります。ここでフェイルオーバーロジックが重要になります。冗長設計には通常、ヘルスモニタリング、ハートビート信号、同期メカニズム、ロール定義、およびスイッチオーバールールが含まれます。システムがリソースが正しく機能しなくなったことを検出すると、代替リソースがサービスを継続できるように遷移を開始します。
その遷移は、環境に応じて自動または手動の場合があります。重要な通信では、遅延が音声トラフィックや応答操作を混乱させる可能性があるため、自動フェイルオーバーが好まれることがよくあります。一部の産業または規制環境では、システム状態とプロセスの安全性を制御するために、監視付きまたは半手動のスイッチオーバーが使用される場合があります。いずれの場合も、冗長性の有効性は、余分なハードウェアやソフトウェアを持っていることだけでなく、遷移を正しく管理することに依存します。
フェイルオーバー後の復旧も重要です。障害のあるコンポーネントが修復されると、システムはサービスをすぐに元のリソースに戻すか、オペレーターの承認を待つか、計画されたメンテナンスウィンドウまでバックアップを制御下に保つかを決定する必要があります。これらのポリシーの選択は安定性に影響し、即興ではなく計画されるべきです。
同期と状態認識
多くの冗長システムでは、二次リソースは重要なコンテキストを失うことなく引き継ぐ準備ができている必要があります。つまり、構成データ、セッション情報、コール状態、ルーティングテーブル、ユーザーデータ、アラーム、またはアプリケーションステータスを一次コンポーネントと二次コンポーネント間で同期する必要がある場合があります。同期がないと、フェイルオーバーはインフラストラクチャの可用性を維持するかもしれませんが、それでもサービスエクスペリエンスを大きく中断させる可能性があります。
これは音声および通信システムで特に重要です。冗長SIPプラットフォーム、ディスパッチサーバー、またはIP PBXは、同期されたユーザープロファイル、内線データ、ルートポリシー、および登録ロジックを必要とする場合があります。ストレージおよび仮想化環境では、同期された状態はデータの不整合を防ぐのに役立ちます。産業用制御システムでは、同期されたロジックは、切り替え中に自動化動作を予測可能に保つために不可欠です。
このため、冗長性は物理的な複製だけではありません。それは情報の継続性についてでもあります。存在するが同期されていないスタンバイサーバーは、それが引き継いだときに組織をサービス中断に対して脆弱なままにする可能性があります。
冗長性の主な特徴
高可用性サポート
冗長性の最も広く認識されている特徴は、可用性の向上です。冗長設計は、ハードウェア、ソフトウェア、または接続の問題が発生した場合でも、サービスがアクセス可能な状態を維持するのに役立ちます。アップタイムを運任せに扱うのではなく、冗長性は可用性をアーキテクチャ自体の一部にします。これは、ライブ通信、運用調整、アラーム、セキュリティ、または顧客向けインタラクションをサポートするシステムで特に価値があります。
実際の展開では、高可用性はシステムが技術的にオンラインであるかどうかだけではありません。ユーザーが最小限の中断で作業を継続できるかどうかでもあります。単一のサーバー障害中にアクティブな登録をすべて失ったり、到達不能になったりする通信システムは、迅速に再起動できたとしても、運用上の期待に応えられない可能性があります。冗長性は、事前に継続パスを準備することにより、その露出を減らします。
これが、高可用性設計が冗長性計画と切り離せないことが多い理由です。アップタイムが重要な場合、冗長性は通常、それを達成するために使用される主要なツールの1つです。
耐障害性とサービス継続性
冗長性は耐障害性と密接に関連していますが、2つの考え方はまったく同じではありません。耐障害性とは、障害にもかかわらずシステムが正しく機能し続ける能力を指します。冗長性は、その結果を達成するのに役立つメカニズムの1つです。重要なリソースを複製することにより、システムはそれ以外の場合は即時のサービス中断を引き起こす領域での障害に対する耐性を獲得します。
通信およびインフラストラクチャシステムでは、これはユーザーが1つのノード、リンク、または電源を失った場合でも、多くの場合、通話を続けたり、サービスにアクセスしたり、データを交換したりできることを意味します。産業環境では、監視、放送、インターホン、または制御操作が危険な死角なしに継続することを意味する場合があります。エンタープライズITでは、障害が分離されて修復されている間、アプリケーションとユーザーセッションを利用可能に保つことができます。
サービス継続性は、ユーザーが気にする実用的な結果です。彼らは冗長性ロジックを直接見ることはできませんが、ストレス下でもシステムを信頼性が高く回復力があると体験します。
柔軟なメンテナンスと運用上の回復力
冗長性のもう1つの重要な特徴は、完全なサービス中断を必要とせずにメンテナンスをサポートすることです。プラットフォームに冗長サーバー、スイッチ、リンク、または電源がある場合、技術者は一方がワークロードを継続して処理している間に、他方の部分を保守できる可能性があります。これにより、ライフサイクルの管理性が向上し、メンテナンスウィンドウのコストが削減されます。
冗長性は、部分的な劣化時の運用上の回復力もサポートします。すべての問題が完全な障害であるとは限りません。時には、問題は過負荷、断続的な不安定性、計画されたアップグレード、または一時的な環境混乱です。冗長設計は、小さな問題が大きな停止になる前に、サービスを再ルーティング、分離、および安定化するためのオプションを提供します。
組織が常時接続のデジタル通信に依存するにつれて、その回復力はますます重要になります。システムは、まれな災害だけでなく、日常的な障害やメンテナンスの現実も生き残る必要があります。
冗長性は、通信およびインフラストラクチャシステムにおける高可用性、耐障害性、およびより柔軟なメンテナンスをサポートします。
冗長性の一般的なタイプ
ネットワーク冗長性
ネットワーク冗長性は最も一般的な形式の1つです。複数のアップリンク、冗長スイッチ、デュアルルーター、リングトポロジ、メッシュリンク、または代替WANパスを含む場合があります。目的は、1つの接続またはデバイスが故障した場合でもトラフィックを移動できるようにすることです。ビジネスネットワークおよび産業ネットワークでは、ネットワークの停止が音声、ビデオ、アラーム、制御トラフィック、およびビジネスアプリケーションに同時に影響を与える可能性があるため、これは不可欠です。
実際のプロジェクトでは、ネットワーク冗長性は、スパニングプロトコル、ルーティングフェイルオーバー、高速復旧メカニズム、VLAN設計、およびQoS計画と組み合わされることがよくあります。ネットワークは、追加のリンクを持っているだけでなく、ループ、不安定性、または予測不可能なスイッチング動作を引き起こさずにそれらを使用する方法を知っている必要があります。これは、遅延と損失がサービスを急速に劣化させる可能性があるVoIPおよびSIPトラフィックにとって特に重要です。
通信システムが工場、キャンパス、輸送サイト、ユーティリティ環境全体に拡大するにつれて、ネットワーク冗長性はオプションの機能強化ではなく、基本的な要件になります。
サーバーおよびアプリケーションの冗長性
サーバー冗長性は、ハードウェアまたはソフトウェアの障害にもかかわらず、アプリケーション、制御ロジック、または通信サービスを利用可能に維持する必要がある場合に使用されます。これには、クラスター化されたサーバー、仮想化されたフェイルオーバー環境、ミラーリングされたアプリケーションノード、またはスタンバイサービスインスタンスが含まれる場合があります。SIPおよびIP通信プラットフォームでは、冗長性はコール制御サーバー、プロビジョニングシステム、ボイスメールプラットフォーム、ディスパッチサーバー、および管理アプリケーションをカバーする場合があります。
アプリケーション冗長性は、ユーザーが登録、認証、ルーティング、または調整のために中央サービスに依存している場合に特に重要です。単一の通信サーバーが故障すると、数百または数千のエンドポイントが影響を受ける可能性があります。冗長性は、サービスが別のノードから継続できるようにすることで、そのリスクの集中を減らします。
サーバー冗長性を成功させるには、2台目のマシンをインストールするだけでは不十分です。また、同期、ヘルスチェック、データベース処理、およびアプリケーションに適合する明確に定義されたフェイルオーバーシーケンスにも依存します。
電源冗長性
多くの停止はソフトウェアの障害ではなく、電源障害から始まります。電源冗長性は、複数のエネルギー源または供給経路を提供することにより、このリスクに対処します。一般的な例には、デュアル電源、独立した電源フィード、UPSシステム、バッテリーバックアップ、発電機の統合、およびネットワークまたは通信機器内部の電源モジュールの複製が含まれます。
通信システムでは、電源冗長性は非常に重要です。中央ノードまたはフィールドエンドポイントで電力が失われると、適切に設計されたネットワークおよびサーバーアーキテクチャでも利用できなくなるためです。これは、インフラストラクチャストレス時にサービスが最も必要とされる可能性がある緊急電話、ページングシステム、輸送通信、産業用インターホン、および制御室環境で特に重要です。
そのため、電源冗長性はしばしば通信冗長性と不可分に扱われます。ネットワークパスと電源パスの両方が回復力を持たなければならず、そうでなければ全体的な可用性目標を達成できません。
ストレージおよびデータの冗長性
データも保護が必要です。ストレージ冗長性には、ミラーディスク、RAID構成、複製データベース、同期ストレージノード、およびリモートデータコピーが含まれる場合があります。目的は、ストレージデバイスが故障した場合の情報の損失またはサービス中断を防ぐことです。エンタープライズシステムでは、これはアプリケーションの継続性をサポートします。通信プラットフォームでは、ユーザーレコード、ログ、ボイスメール、構成データ、ルーティングルール、およびイベント履歴を保護する場合があります。
ただし、ストレージ冗長性を完全なデータ保護と混同しないでください。ミラーリングは一部のタイプのハードウェア障害から保護しますが、破損、誤削除、またはアプリケーションレベルのエラーを自動的に解決するわけではありません。このため、組織は通常、一方を他方の代用として扱うのではなく、冗長性をバックアップおよび復旧計画と組み合わせます。
これは重要な点を示しています。冗長性は継続性を改善しますが、より広範な回復力戦略と組み合わせた場合に最も効果的に機能します。
冗長性の適用
通信システムとIPテレフォニー
冗長性は、音声サービスが継続的に利用可能であることが期待されるため、通信プラットフォームで広く使用されています。SIPおよびIPテレフォニー環境では、冗長性には複製されたSIPサーバー、バックアップIP PBXノード、セカンダリセッションボーダーエレメント、冗長ゲートウェイ、および代替WAN接続が含まれる場合があります。これらの設計は、1つのノードまたはパスが故障した場合でもコールを処理できるようにするのに役立ちます。
実際には、これはオフィス、キャンパス、病院、産業現場、輸送施設、および緊急調整センターにとって重要です。電話システムは、日常業務、顧客とのやり取り、およびインシデント対応の中心である可能性があります。メインサーバーまたはネットワークパスが冗長性なしで故障した場合、通信への影響は即座に広範囲に及ぶ可能性があります。
これが、最新のビジネステレフォニーが冗長性をプレミアムな追加機能ではなく、期待されるアーキテクチャ機能としてますます扱う理由です。システムがページング、インターホン、アラーム、ビデオ、およびディスパッチとより統合されるにつれて、通信継続性の価値はさらに高まります。
産業制御と重要インフラストラクチャ
産業環境および重要インフラストラクチャ環境は、サービス中断が生産性だけでなく安全性にも影響を与える可能性があるため、冗長性に大きく依存しています。発電所、製油所、トンネル、地下鉄システム、水処理施設、ユーティリティ回廊、および製造現場では、多くの場合、冗長通信リンク、制御サーバー、ネットワークパス、および電源設計を使用して運用リスクを低減しています。
このような環境では、冗長性はSCADA通信、産業用テレフォニー、PAGAシステム、アラーム放送、ディスパッチコンソール、フィールドインターホン、および中央監視プラットフォームをサポートする場合があります。目標は、機器の障害やインフラストラクチャのストレス中でも可視性と制御を維持することです。これは、オペレーターがプラントの状態を継続的に認識し、フィールド担当者と通信する能力を必要とする場合に特に重要です。
障害のコストが高くなる可能性があるため、これらのセクターの冗長性は通常、通常のオフィス環境よりも意図的に計画され、厳密にテストされます。
データセンター、エンタープライズIT、およびクラウドサービス
エンタープライズITおよびデータセンター環境では、冗長性はアプリケーションの可用性、サービス継続性、およびビジネスの回復力をサポートします。組織は、冗長なコンピュートノード、ネットワークファブリック、ストレージシステム、冷却パス、および電源インフラストラクチャを使用して、デジタルサービスをアクセス可能に保ちます。クラウドサービスが関与している場合でも、アーキテクチャは依然として回復力のある接続、プラットフォーム設計、およびサービス分散に依存しているため、冗長性は重要です。
ユーザーにとって、これはオンラインのままのWebサイト、動作し続ける通信プラットフォーム、または局所的な障害を生き残るリモートコラボレーションサービスとして表示される場合があります。その背後には、多くの場合、ハードウェア、ソフトウェア、および接続レイヤー全体にリスクを分散する、注意深く階層化された冗長モデルがあります。
ビジネス運用がよりデジタル化されるにつれて、冗長性は専門家のトピックではなくなり、信頼できるサービス提供のためのベースライン要件になります。
セキュリティ、安全、および緊急運用
セキュリティシステムおよび緊急システムも、主要な適用分野です。ビデオ監視バックボーン、アクセス制御サーバー、緊急通報プラットフォーム、公共放送システム、ディスパッチソリューション、およびアラーム配信ネットワークは、異常な条件下でも利用可能でなければならないため、冗長性を必要とすることがよくあります。多くの場合、これらはまさにシステムが最も必要とされる瞬間です。
たとえば、緊急通報ポイントネットワークには、冗長な通信ルーティングとバックアップ電源が必要になる場合があります。制御室には、複製されたサーバーと代替の音声パスが必要になる場合があります。公共安全放送システムには、冗長なアンプ、ネットワークスイッチ、またはコア管理ノードが必要になる場合があります。冗長性がなければ、システムはまさにその機能が重要になったときに失敗する可能性があります。
これが、冗長性が安全関連の通信および監視アーキテクチャにおける中核的な設計原則として扱われる理由です。
冗長性は、電話、産業システム、エンタープライズIT、および安全重視の通信環境で広く使用されています。
冗長性の価値は、予期しないことが起こり、システムがそれでも動作し続けるときに最も明確になります。
冗長システムの設計に関する考慮事項
複雑さ、コスト、およびテスト
冗長性は回復力を追加しますが、複雑さも追加します。より多くのデバイス、より多くのリンク、より多くのロジック、およびより多くの同期要件により、設計負荷が増加する可能性があります。実装が不十分な場合、冗長システムは管理が困難になったり、スイッチオーバー中に予測不可能に失敗したりする可能性があります。このため、冗長性は、明確なアーキテクチャ、制御されたスコープ、および現実的な運用手順で計画する必要があります。
コストも別の要因です。冗長コンポーネントは、ハードウェア、ライセンス、統合、およびメンテナンス要件を増加させます。ただし、決定はハードウェアコストのみではなく、リスクとサービスの重要性に基づいて行う必要があります。多くの環境では、ダウンタイムのコストは冗長性を正しく構築するコストよりもはるかに高くなります。
テストは不可欠です。テストされたことがない冗長設計は、誤った自信を生み出す可能性があります。組織は、制御された条件下でフェイルオーバー動作、タイミング、状態保存、アラーム処理、および復旧手順を検証する必要があります。
冗長性を実際のビジネスリスクに合わせる
すべてのコンポーネントに同じレベルの冗長性が必要なわけではありません。効果的な設計は、どのサービスが本当に重要であり、どのレベルの中断が許容されるかを特定することから始まります。制御室の音声サーバーは完全な冗長性を正当化するかもしれませんが、必須ではないレポートツールはそうではないかもしれません。バックボーンスイッチは複製されたアップリンクを必要とするかもしれませんが、影響の少ないローカルプリンターは同じ注意を必要としません。
このリスクベースのアプローチは、組織が最も価値を提供する場所に冗長性を適用するのに役立ちます。また、意味のある運用上の利益なしに複雑さが増す過剰設計を防ぎます。目標は、すべてを盲目的に複製することではありません。目標は、障害が不均衡な結果をもたらすシステムの部分を保護することです。
したがって、適切な冗長性計画は戦略的です。それは技術アーキテクチャを運用上の優先事項に合わせます。
結論
冗長性が重要な理由
冗長性が重要なのは、最新のシステムが単一のパス、単一のノード、または単一の電源に完全に依存するには重要すぎるからです。環境がオフィスの電話システム、産業用通信プラットフォーム、制御ネットワーク、またはクラウドベースのエンタープライズサービスのいずれであっても、単一障害点のリスクは運用を混乱させ、安全性を低下させ、サービス品質を損なう可能性があります。冗長性は、事前に継続性を準備することにより、そのリスクを低減します。
その実用的な価値は、可用性の向上、より強力な耐障害性、より優れたメンテナンスの柔軟性、および異常時のより信頼性の高いサービスにあります。同時に、冗長性は単に余分なハードウェアを追加する問題ではありません。優れたフェイルオーバーロジック、同期、テスト、およびアーキテクチャの規律が必要です。最も効果的な冗長システムは、抽象的な技術的野心ではなく、実際の運用ニーズに基づいて設計されたものです。
組織が常時接続の通信とデジタルインフラストラクチャに依存し続けるにつれて、冗長性は回復力のあるシステム設計の最も重要な構成要素の1つであり続けます。
よくある質問
冗長性はバックアップと同じですか?
いいえ。バックアップは通常、予備のコピーまたは復旧リソースを指しますが、冗長性は通常、障害時にサービスを実行し続けるために複製されたライブリソースがシステムに組み込まれていることを意味します。
冗長性の主な目的は何ですか?
主な目的は、単一障害点を減らし、機器、リンク、ソフトウェア、または電源が故障したときのサービス継続性を向上させることです。
冗長性はどこで一般的に使用されますか?
ネットワーク、SIPおよびIPテレフォニーシステム、産業制御環境、データセンター、セキュリティプラットフォーム、および緊急通信システムで一般的に使用されています。
冗長性はゼロダウンタイムを保証しますか?
常にではありません。冗長性はダウンタイムを大幅に削減できますが、実際の結果はアーキテクチャの品質、フェイルオーバー設計、同期、およびテストによって異なります。