自動フェイルオーバーの概要
DataStax OpsCenterのプライマリ・インスタンスからバックアップ・インスタンスへの自動フェイルオーバーを使用すると、手動介入やダウンタイムに煩わされることなく高い可用性が実現します。
自動フェイルオーバーを使用すると、DataStax Enterpriseクラスターで重要なデータを管理する際に、手動介入やダウンタイムに煩わされることなく、OpsCenterの高い可用性を維持できます。
フェイルオーバーの動作
OpsCenterのプライマリ・インスタンスとバックアップ・インスタンスは、stompチャネルでハートビート・メッセージの送信とリッスンを行って、相互にステータスを伝えます。OpsCenterプライマリ・インスタンスは、OpsCenterバックアップ・インスタンスが構成されているかどうかにかかわらず、ハードビート・メッセージを送信します。OpsCenterプライマリ・インスタンスは、ハートビート応答のstompチャネルのメッセージをリッスンして、バックアップが構成されているかどうかを判断します。OpsCenterバックアップ・インスタンスで作成したprimary_opscenter_location
構成ファイルには、OpsCenterバックアップ・インスタンスが監視するOpsCenterプライマリ・インスタンスのIPアドレスが含まれています。構成されたOpsCenterバックアップ・インスタンスはOpsCenterプライマリ・インスタンスのハートビート・メッセージをリッスンして、OpsCenterプライマリ・インスタンスが稼働しているかどうかを判断します。OpsCenterバックアップ・インスタンスによって、構成された時間枠(デフォルトでは60秒)の間にOpsCenterプライマリ・インスタンスのハートビートが検出されなかった場合、OpsCenterバックアップ・インスタンスはフェイルオーバー・プロセスを開始し、OpsCenterプライマリ・インスタンスの役割を自動的に引き継ぎます。OpsCenterバックアップ・インスタンスは、障害が発生したプライマリ・インスタンスの代わりにバックアップ・インスタンスに接続できるようにaddress.yamlで自動的にstomp_interface
を変更して、エージェントを自動的に再構成します。
フェイルオーバーからの復元
フェイルオーバーが発生したあと、プライマリを引き継いだ元のOpsCenterバックアップ・インスタンスはOpsCenterプライマリ・インスタンスになったまま維持されます。この時点でprimary_opscenter_locationファイルを作り直して、別のOpsCenterバックアップ・インスタンスを構成します。このファイルでは、新しいバックアップ・インスタンスが監視対象のプライマリ・インスタンスのIPアドレスを指すように指定します。元のOpsCenterプライマリ・インスタンスを新しいバックアップ・インスタンスとして構成する場合は、サーバーを再起動する前に、このサーバーが正常であることを再度確認します。
failover_id
ファイルに格納されます。ネットワーク分割が発生すると、failover_id
により、エージェントに対して各OpsCenterが一意に識別され、両方のOpsCenterマシンがフェイルオーバー後に動作してデータが破損するのを防ぎます。failover_id
ファイルの場所は、インストールのタイプによって異なり、構成可能です。フェイルオーバーの影響
- アラート - 通常どおりにトリガーされます。例外として、フェイルオーバーの時間枠内にアラートが発行または解除された場合、アラートはトリガーされません。
- 認証 - 既存のユーザー・セッションからログアウトします。ユーザー・セッションは維持されません。再度ログインする必要があります。
- バックアップ - フェイルオーバーの時間内に失敗したスケジュール・バックアップをスキップします。バックアップは次にスケジュールされている日時まで行われません。
- 復元 - 復元中にフェイルオーバーが発生しても、復元操作は続行されます。ただし復元が発生したことをOpsCenterバックアップ・インスタンスは認識していないため、復元の結果を伝えることはできません。
- Repair Service(リペア・サービス) - 前回保存された状態から再開します。忘れずにRepair Service(リペア・サービス)のディレクトリーのミラーリングを行ってください。OpsCenterインスタンスの障害が現在任意のノードで実行されているリペアに影響を及ぼすことはありません。自動フェイルオーバーが正常に完了するか、障害が発生したOpsCenterインスタンスが再度稼働するまで、新たなリペアは継続されません。
- プロビジョニング - プライマリのLifecycle Managerがプライマリで完了できなかった場合、またはその可能性がある場合、進行中だったジョブをプロビジョニングします。Lifecycle ManagerがOpsCenterバックアップ・インスタンスで自動的にジョブを再開することはありませんが、手動で再度ジョブを実行することで、ジョブを完了まで進めることができます。
OpsCenterアップグレード時のフェイルオーバー
フェイルオーバーが構成されている場合、OpsCenterのアップグレード時に従うべき推奨プロセスがあります。詳細については、「フェイルオーバーが有効になっている場合のOpsCenterのアップグレード」を参照してください。
address.yaml
address.yamlファイルの場所は、インストールのタイプによって異なります。
- パッケージ・インストール:/var/lib/datastax-agent/conf/address.yaml
- tarボール・インストール:install_location/conf/address.yaml