分散サブ範囲の概要

分散サブ範囲のリペア動作とサブ範囲リペアとの違いのサマリー。

opscenterd.conf

opscenterd.confファイルの場所は、インストールのタイプによって異なります。
  • パッケージ・インストール:/etc/opscenter/opscenterd.conf
  • tarボール・インストール:install_location/conf/opscenterd.conf

分散サブ範囲リペアは、大きなクラスター向けに拡張できるよう意図されたOpsCenter Repair Service(OpsCenterリペア・サービス)内のサブ範囲リペアの代わりとなる実装です。

注: 分散サブ範囲リペア機能は、OpsCenterバージョン6.1.7以降と6.5.3以降で利用できます。

サブ範囲リペアでは、クラスター・トークン範囲に関するメタデータを取得して処理する必要があります。このために、リペア操作の開始前に範囲を適切なサブ範囲に分割することが求められます。処理するメタデータの量は、クラスターのサイズに比例します。したがって、大きなクラスターの場合、サイズの大きいメタデータを処理しようとしたときに、OpsCenterデーモン(opscenterd)プロセスがボトルネックになる可能性があります。

分散サブ範囲リペアでは、メタデータ処理とリペア計画の多くはDataStaxエージェントの担当になるため、opscenterdの負荷が軽減され、リペア・サービスが大きなクラスターに対応しやすくなります。このリペア方法では、opscenterdは1つ以上のキースペース全体のリストをリペアするようにOpsCenterエージェントに指示し、エージェントはサブ範囲ごとにキースペースをリペアします。

enable_distributed_subrange_repairTrueに設定することで、分散サブレンジリペアの使用をオプトインする必要があります。設定は、opscenterd.conf 構成ファイルで行います。「分散サブ範囲リペアを有効にする」を参照してください。

重要: enable_distributed_subrange_repairの値を変更したら、OpsCenterを再起動して変更を有効にします。

サブ範囲リペアとの違い

分散サブ範囲リペアは、大きなクラスターのリペアを迅速に行うために、できるだけ高速に実行するように設計されています。分散サブ範囲リペアはパフォーマンスを優先するように最適化されているため、サブ範囲リペアのような調整はできません。たとえば、time_to_completion_target_percentageパラメータは分散サブ範囲リペアには何の影響も及ぼしません。

ただし、分散サブ範囲リペアはmin_repair_timeプロパティを考慮し、ある程度のスロットルを提供します。各DataStaxエージェントは、このプロパティで設定されている時間よりも頻繁に個々のJMXリペア操作が発生しないようにします。

制限事項

分散サブ範囲リペアの分散された、動的な性質により、OpsCenter Repair Service(OpsCenterリペア・サービス)は分散サブ範囲リペア・ジョブの実行が完了するまでの正確な時間を推定できません。この制限は、分散サブ範囲リペアが(サブ範囲リペアのように)ジョブの最初にすべてのトークン・サブ範囲メタデータを処理しないために存在します。各DataStaxエージェントは代わりにそのメタデータの独自のサブセットを必要に応じて動的に処理します。

この処理方法の利点は、レイテンシーが削減され、ジョブの最初にすべてのメタデータを処理することで発生する可能性のあるエラー処理の変更を排除できることです。欠点は、リペア・プロセスに残されているデータと時間を推定できないことです。

OpsCenterでは、分散リペアの進行状況バーが、データ同期化の完了までのおおまかな推定時間を示しますが、サブ範囲リペアで得られるような進行状況の詳細(残りの時間とバイト数)は得られません。

完了したJMXリペア分散呼び出しの数を示している分散サブ範囲リペアのステータス