Repair Service(リペア・サービス)のエラーのトラブルシューティング

Repair Service(リペア・サービス)の実行時に発生するエラー。Repair Service(リペア・サービス)の構成オプションを調整してエラーを解決します。

cluster_name.conf

cluster_name.confファイルの場所は、インストールのタイプによって異なります。
  • パッケージ・インストール:/etc/opscenter/clusters/cluster_name.conf
  • tarボール・インストール:install_location/conf/clusters/cluster_name.conf

opscenterd.conf

opscenterd.confファイルの場所は、インストールのタイプによって異なります。
  • パッケージ・インストール:/etc/opscenter/opscenterd.conf
  • tarボール・インストール:install_location/conf/opscenterd.conf

エラーを解決するには、opscenterd.conf またはcluster_name.conf の[repair_service]セクションの構成オプションを環境に合わせて調整します。Repair Service(リペア・サービス)の実行時に発生するエラーには以下が考えられます。

単一のリペア・タスクのエラー
単一のリペア・タスクが失敗した場合、リペアは一時的にスキップされてリペア・キューの最後に追加され、後でリトライされます。単一のリペアが10回(デフォルト)失敗すると、Repair Service(リペア・サービス)はアラートを発行します。この設定は、single_task_err_thresholdオプションを使用して調整します。
タイムアウト
Repair Service(リペア・サービス)は、デフォルトでは1時間後に単一リペア・タスクをタイムアウトにします。これは、そのリペア・タスクのエラーにカウントされ、リペア・キューの最後に登録されて、後でリトライされます。この設定は、single_repair_timeoutオプションを使用して調整します。
並列処理されるリペアが多すぎる
並列処理で実行するリペアが多すぎる場合のRepair Service(リペア・サービス)のエラー。デフォルトでは、時間内に完了するには単一のレプリカ・セット内の複数のリペアを実行する必要があると予測した場合にこのエラーが発生します。Time to completionパラメータを大きくしてください。問題が解決しない場合は、max_parallel_repairsオプションを調整してください。「パラレル・サブ範囲リペアの最大値の設定」を参照してください。
注意: DataStaxでは、time_to_completion_percentageスロットルを使用していない場合にのみ、max_parallel_repairsを手動で調整し、min_repair_timeとその他の高度なオプションやエキスパート・オプションの変更を行うことを推奨しています。「サブ範囲リペアのスロットルの調整または無効化」を参照してください。
保留中のリペア数が最大リペア数を超過した範囲をスキップする
Repair Service(リペア・サービス)は、保留中のリペア数がデフォルトで5に設定されている最大保留リペア数を超過した範囲のリペアをスキップします。Repair Service(リペア・サービス)はスキップされたリペア・タスクをただちにリペア・キューの最後に移動し、アラートを発行します。ユーザーの判断で、パフォーマンスが低下しているノードを再起動することもできます。この設定は、max_pending_repairsオプションを使用して調整します。
インクリメンタル・エラー・アラートのしきい値の超過
デフォルトでは、インクリメンタル・リペア試行が20回に達すると、インクリメンタル・リペアに問題が発生している可能性を示すアラートが送信されます。この設定は、incremental_err_alert_thresholdオプションを使用して調整します。