Repair Service(リペア・サービス)の高度な構成のリファレンス

Repair Service(リペア・サービス)で使用可能な高度な構成オプションのリファレンス。opscenterd.confまたはcluster_name.confで構成オプションを設定します。cluster_name.confの設定は、opscenterd.confの設定をオーバーライドします。

cluster_name.conf

cluster_name.confファイルの場所は、インストールのタイプによって異なります。
  • パッケージ・インストール:/etc/opscenter/clusters/cluster_name.conf
  • tarボール・インストール:install_location/conf/clusters/cluster_name.conf

opscenterd.conf

opscenterd.confファイルの場所は、インストールのタイプによって異なります。
  • パッケージ・インストール:/etc/opscenter/opscenterd.conf
  • tarボール・インストール:install_location/conf/opscenterd.conf

現在、以下のオプションを構成でき、すべてのクラスターに適用するには[repair_service]セクションをopscenterd.conf ファイルに追加し、クラスターごとに適用するには cluster_name.confファイルにこのセクションを追加します。cluster_name.confの設定は、opscenterd.confの設定をオーバーライドします。構成を変更したら、opscenterdを再起動します

Repair Service(リペア・サービス)構成に問題がある場合、Best Practice Service(ベスト・プラクティス・サービス)の「Repair Service(リペア・サービス)が正しく構成されていない」ルールが不合格になり、正しく構成されていないオプションに関するガイダンスが表示されます(ルールがオフになっている場合を除く)。

Repair Service(リペア・サービス)のベスト・プラクティス・ルール

プレフィックスにincremental_*が付いている構成オプションは、インクリメンタル・リペアにのみ適用されます。

[repair_service] cluster_stabilization_period
リペアを行う前にRepair Service(リペア・サービス)がクラスターの安定性をチェックする間隔(秒)。このチェックは、このRepair Service(リペア・サービス)がアクティブ化されたとき(ユーザーがアクティブ化するか、OpsCenterの再起動後)に開始され、クラスターが安定するまで繰り返されます。デフォルト:30。
[repair_service] error_logging_window
time_to_completionを超過した後、エラーをログに記録してアラートをトリガーする頻度(秒)。デフォルト:86,400(1日)
[repair_service] incremental_err_alert_threshold
インクリメンタル・リペア時に無視するエラー数のしきい値。この値を超えると、インクリメンタル・リペアの失敗が許容される回数を超えている可能性があるというアラートが表示されます。デフォルト:20。
[repair_service] incremental_sleep
クラスターのすべてのインクリメンタル・リペアが完了した後、一時停止する秒数。デフォルト:3600(1時間)。
[repair_service] incremental_threshold
テーブルのインクリメンタル・リペアを検討するために必要な最小バイト数。デフォルト値の1バイトに設定すると、テーブルに未リペアのデータがある場合、Repair Service(リペア・サービス)はインクリメンタル・リペアを実行します。大きな値を設定する際は十分注意してください。gc_grace_seconds期間内にしきい値を超えて書き込まれるデータが不足すると、削除が失われる可能性があります。デフォルト:1.
[repair_service] max_down_node_retry
レプリカを含むノードがダウンしたときにリペア・タスクをリトライする最大試行回数。デフォルトのリトライ回数は1,080回です。リトライは10秒ごとに行われます。デフォルトの1,080回のリトライは、10,800秒(3時間)後に終了します。これは、デフォルトのCassandraヒンテッド・ハンドオフの有効期限に対応しています。たとえば、ダウンしているノードまたはレプリカのリペア試行時間を6時間に倍増するには、リトライ回数を2,160に設定します。デフォルト:1,080。
[repair_service] max_pending_repairs
ノードで一度に実行できる保留中のリペアの最大数。デフォルト:5。
[repair_service] min_repair_time
リペアが完了するまでの最小時間(秒)。この時間より早くリペアが終了すると、残りの時間はスリープ状態になります。デフォルト:5。
[repair_service] persist_directory
現在のRepair Service(リペア・サービス)ステータスを含むファイルを格納する場所。デフォルトの場所は、パッケージ・インストールの場合は/var/lib/opscenter/repair_service、tarボール・インストールの場合はinstall_location/repair_serviceです。
[repair_service] persist_period
Repair Service(リペア・サービス)が永続ファイルをディスクに書き込む間隔の最小秒数。デフォルト:3600(1時間)。このパラメーターは、サブ範囲リペアとインクリメンタル・リペアにのみ適用され、分散サブ範囲リペアには適用されません。
[repair_service] restart_period
クラスターの安定性を確認してリペアを再開するまで、特定のイベントに応答してこのRepair Service(リペア・サービス)が一時停止している時間(秒)。デフォルト:300(5分)。
[repair_service] single_repair_timeout
リペアが完了するまでの最大時間(秒)。デフォルト:3600(1時間)。
[repair_service] single_task_err_threshold
一時的にタスクをスキップして次のタスクに移行するまでリペア・タスクをリトライする最大回数。スキップされたタスクは、後でリトライするためにリペア・キューの最後に移動されます。リトライの最大回数に到達すると、アラートが発行されます。デフォルト:10。
[repair_service] snapshot_override
デフォルトのスナップショット・リペア動作をオーバーライドするかどうかを指定します。このオプションをTrueに指定すると、検証コンパクションは並列処理ではなく、シーケンシャルに実行されます。デフォルト:False。
[repair_service] time_to_completion_target_percentage
クラスターの過負荷を避けるために、必要に応じて並列処理を遅らせたり減らしたりすることを含め、Repair Service(リペア・サービス)が目標とする完了までの時間の割合(%)。デフォルト:65。このパラメーターは、サブ範囲リペアとインクリメンタル・リペアにのみ適用され、分散サブ範囲リペアには適用されません。