非常に大きなクラスター用の構成

OpsCenterは、数百のノードを含むクラスターを管理できます。最大で1000個のノードを含む非常に大きなクラスターを管理する場合は、クラスター構成設定を調整することで、パフォーマンスが向上します。

cluster_name.conf

cluster_name.confファイルの場所は、インストールのタイプによって異なります。

  • パッケージ・インストール:/etc/opscenter/clusters/cluster_name.conf
  • tarボール・インストール:install_location/conf/clusters/cluster_name.conf

opscenterd.conf

opscenterd.confファイルの場所は、インストールのタイプによって異なります。

  • パッケージ・インストール:/etc/opscenter/opscenterd.conf
  • tarボール・インストール:install_location/conf/opscenterd.conf
OpsCenterは、最大で1000個のノードを含む非常に大きなクラスターを管理できます。
注: Lifecycle ManagerのUIでは、クラスターごとに最大で300個のノードをプロビジョニングして管理できます。詳細については、「DataStax Enterpriseクラスターを作成する場合、Lifecycle Managerではいくつのノードをサポートできますか?」を参照してください。

非常に大きなクラスターで作業する場合、デフォルト設定では、OpsCenterのパフォーマンスが低下します。パフォーマンスを向上させるには、クラスターのノードとトークン・リストのポーリング間隔が長くなるようにクラスター設定を調整します。

非常に大きなクラスターをOpsCenterに追加したら、次のデフォルト設定を変更します。

手順

  1. 編集するcluster_name.confを開きます。
    1. [collection]の下のnodelist_poll_periodオプションを1800に設定してノード・リストのポーリング間隔を30分に増やします。
      [collection] nodelist_poll_period
      OpsCenterがクラスター内のノードのポーリングを待機する間隔(秒)。デフォルト値は30です。
      [collection]
      nodelist_poll_period = 1800
    2. エージェントが過負荷になっている場合は、必要に応じてデフォルトのhttp_timeoutを大きくします。
      [agents] http_timeout
      エージェントへのHTTP呼び出しのタイムアウト(秒)。デフォルト値は10です。
      [agents]
      http_timeout = 20
  2. 編集するopscenterd.confを開き、以下の設定を調整します。
    [agents] not_seen_threshold
    stompなど、特定の接続に関するエージェント・ステータスが前回送信されてからの最大時間(秒)。この時間が経過すると、エージェント接続がダウンしていると見なされます。このしきい値は、ノードの健全性を不明とマークするまでOpsCenterが待機する時間にも影響します。デフォルト値:180秒。
    [agents] http_poll_period
    エージェントのHTTP健全性のポーリングの試行間隔(秒)。デフォルト値:60秒。
    [ui] default_api_timeout
    OpsCenter UIからOpsCenter APIへのAPI呼び出しのデフォルトのタイムアウト値(秒)。デフォルト値は10です。一部のAPI呼び出しではタイムアウトまでの時間を10秒より長くする必要があります。そのような場合、API呼び出しのタイムアウトはdefault_api_timeoutを基準にして延長されます(たとえば、6 * default_api_timeout)。default_api_timeoutを変更すると、これらのタイムアウトはそれに応じて変化します。
    [agents]
    not_seen_threshold = 620
    http_poll_period = 500
    
    [ui]
    default_api_timeout = 60
  3. OpsCenterを再起動します