DSE Searchの容量計画

探索プロセスを使用してDSE Searchの容量計画を作成し、メモリー・リソースが十分にあることを確認します。

DSE Searchを使用すると、メモリーの使用量が多くなり、インデックスの更新時に行全体を再度読み取ると、回転式ディスクにかなりのパフォーマンス・ヒットを招くことがあります。大がかりな挿入/更新要件を持つアプリケーションには、ソリッド・ステート・ドライブ(SSD)を使用してください。

この容量計画探索プロセスは、操作要件を満たすために十分なメモリー・リソースを持つ計画を立案するのに役立ちます。

概要

最初に、1つのノードにある多数のドキュメントのインデックスを作成し、通常のユーザー・クエリーを実行した後、ヒープ割り当てのためのフィールド・キャッシュ・メモリー使用量を調べることによって、Searchインデックスがどのくらい大きくなるかを見積もります。インデックスのサイズが、1つのノードで処理できるドキュメントの最大数に対応できるサイズに達したという確信を得るまでドキュメントの数を増やして、このプロセスを繰り返します。これによって、1つのクラスターのためにデプロイするサーバーの台数と最適なヒープ・サイズを決定できます。インデックスはSSDか、システムのIOキャッシュに格納します。

容量計画で運用担当者は以下の作業に労力を割くことになります。
  • ノードあたりの最適なヒープ・サイズを設定します。
  • アプリケーションに必要なノード数を推定します。
  • 1秒あたりの対応クエリー数を増やすために、レプリケーション係数を大きくします。
  • クエリーが実行されたデータ・センター(DC)内のノード数がそのDCのレプリケーション係数(RF)の倍数に等しい場合にDSE Searchの分散クエリーは最も効果的です。
注: プリフライト・チェック・ツールを使用すると、多くの無効な構成設定や最適状態に及ばない構成設定を検知して修正できます。

始める前に

以下を備えたノード:
  • 容量計画時に決められるRAMの量
  • DataStaxでは、以下を推奨します。
    • データ/ログ・ディスク1枚。(回転式ディスクを使用している場合は、コミット・ログ用に別のディスク。「ディスク領域」を参照してください。)
    • DSE Search用のディスク1枚。
入力データ:
  • 1つのテスト・ノード上でインデックスが作成されるN個のドキュメント
  • 実行されるサンプル・クエリーの完全なセット
  • システムがサポートするドキュメントの最大数

手順

  1. schema.xmlおよびsolrconfig.xmlファイルを作成します。
  2. ノードを起動します。
  3. N個のドキュメントを追加します。
  4. プロダクション環境をシミュレートする一連のクエリーを実行します。
  5. Solrコアに関するステータス情報に含まれる、ディスク上のインデックスのサイズを表示します。
  6. サーバーで使用可能なシステムIOキャッシュのサイズに基づいて、サーバーごとの最大インデックス・サイズを設定します。
  7. 使用可能なシステム・メモリーに基づいて、サーバーごとに必要な最大ヒープ・サイズを設定します。
    DataStaxでは、以下のヒープ・サイズを推奨しています。
    • 64 GB以下のシステム・メモリー:24 GB
    • 64 GB以上のシステム・メモリー:30 GB
    ライブ・インデックス作成を高速化するには、ライブ・インデックス作成(RT)送信がオフヒープに割り当てられるように構成します。
    注: クラスターごとに1つの検索コアでのみライブ・インデックス作成を有効にしてください。
  8. 6および7に基づいて、ノードごとのドキュメントの最大数を計算します。

    システムがノードごとの最大ドキュメント数に近づいたら、さらにノードを追加します。