Analyticsキースペースのレプリケーション係数の設定

DSE Analyticsノード上のキースペースのレプリケーション係数を設定するためのガイドラインとステップ。

実稼働環境でDSE Analyticsを使用するのに適切なレプリケーション係数を構成する必要があります。DSE Analyticsのレプリケーション係数の変更が必要なキースペースは以下のとおりです。
  • cfs
  • cfs_archive
  • dse_leases
  • dsefs

デフォルトのレプリケーション係数 

HiveMetaStore、cfs、dsefs、およびcfs_archiveシステムのキースペースのデフォルトのレプリケーション係数は1です。

ただし、複数のデータ・センターの最初のノードのみ、dse_leasesキースペースのレプリケーション係数は1です。新しいデータ・センターの場合、最初のノードは、そのデータ・センターについてdse_leasesキースペースのレプリケーション係数に1が指定されて作成されます。ただし、追加するデータ・センターでは、レプリケーション係数が0で、DSE Analyticsノードを起動する前に構成する必要があります。複数のAnalyticsデータ・センターについて、dse_leasesキースペースのレプリケーション係数を変更する必要があります。
重要: 新しいデータ・センターを追加するたびに、新しいDSE Analyticsデータ・センターについて、dse_leasesキースペースのレプリケーション係数を手動で増やす必要があります。クラスター上でDataStax EnterpriseまたはSparkのセキュリティ・オプションが有効な場合、すべての論理データ・センター上でdse_securityキースペースのレプリケーション係数も増やす必要があります。
  • 単一ノードの開発およびテストの場合にのみレプリケーション係数は1が適していますが、実稼働環境には適していません。
  • 実稼働クラスターの場合、分析を実行している論理データ・センターごとに3以上の値までレプリケーション係数を増やしてください。

クラスター内のノード数によってレプリケーション係数が決まります。

手順

これらのキースペースのレプリケーション係数を変更するには、以下のようにします。

  1. キースペースを調べます。
    例:
    DESCRIBE KEYSPACE cfs
  2. レプリケーション係数を3以上に変更します。
    ALTER KEYSPACE cfs
    WITH REPLICATION = { 'class' :'NetworkTopologyStrategy', 'Analyticsdc1' : 3};
    ALTER KEYSPACE cfs_archive
    WITH REPLICATION = { 'class' :'NetworkTopologyStrategy', 'Analyticsdc1' : 3};
  3. Spark Masterノードのリーダー選択を適切に処理するには、dse_leasesキースペースを更新して、レプリケーション係数を、たとえば3に変更します。
    ALTER KEYSPACE dse_leases
    WITH REPLICATION = { 'class' :'NetworkTopologyStrategy', 'Analyticsdc1' : 3};
    重要: 新しいデータ・センターを追加するたびに、新しいDSE Analyticsデータ・センターについて、dse_leasesキースペースのレプリケーション係数を手動で増やす必要があります。クラスター上でDataStax EnterpriseまたはSparkのセキュリティ・オプションが有効な場合、すべての論理データ・センター上でdse_securityキースペースのレプリケーション係数も増やす必要があります。
  4. DSEFSを使用する場合は、dsefsキースペースを更新して、レプリケーション係数を、たとえば3に変更します。
    ALTER KEYSPACE dsefs
    WITH REPLICATION = { 'class' :'NetworkTopologyStrategy', 'Analyticsdc1' : 3};
  5. nodetool repairを実行して、欠落データ問題またはデータ使用不可能例外が発生するのを回避します。