ワークロードの種類ごとに複数のデータ・センターがある場合の初期化

ノードの種類ごとに複数のデータ・センターがある混在ワークロード・クラスター内で、ノードを構成するための手順。

ほとんどの状況では、検索、分析、トランザクションなどの各ワークロードの種類は、別々の仮想データ・センター内に編成される必要があります。ワークロードの分離により、リソースの競合を回避できます。ただし、トランザクション(OLTP)ワークロードと分析(OLAP)ワークロードを組み合わせるとパフォーマンスが低下しますが、分析用の大きな需要がない場合は、ワークロードをSearchAnalyticsノードに組み合わせることができます。クエリー対象のノードだけでDSE Graphを有効にできます。

CQLを使用してキースペースを作成すると、1つのノードのクラスターであっても、Cassandraではクラスターの仮想データ・センターが自動的に作成されます。同じ種類のワークロードを実行するノードを同じデータ・センターに割り当てます。異なる種類のノードを対象とした別々の仮想データ・センターは、その他の種類のワークロードを実行するノードからDSE Searchを実行するワークロードを分離します。

このシナリオでは、混在ワークロード・クラスター内にノードの種類ごとに複数のデータ・センターがあります。たとえば、クラスターに4つのanalyticsノード、4つのCassandraノード、2つのDSE Searchノードがある場合、このクラスターには、analyticsノード用の2つのデータ・センター、Cassandraノード用の2つのデータ・センター、およびDSE Searchノード用の1つのデータ・センターの合計5つのデータ・センターがある可能性があります。単一データ・センター・クラスターの場合、データ・センターはノードの種類ごとに1つだけです。

複数のデータ・センターのデプロイには、以下の用途があります。
  • データ・センター間のネットワーク接続や停電など、障害が発生した外部インフラストラクチャーからのレプリカの切り離し
  • 地理的に分散した複数のノード間の分散データのレプリケーション
  • 物理的データ・センターの異なる物理的ラック間
  • 一般のクラウド・プロバイダーとオンプレミス管理型データ・センター間
  • 生データに対して分析ジョブを実行する開発クラスターによってリアルタイムの分析クラスターの速度が低下するのを防ぎます。
  • 特に1よりも大きい整合性レベルを使用しているときに、特定のデータ・センターからの読み取りが要求に対してローカルであるようにするには、物理的なデータ・センターで仮想データ・センターを使用します。このストラテジにより、ニューヨークのノードやロサンゼルスのノードからの読み取りを回避するため、レイテンシーを低く抑えることができます。

始める前に

手順

この構成では、2つのデータ・センターにまたがる6つのノードで構成されるクラスターをインストールする方法を説明しています。デフォルトの整合性レベルはQUORUMです。

  1. これらのノードにDataStax Enterpriseをインストールするとします。
    • node0 10.168.66.41 (seed1)
    • node1 10.176.43.66
    • node2 10.168.247.41
    • node3 10.176.170.59 (seed2)
    • node4 10.169.61.170
    • node5 10.169.30.138
  2. ノードがファイアウォールの背後にある場合は、内外で通信するために、必要なポートを開きます
  3. DataStax Enterpriseが実行されている場合は、ノードを停止してデータを消去します。
    • Installer-Servicesおよびパッケージのインストール:
      $ sudo service dse stop
      $ sudo rm -rf /var/lib/cassandra/*  # Clears the data from the  default directories
    • Installer-No Servicesおよびtarボールのインストール:

      インストール・ディレクトリーから以下を実行します。

      $ sudo bin/dse cassandra-stop
      $ sudo rm -rf /var/lib/cassandra/*  # Clears the data from the  default directories 
  4. 各ノードについてcassandra.yamlファイル内のプロパティを設定します。

    ディスクのレイアウト、共有ライブラリなどに関してクラスター内の各ノードが同じ場合は、すべてのノードでcassandra.yamlファイルの同じコピーを使用できます。

    cassandra.yamlファイルの場所は、インストールのタイプによって異なります。
    パッケージ・インストール /etc/dse/cassandra/cassandra.yaml
    tarボール・インストール install_location/resources/cassandra/conf/cassandra.yaml

    設定するプロパティ:

    注: yaml_diffツールを使用して、cassandra.yaml構成ファイルとdse.yaml構成ファイルを確認し、適宜変更を行います。
    • num_tokens:「vnodeの推奨事項」を参照してください。
    • -seeds:各シード・ノードのinternal_IP_address
    • listen_address:

      設定されていないと、Cassandraは、そのホスト名に関連付けられているローカル・アドレスについてシステムに尋ねます。正しいアドレスが生成されていない場合は、listen_addressを指定する必要があります。

    • endpoint_snitch: スニッチ

      endpoint_snitch」および「スニッチについて」を参照してください。スニッチを変更する場合は、「Switching snitches」を参照してください。

    • auto_bootstrapfalse

      データなしで新しいクラスターを初期化する場合にのみ、ブートストラップ設定を追加します。

    • 以前のバージョンのcassandra.yamlファイルまたはdse.yamlファイルを使用している場合は、『アップグレード・ガイド』で、削除された設定を必ず確認してください。

    各データ・センターから1つ以上のシード・ノードを含める必要があります。DataStaxは、データ・センターごとに複数のシード・ノードを持つことを推奨します。すべてのノードをシード・ノードにしないでください。

    cluster_name:'MyDemoCluster'
    num_tokens: 256
    seed_provider:
    - class_name:org.apache.cassandra.locator.SimpleSeedProvider
    parameters:
    -seeds:"10.168.66.41,10.176.170.59"
    listen_address:
    endpoint_snitch:GossipingPropertyFileSnitch
  5. dse.yamlファイルのプロパティをユース・ケースに応じて設定します。
  6. cassandra-rackdc.properties (GossipingPropertyFileSnitch)またはcassandra-topology.properties(PropertyFileSnitch)ファイルで、命名規則を使用してデータ・センターとラックの名前を各ノードのIPアドレスに割り当て、不明なノードにはデフォルトのデータ・センター名とラック名を割り当てます。
    注: このファイルが存在する場合、GossipingPropertyFileSnitchは常にcassandra-topology.propertiesを読み込みます。新しいクラスター、またはPropertyFileSnitchから移行したクラスターの各ノードからファイルを削除します。
    cassandra-topology.propertiesファイルのデフォルトの場所は、インストールのタイプによって異なります。
    Installer-Servicesおよびパッケージ・インストール /etc/dse/cassandra/cassandra-topology.properties
    Installer-No Servicesおよびtarボール・インストール install_location/resources/cassandra/conf/cassandra-topology.properties
    cassandra-rackdc.propertiesファイルのデフォルトの場所は、インストールのタイプによって異なります。
    Installer-Servicesおよびパッケージ・インストール /etc/dse/cassandra/cassandra-rackdc.properties
    Installer-No Servicesおよびtarボール・インストール install_location/resources/cassandra/conf/cassandra-rackdc.properties

    例:

    # Cassandra Node IP=Datacenter:Rack
    10.168.66.41=DC1:RAC1
    10.176.43.66=DC2:RAC1
    10.168.247.41=DC1:RAC1
    10.176.170.59=DC2:RAC1
    10.169.61.170=DC1:RAC1
    10.169.30.138=DC2:RAC1
    
    # default for unknown nodes
    default=DC1:RAC1
  7. すべてのノードにDataStax Enterpriseをインストールして構成したら、シード・ノードを1つずつ起動した後で、残りのノードを起動します。
  8. 自分のクラスターが起動して稼働していることを確認します。
    • Installer-Servicesおよびパッケージのインストール: $ nodetool status
    • Installer-No Servicesおよびtarボールのインストール: $ install_location/bin/nodetool status

タスクの結果

Datacenter:DC1
=======================
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
--  Address      Load       Tokens  Owns   Host ID                               Rack
UN 10.168.66.41     45.96 KB    256       27.4%   c885aac7-f2c0-...RAC1
UN 10.168.247.41    66.34 KB    256       36.6%   fa31416c-db22-...RAC1
UN 10.169.61.170    55.72 KB    256       33.0%   f488367f-c14f-...RAC1
Datacenter:DC2
=======================
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
--  Address      Load       Tokens  Owns   Host ID                               Rack
UN 10.176.43.66     45.96 KB    256       27.4%   f9fa31c7-f3c0-...RAC1
UN 10.176.170.59    66.34 KB    256       36.6%   a5bb526c-db51-...RAC1
UN 10.169.30.138    55.72 KB    256       33.0%   b836478f-c49f-...RAC1

次のタスク