ある程度の時間が経過すると、ノードがフリーズしたように見える

一部のJVMは、Linuxオペレーティング・システムによってスワップアウトされます。

DataStaxヘルプ・センターでは、トラブルシューティング情報も提供しています。

一部のJVMは、Linuxオペレーティング・システム(OS)によってスワップアウトされます。

Linux

GCInspectorからのメッセージについては、system.logをチェックしてください。GCInspectorParNewコレクターまたはConcurrentMarkSweepコレクターの時間が15秒以上かかっていることを示している場合は、JVMの一部がOSによってスワップアウトされている可能性が高いです。

DataStaxでは、スワップを完全に無効にすることを強く推奨します(sudo swapoff --all)。データベースには、複数のレプリカと透過的なフェイルオーバー機能が備わっているため、メモリー不足になったときはレプリカをスワップするよりもすぐに強制終了した方が望ましいとされています。こうすると、スワップのためにレイテンシーが高くなっているレプリカを引き続き使用するのではなく、機能しているレプリカにすぐにトラフィックをリダイレクトすることができます。システムのDRAMが多くても、OSはディスクのキャッシングに使用可能なDRAMを増やすために実行可能コードをスワップアウトするため、やはりスワップによってパフォーマンスが大幅に低下します。
sudo swapoff --all
この変更を永続化するために、すべてのスワップ・ファイル・エントリーを/etc/fstabから削除します。
注: それでもスワップを使用する場合は、vm.swappiness=1に設定してください。こうすると、カーネルは、最も使われていない部分をスワップアウトします。

GCInspectorから非常に長いGC時間は報告されないが、比較的短い時間が頻繁に報告される場合(ConcurrentMarkSweepが非常に頻繁に数秒間かかっている)、JVMで非常に高いGCプレッシャーが生じており、最終的にOOMになる可能性が高くなります。「OOMエラーが発生してノードが停止する」を参照してください。