オペレーティング・システム・パフォーマンス・メトリクス

Cassandraノードのオペレーティング・システム・メトリクスを追跡してディスクI/O、ネットワーク、メモリー、およびCPU使用率の傾向を監視することは、ハードウェア関連のパフォーマンス問題の特定とトラブルシューティングに役立ちます。

他のデータベース・システムと同様に、Cassandraのパフォーマンスは、実行されている基本システムに大きく依存します。Cassandraノードを監視して、ディスクとCPUの使用率が増加しているかどうかを確認することで、パフォーマンスが許容できないレベルまで低下する前に、問題を特定し解決することができます。OpsCenterのグラフにより、OSメトリクスの変化を一目で確認でき、特定のデータ・ポイントをドリル・ダウンできます。特に、書き込み負荷が高いシステムでは、ディスク領域の監視も重要です。これは、拡張とバランス調整の操作を処理するのに十分な容量があるときに、高度な拡張計画を実施できるためです。

システム・メトリクスの先頭にはOSが付きます。

OS: Memory

メモリー使用量メトリクスをメガバイト単位で示します。
  • Linux - 現在使用されている、キャッシュされている、バッファーされている、または解放されているシステム・メモリーの総量を示します。
  • Windows - 使用可能な物理メモリー、キャッシュされているオペレーティング・システム・コード、割り当てられているページ・プールの現在のメモリー、非ページ・プール・メモリーを示します。
  • Mac OS X - 解放されているシステム・メモリーと使用中のシステム・メモリーを示します。

OS: CPU

CPU使用率メトリクスの割合の平均値を示します。これは、CPUがアイドル状態であった時間の割合を100パーセントから減算した値です。CPUメトリクスは、CPUパフォーマンスが低下した原因の特定に役立ちます。
  • Linux - CPUがシステム・プロセスとユーザー・プロセス、仮想オペレーティング・システムに流用されたタスク、I/O完了待ち、およびナイス・タスクの処理に費やした時間を示します。ナイスの割合が高いと、他のプロセスによりCassandraプロセスが押し出されている可能性があり、I/O待機の割合が高いと、I/Oの競合がある可能性があります。Amazon EC2のように完全に仮想化された環境で、Cassandraクラスターに負荷がかかると、他の仮想プロセッサーが使用可能なシステム・リソースを使用しているときに高いスチール値を示すことがあります。
  • WindowsおよびMac OS X - CPUがユーザー・プロセスとシステム・プロセスに費やした時間を示します。

OS: Load

コンピューター・システムが実行する作業量。アイドル状態のコンピューターの負荷数は0で、各プロセスがCPU時間を消費している、または処理待ちの状態にあると負荷数が1ずつ増加します。1を超える値は、マシンが一時的に過負荷になり、一部のプロセスが待機する必要があったことを示しています。最小、平均、および最大のOS負荷を整数で示します。

OS: Disk usage (GB)

使用可能なディスク領域の量の増加または減少を追跡します。このメトリクスが、ディスク領域の使用量の増加傾向を示している場合や、ディスク領域全体が使用されていることを示している場合は、クラスターに割り当てられている容量を増やすなど、軽減するための解決策を検討してください。DataStaxは、最適なリペア操作とコンパクション操作を行えるように、30~50%の空きディスク領域を確保しておくことを推奨します。

OS: Disk Usage (percentage)

指定された時間にCassandraが使用しているディスク領域の割合。Cassandraがディスクに対して大量の読み取りまたは書き込みを行ったり、コンパクション・プロセスの最終生成物としてSSTableを作成したりするときに、ディスク使用量が一時的に予想よりも高くなることがあります。

OS: Disk Throughput

読み取りおよび書き込み操作のディスク・スループット平均値(メガバイト/秒)。ディスク・スループット値が異常に高い場合は、I/O競合があることを示している可能性があります。これは通常、多数のコンパクション・プロセスが読み取り操作と競合することで発生します。memtableフラッシュの頻度を減らすと、I/O競合を軽減できます。

OS: Disk Rates

  • LinuxおよびWindows - 読み取りおよび書き込み操作のディスク速度の平均値。
  • Mac OS X - サポートされていません。

OS: Disk Latency

  • LinuxおよびWindows - ディスク・シークで消費される平均時間(ミリ秒)。ディスク・レイテンシーは、概要を示すメトリクスの1つであり、このグラフをOpsCenterパフォーマンス・コンソールに送信しておくと継続的な監視に役立ちます。ディスク・レイテンシーが一貫して高い場合は、コンパクションによるI/O競合や、容量の拡張を必要とする読み取り/書き込み負荷など、原因を調査する必要があることを示している可能性があります。
  • Mac OS X - サポートされていません。

OS: Disk Request Size

  • LinuxおよびWindows - ディスクに発行された要求の平均サイズ(セクター)。
  • Mac OS X - サポートされていません。

OS: Disk Queue Size

  • LinuxおよびWindows - ディスク・レイテンシーの問題のためにキューに登録された要求数の平均。
  • Mac OS X - サポートされていません。

OS: Disk Utilization

  • LinuxおよびWindows - ディスクI/Oによって消費されたCPU時間の割合。
  • Mac OS X - サポートされていません。