圧縮

圧縮は、とりわけワークロードの読み取りが多い場合、ディスク上のデータとディスクI/Oを削減することで、DataStax Enterpriseノードのストレージ容量を最大にします。

圧縮は、とりわけワークロードの読み取りが多い場合、ディスク上のデータとディスクI/Oを削減することで、DataStax Enterprise(DSE)ノードのストレージ容量を最大にします。データベースは、SSTableインデックスの行の場所をすばやく検索し、対応する行を展開します。DSEでは、自動的にディスク・ボリュームを大幅に減少させるストレージ・エンジンを使用します。「ストレージ・エンジン内に一部の構造を置く」を参照してください。

従来のデータベースとは違い、DataStax Enterpriseでは、書き込みパフォーマンスは圧縮によって悪い影響を受けません。従来のリレーショナル・データベースでは、書き込みは、ディスク上の既存のデータ・ファイルへの上書きが必要です。データベースが、ディスク上の対応するページを見つけて展開し、対応するデータで上書きし、最後に再圧縮する必要があります。リレーショナル・データベースでは、圧縮は、CPUサイクルとディスクI/Oの点で負荷の大きい操作です。SSTableデータ・ファイルは不変な(ディスクにいったんフラッシュされると二度と書き込まれない)ため、書き込みを処理するために再圧縮のサイクルが必要ありません。SSTableは、ディスクに書き込まれるときに一度だけ圧縮されます。圧縮されたテーブルへの書き込みにより、最大10パーセントのパフォーマンス向上が見込めます。

また、DSEでは、コミット・ログも圧縮できるため、書き込みパフォーマンスを6~12%向上させることができます。「Cassandra 2.2におけるコミット・ログの更新」ブログを参照してください。