DSEFSについて

DSEFS(DataStax Enterpriseファイル・システム)はDataStax Enterprise内の新しい分散ファイル・システムで、主にSpark Streamingのユース・ケースとWrite Ahead Logging(WAL)を対象としています。

DSEFS(DataStax Enterpriseファイル・システム)はDataStax Enterprise内の新しい分散ファイル・システムで、主にSpark Streamingのユース・ケースとWrite Ahead Logging(WAL)にフォールト・トレランスを提供することを目的としています。DSEFSはCFS(Cassandraファイル・システム)よりもパフォーマンスに優れています。

CFSは、Analyticsノードでは常にデフォルトで有効になっています。DSEFSを使用するには、すべてのAnalyticsノードでDSEFSを有効にする必要があります。ただし、CFSは廃止予定であり、今後のリリースではDSEFSに置き換えられます。

DSEFSは、格納されているデータをメタデータとファイル・データ・ブロックに分割します。
  • メタデータはCassandraデータベースに格納されます。
  • ファイル・データ・ブロックは各ノードにローカルに格納され、複数のノードにレプリケートされます。

    冗長性係数はDSEFSディレクトリまたはファイル・レベルで設定され、Cassandraデータベースのキースペース・レベルで設定されたレプリケーション係数より粒度が細かくなります。

DSEFSデータは、Cassandraデータベースとは別の物理デバイスに格納する必要があります。

デプロイの概要

  • DSEFSサーバーは、DataStax Enterpriseと同じJVMで実行されます。Cassandraデータベースと同様に、マスター・ノードは存在しません。DSEFSを実行中のすべてのノードは同じです。
  • 単一のDSEFSが複数のデータ・センターにまたがることはできません。複数のデータ・センターでDSEFSをデプロイするには、データ・センターごとに個別のDSEFSのインスタンスを作成します。
  • 単一のデータ・センターで複数のDSEFSファイル・システムを構成するには、異なるキースペースを使用します。
  • 最適なパフォーマンスを得るには、Cassandraデータベースとは異なる物理ドライブにローカルDSEFSデータを配置します。
  • 認証、権限管理、および暗号化はサポートされません。オペレーティング・システムのアクセス制御を使用して、ローカルDSEFSデータ・ディレクトリを保護します。他の制限事項も適用されます。
  • DSEFSは、Spark Streamingのユース・ケースを対象にしているため、長期のデータ・ストレージやデータの排他的なストレージには適していません。
  • DSEFSでは、LOCAL_QUORUM整合性レベルを使用します。