DSEFSについて
DSEFS(DataStax Enterpriseファイル・システム)はDataStax Enterprise内の新しい分散ファイル・システムで、主にSpark Streamingのユース・ケースとWrite Ahead Logging(WAL)を対象としています。
DSEFS(DataStax Enterpriseファイル・システム)はDataStax Enterprise内の新しい分散ファイル・システムで、主にSpark Streamingのユース・ケースとWrite Ahead Logging(WAL)にフォールト・トレランスを提供することを目的としています。DSEFSはCFS(Cassandraファイル・システム)よりもパフォーマンスに優れています。
CFSは、Analyticsノードでは常にデフォルトで有効になっています。DSEFSを使用するには、すべてのAnalyticsノードでDSEFSを有効にする必要があります。ただし、CFSは廃止予定であり、今後のリリースではDSEFSに置き換えられます。
DSEFSは、格納されているデータをメタデータとファイル・データ・ブロックに分割します。
- メタデータはCassandraデータベースに格納されます。
- ファイル・データ・ブロックは各ノードにローカルに格納され、複数のノードにレプリケートされます。
冗長性係数はDSEFSディレクトリまたはファイル・レベルで設定され、Cassandraデータベースのキースペース・レベルで設定されたレプリケーション係数より粒度が細かくなります。
デプロイの概要
- DSEFSサーバーは、DataStax Enterpriseと同じJVMで実行されます。Cassandraデータベースと同様に、マスター・ノードは存在しません。DSEFSを実行中のすべてのノードは同じです。
- 単一のDSEFSが複数のデータ・センターにまたがることはできません。複数のデータ・センターでDSEFSをデプロイするには、データ・センターごとに個別のDSEFSのインスタンスを作成します。
- 単一のデータ・センターで複数のDSEFSファイル・システムを構成するには、異なるキースペースを使用します。
- 最適なパフォーマンスを得るには、Cassandraデータベースとは異なる物理ドライブにローカルDSEFSデータを配置します。
- 認証、権限管理、および暗号化はサポートされません。オペレーティング・システムのアクセス制御を使用して、ローカルDSEFSデータ・ディレクトリを保護します。他の制限事項も適用されます。
- DSEFSは、Spark Streamingのユース・ケースを対象にしているため、長期のデータ・ストレージやデータの排他的なストレージには適していません。
- DSEFSでは、LOCAL_QUORUM整合性レベルを使用します。