DSE Graph Loaderの概要

DSE Graph Loaderは、グラフ・データセットをさまざまな入力ソースからDSE Graphデータベースに読み込むためのカスタマイズ可能で高度に調整できるコマンドライン・ユーティリティです。

DSE Graph Loaderは、グラフ・データセットをさまざまな入力ソースからDSE Graphデータベースに読み込むためのカスタマイズ可能で高度に調整できるコマンドライン・ユーティリティです。DSE Graph Loaderは、DataStax Enterpriseのインストール時にインストールされないため、別途インストールする必要があります

データは、CSVファイル、JSONファイル、区切りテキスト(フィールドを識別するためのヘッダー・ラインを含むCSV)、正規表現で解析されたテキスト、およびバイナリーGryoファイルから読み込むことができます。また、JDBC互換データベースからの入力データの直接読み取りもサポートしています。データ・ファイルは、圧縮ファイルから読み取ることができます。すべてのデータは、読み取り時に変換されます。たとえば、genderフィールドの値は小文字に変換されます。

入力ソース・ファイルからのデータをマップして、頂点または辺を定義できます。マッピング・スクリプトは、読み込みパラメーターを構成し、入力パラメーターを定義して、各入力レコードからグラフ要素へのマッピングを識別します。頂点と辺のプロパティは、読み込まれるデータに含めることができます。

DSE Graph Loaderを使用する際に覚えておきたい重要な特徴は、基盤となるCassandraデータベースのupsertという性質です。頂点または辺が既に存在する場合、DSE Graph Loaderは、格納されているデータを新しいプロパティ値で更新します。

DSE Graph Loaderを使用してデータを読み込む前に、グラフ・スキーマを作成すること強く推奨します。スキーマが作成されていない場合、データの正しいデータ型が指定されません。インデックスの作成は、読み込みプロセスの時間を大幅に短縮し、受け入れ可能な読み込みのパフォーマンスを達成するのに必要です。