データの読み込み
DSE Graph Loaderを使用したデータの読み込み方法。
DSE Graph Loaderでは、さまざまなタイプの入力データ形式からデータを読み込むことができます。お使いのデータ・ソースに最も似たオプションをお選びください。
タイプ | 説明 | 手順 |
---|---|---|
CSV | Strict形式。グラフに使用されているプロパティ・キーをファイルの先頭行で識別する。 | CSVデータの読み込み |
Text | 任意の形式の区切りテキスト・データ。 | テキスト・データの読み込み |
正規表現のテキスト | 正規表現(regex)を使用して解析された区切りテキスト・データ。 | 正規表現(regex)を使用したテキスト・データの読み込み |
JSON | JSON(JavaScript Object Notation)形式に格納されたデータ。 | JSONデータの読み込み |
JDBC互換データベース | JDBC互換データベースに格納されたデータ | JDBC互換データベースからのデータの読み込み |
HDFSファイル | 任意の形式のHadoop分散ファイル・システム(HDFS)に格納されたデータ・ファイル。 | Hadoop(HDFS)からのデータの読み込み |
AWS S3ファイル | 任意の形式のAWS S3ストレージに格納されたデータ・ファイル。 | AWS S3からのデータの読み込み |
Gryo | バイナリーGryo形式で格納されたデータ。 | Gryoデータの読み込み |
GraphSON | GraphSON形式で格納されたデータ。 | GraphSONデータの読み込み |
GraphML | GraphML形式で格納されたデータ。 | GraphMLデータの読み込み |
注: フィールドに
NULL
やnull
が含まれていたり、テキストおよびCSVファイルに空のフィールドが存在する場合、これらのフィールドはDSE Graph Loaderによって削除されます。別の動作が必要な場合は、変換を使用する必要があります。警告: ユーザー定義の頂点IDを読み込む場合、DSE Graph Loaderが使用する頂点キャッシュは、書き込みスループットの処理速度を上げるためにバイパスされます。カスタムIDを持つ頂点の有無を検証するロジックは存在しないため、クライアントは頂点が一意であることを確認する必要があります。最速のパフォーマンスを確保するには、DSE Graphの構成オプションexternal_vertex_verifyをfalseに設定する必要があります。
DSE Graph Loaderでは、1つのディレクトリーから同じ形式の複数のファイルを読み込むこともできます。CSVおよびJSONのマッピング・スクリプト例が表示されていますが、これらはすべての形式に対応します。