GraphMLデータの読み込み

DSE Graph Loaderを使用してGraphMLデータを読み込む方法。

GraphMLデータのデータ・マッピング・スクリプトを説明付きで示します。スクリプト全文は、ページの最後にあります。
注: DSE Graph Loaderでは、TinkerGraphで生成されたGraphMLファイル、すなわち、Apache TinkerPopに含まれているインメモリー・グラフ・データベースを読み込むことができます。DSE Graph Loaderを使用して、DSE Graphで生成されたGraphMLファイルを読み込むことはできません。

手順

  • 必要に応じて、マッピング・スクリプトに構成を追加します
  • データ入力ファイルを指定します。変数inputfiledirは、入力ファイルのディレクトリーを指定します。指定されたファイルは、読み込みで使用されます。
    // DATA INPUT
    // Define the data input source 
    // inputfiledir is the directory for the input files 
    
    inputfiledir = '/tmp/GraphML/'
    recipeInput = Graph.file(inputfiledir + 'recipe.xml').graphml()
  • ファイルをxmlファイルとして指定し、追加手順graphml()によって、このファイルをGraphMLファイルとして処理する必要があることが識別されます。マップrecipeInputが作成され、データの処理に使用されます。
    recipeInput = Graph.file(inputfiledir + 'recipe.xml')

    File.csvまたはFile.jsonとは対照的に、Graph.fileが使用されることに注意してください。

  • マッピング・スクリプトの本文を作成します。マッピング・スクリプトのこの部分は、ファイル形式に関係なく同じです。ただし、GraphMLファイルではわずかに変更されたバージョンが使用されます。
  • GraphMLの読み込みに、DSE Graph Loaderをdry runとして実行するには、次のコマンドを使用します。
    $ graphloader recipeMappingGraphML.groovy -graph testGraphML -address localhost -dryrun true

    テスト目的の場合、graphloaderの実行前に、指定されたグラフが存在する必要はありません。ただし、実稼働アプリケーションの場合は、グラフとスキーマを作成してから、graphloaderを使用する必要があります。

  • 読み込みスクリプトの全文は次のようになります。
    /* SAMPLE INPUT
    GraphML file is an XML  file
     */
    
    // CONFIGURATION
    // Configures the data loader to create the schema
    config create_schema: true, load_new: true
    
    // DATA INPUT
    // Define the data input source 
    // inputfiledir is the directory for the input files 
    
    inputfiledir = '/tmp/GraphML/'
    recipeInput = Graph.file(inputfiledir + 'recipe.xml').graphml()
    
    //Specifies what data source to load using which mapper (as defined inline)
      
    load(recipeInput.vertices()).asVertices {
        labelField "~label"
        key "~id", "id"
    }
    
    load(recipeInput.edges()).asEdges {
        labelField "~label"
        outV "outV", {
            labelField "~label"
            key "~id", "id"
        }
        inV "inV", {
            labelField "~label"
            key "~id", "id"
        }
    }