SearchAnalyticsでのWikipediaデモの実行

Wikipedia SolrのデモをSearchAnalyticsノードで実行し、Solrクエリーを使用してSpark RDDを取得できます。

以下の手順では、SearchAnalyticsノードのSparkコンソールでSolrクエリーを使用する方法をWikipediaのデモを使用して説明します。

始める前に

単一データセンターのデプロイ・シナリオ」の説明に従って新しいSearchAnalyticsクラスターを作成しているはずです。

手順

  1. 1つまたは複数のノードをSearchAnalyticsモードで起動します。
  2. dsetool ringを実行し、クラスターが正しく実行されていることを確認します。ノードのタイプはSearchAnalyticsである必要があります。
    dsetool ring
    dsetoolコマンドのデフォルトの場所は、インストールのタイプによって異なります。
    パッケージ・インストール /usr/bin/dsetool
    Installer-Servicesインストール /usr/bin/dsetool
    Installer-No Servicesおよびtarボール・インストール install_location/bin/dsetool
  3. ターミナルで、Wikipediaデモのディレクトリーに移動します。
    ウィキペディア・デモのデフォルトの場所は、インストールのタイプによって異なります。
    Installer-No Servicesおよびtarボール・インストール install_location/demos/wikipedia
    Installer-Servicesおよびパッケージ・インストール /usr/share/dse/demos/wikipedia
    cd /usr/share/dse/demos/wikipedia
  4. 1-add-schema.shスクリプトを実行してスキーマを追加します。
    ./1-add-schema.sh
  5. Solrインデックスを作成します。
    ./2-index.sh
  6. Sparkコンソールを起動します。
    dse spark
  7. wiki.solrテーブルに基づいてRDDを作成します。
    scala> val table = sc.cassandraTable("wiki","solr")
    table:com.datastax.spark.connector.rdd.CassandraTableScanRDD[com.datastax.spark.connector.CassandraRow] = CassandraTableScanRDD[0] at RDD at CassandraRDD.scala:15
  8. タイトルのSolrインデックスを使用してクエリーを実行し、結果を収集します。
    scala> val result = table.select("id","title").where("solr_query='title:Boroph*'").collect
    JSONの同等のクエリー:
    where("solr_query='{"q":"title:Boroph*"}'")
    結果:
    Array[com.datastax.spark.connector.CassandraRow] = Array(
    CassandraRow{id:23729958, title:Borophagus parvus},
    CassandraRow{id:23730195, title:Borophagus dudleyi}, 
    CassandraRow{id:23730528, title:Borophagus hilli}, 
    CassandraRow{id:23730810, title:Borophagus diversidens}, 
    CassandraRow{id:23730974, title:Borophagus littoralis}, 
    CassandraRow{id:23731282, title:Borophagus orc},
    CassandraRow{id:23731616, title:Borophagus pugnator}, 
    CassandraRow{id:23732450, title:Borophagus secundus})

次のタスク

CQLでのSolrクエリー構文の使用の詳細については、「DSE SearchのCQL Solrクエリー」を参照してください。