SearchAnalyticsでのWikipediaデモの実行
Wikipedia SolrのデモをSearchAnalyticsノードで実行し、Solrクエリーを使用してSpark RDDを取得できます。
以下の手順では、SearchAnalyticsノードのSparkコンソールでSolrクエリーを使用する方法をWikipediaのデモを使用して説明します。
始める前に
「単一データセンターのデプロイ・シナリオ」の説明に従って新しいSearchAnalyticsクラスターを作成しているはずです。
手順
-
1つまたは複数のノードをSearchAnalyticsモードで起動します。
- パッケージ/Services:「DataStax Enterpriseをサービスとして起動」を参照してください。
- tarボール/No Services:「DataStax Enterpriseをスタンドアローン・プロセスとして起動」を参照してください。
-
dsetool ringを実行し、クラスターが正しく実行されていることを確認します。ノードのタイプは
SearchAnalytics
である必要があります。dsetool ring
dsetool
コマンドのデフォルトの場所は、インストールのタイプによって異なります。パッケージ・インストール /usr/bin/dsetool Installer-Servicesインストール /usr/bin/dsetool Installer-No Servicesおよびtarボール・インストール install_location/bin/dsetool -
ターミナルで、Wikipediaデモのディレクトリーに移動します。
ウィキペディア・デモのデフォルトの場所は、インストールのタイプによって異なります。
Installer-No Servicesおよびtarボール・インストール install_location/demos/wikipedia Installer-Servicesおよびパッケージ・インストール /usr/share/dse/demos/wikipedia cd /usr/share/dse/demos/wikipedia
-
1-add-schema.shスクリプトを実行してスキーマを追加します。
./1-add-schema.sh
-
Solrインデックスを作成します。
./2-index.sh
-
Sparkコンソールを起動します。
dse spark
-
wiki.solr
テーブルに基づいてRDDを作成します。scala> val table = sc.cassandraTable("wiki","solr")
table:com.datastax.spark.connector.rdd.CassandraTableScanRDD[com.datastax.spark.connector.CassandraRow] = CassandraTableScanRDD[0] at RDD at CassandraRDD.scala:15
-
タイトルのSolrインデックスを使用してクエリーを実行し、結果を収集します。
scala> val result = table.select("id","title").where("solr_query='title:Boroph*'").collect
JSONの同等のクエリー:where("solr_query='{"q":"title:Boroph*"}'")
結果: Array[com.datastax.spark.connector.CassandraRow] = Array( CassandraRow{id:23729958, title:Borophagus parvus}, CassandraRow{id:23730195, title:Borophagus dudleyi}, CassandraRow{id:23730528, title:Borophagus hilli}, CassandraRow{id:23730810, title:Borophagus diversidens}, CassandraRow{id:23730974, title:Borophagus littoralis}, CassandraRow{id:23731282, title:Borophagus orc}, CassandraRow{id:23731616, title:Borophagus pugnator}, CassandraRow{id:23732450, title:Borophagus secundus})
次のタスク
CQLでのSolrクエリー構文の使用の詳細については、「DSE SearchのCQL Solrクエリー」を参照してください。