DSE Searchを使用したウィキペディア・デモの実行

1つのノード上でウィキペディア・デモを実行する方法について説明する手順。

以下の手順では、1つのノード上でウィキペディア・デモを実行する方法について説明します。Solrで、3,000のウィキペディア記事をダウンロードし、CQLテーブルを作成し、記事を格納し、記事にインデックスを付けるスクリプトを実行します。デモには、記事にクエリーを実行するWebインターフェイスが含まれます。Solr HTTP APIまたはCQLを使用して、記事にクエリーを実行することもできます。

始める前に

このデモで実行するスクリプトは、localhostを設定するために書き込まれます。ノードのデフォルトのインターフェイスが127.0.0.1でないと、このデモは失敗します。

手順

  1. まだ行っていない場合は、DataStax EnterpriseをSolrノードとして起動します。
  2. cqlshを使用すると、ページネーションがデフォルトでオンになります。ページングをオフにすると、小規模結果セットのクエリーではパフォーマンスの向上が見られるため、以下のように、CQL PAGINGコマンドを使用してページネーションを無効にします。
    PAGING OFF
  3. ウィキペディア・デモのディレクトリーに移動します。
    • Installer-Servicesおよびパッケージのインストール: $ cd /usr/share/dse/demos/wikipedia
    • Installer-No Servicesおよびtarボールのインストール: $ cd install_location/demos/wikipedia
  4. addスキーマ・スクリプトを実行してスキーマをアップロードします。たとえば、Linuxでは以下のようにします。
    ./1-add-schema.sh
    このスクリプトは、solrconfig.xmlおよびschema.xmlファイルをこれらの場所に送信します。
    • http://localhost:8983/solr/resource/wiki.solr/solrconfig.xml
    • http://localhost:8983/solr/resource/wiki.solr/schema.xml

    このスクリプトは、Solrインデックスおよびコアも作成します。URLのwiki.solrの部分は、Cassandraでのキースペース(wiki)およびカラム・ファミリー(solr)を作成します。

  5. インデックス・スクリプトを実行することによって、デモ・ディレクトリーにあるwikipedia-sample.bz2ファイルに含まれている記事にインデックスを付けます。
    ./2-index.sh --wikifile wikipedia-sample.bz2
    3,000の記事が読み込まれます。
  6. Solr Adminツールを開きます。
    末尾に"/"を入力してください。
    http://localhost:8983/solr/

  7. スキーマを検査します。Solr Adminで、[Core Selector]ドロップダウンからwiki.solrを選択します。垂直ナビゲーション・バー内の[Schema]をクリックします。

    Solr Adminを使用して、Cassandra内のウィキペディア・データベースにクエリーを実行できます。Solr HTTP APIまたはcqlshを使用して、データベースにクエリーを実行することもできます。
  8. cqlshを起動して、wikiキースペースを使用します。solr_query expressionを使用してCQL select文を実行し、solrという名前のテーブルで、natioで始まるタイトルを見つけます。
    USE wiki;
    
    SELECT title FROM solr WHERE solr_query='title:natio*';
    辞書順にソートされた出力が表示されます。
     title
    --------------------------------------------------------------------------
    Kenya national under-20 football team
    Bolivia national football team 2002
    Israel men's national inline hockey team
    List of French born footballers who have played for other national teams
    Bolivia national football team 1999
    Bolivia national football team 2001
    Bolivia national football team 2000

    CQLを使用して、一重引用符でSolrクエリー文字列を囲むことができます。たとえば、Solrデモの実行後に、これらのSolrクエリー文字列を使用できます。

    クエリーの種類 説明
    フィールド検索 'title:natio* AND Kenya' スキーマ'title:natio* AND body:CarlosAragonés'で定義された複数のフィールドを使用できます。
    ワイルドカード検索 'Ken?a' 1つまたは複数文字の検索に、?または*を使用します。
    あいまい検索 'Kenya~' 注意して使用しないと、多数ヒットする可能性があります。
    語句検索 '"American football player"' 二重引用符で囲まれた語句を検索します。
    近接検索 '"football Bolivia"~10' footballおよびBoliviaをそれぞれ10語内で検索します。
    範囲検索 'title:[football TO soccer}' 角かっこおよび中かっこを使用して、それぞれ包括的および排他的限界をサポートします。
    用語のブースティング '"football"^4 "soccer"' デフォルトでは、ブースト係数は1です。正の数である必要があります。
    ブーリアン演算子 '+Macedonian football' AND、+、OR、NOT、および-を使用できます。
    グループ分け '(football OR soccer) AND Carlos Aragonés' かっこを使用して、句をグループ分けします。
    フィールドのグループ分け 'title:(+football +"Bolivia")' かっこを使用して、複数の句を1つのフィールドにグループ分けします。
  9. ウィキペディア検索UIの例を見るには、Webブラウザーを開いて、以下のURLに移動します。
    http://localhost:8983/demos/wikipedia

  10. 記事の本文内を検索するには、[検索]フィールドに語句を入力してEnterキーを押します。