Spark ODBCドライバーの構成(Windows)

Simba ODBC Driver for Apache Sparkのデータ・ソースをWindowsに追加します。

TableauやMicrosoft Excelなどのビジネス・インテリジェンス(BI)ツールを含む、ODBCアプリケーションのODBCデータ・ソースを構成します。

手順

  1. 32ビットまたは64ビットのいずれかのODBCドライバーを選択します。
    1. 32ビット・ドライバーの場合は、[Start] > [Program Files] > [Simba Spark ODBC Driver] > [32 bit ODBC Data Source Administrator]の順にクリックします。
    2. 64ビット・ドライバーの場合は、[Start] > [Program Files] > [Simba Spark ODBC Driver] > [64 bit ODBC Data Source Administrator]の順にクリックします。
  2. [Drivers]タブをクリックして、Simba Spark ODBCドライバーが表示されていることを確認します。
  3. ユーザーDSN(データ・ソース名)またはシステムDSNをODBCツール接続用に作成します。
    1. a.[User DSN]タブまたは[System DSN]タブをクリックします。
    2. b.[Add] > [Simba Spark ODBC Driver] > [Finish]の順にクリックします。
    3. [Simba Spark ODBC Driver DSN Setup]で、以下を入力します。
      Data Source Name DSNの名前。
      説明 DSNの詳しい説明(任意)。
      Sparkサーバーのタイプ SparkThriftServer(Spark 1.1以降)
      ホスト Spark SQL ThriftサーバーのIPまたはホスト名。
      Port Spark SQL Thriftサーバーのリッスン・ポート(デフォルトは10000)
      データベース すべてのテーブルをデフォルトのデータベースに読み込むには、defaultを指定します。または、特定のキースペースを選択します。
      認証メカニズム ユーザー名
      ユーザー名 空白のままにします
    4. Test]をクリックします。

      テストの結果に、接続が成功したことが示されるはずです。

  4. 高度な構成オプションについては、「Simba ODBC Driver for Sparkインストール・ガイド」を参照してください。これは、[Start] > [Program Files] > [Simba Spark ODBC Driver]の順にアクセスするとインストールされます。

次のタスク

TableauやMicrosoft ExcelなどのODBCアプリケーションで新しく作成したデータ・ソースを使用します。

ODBCクエリーがSpark SQL Thriftサーバーに送信されると、適切なSparkジョブが実行され、ODBC経由でアプリケーションにデータが返されます。

Spark SQL Thriftサーバーで実行されているクエリーのトラブルシューティングを行ったり理解を深めたりするには、DSEクラスター上のSparkマスターWebインターフェイス(http://node name:4040)のWebブラウザーを開き、Thriftサーバー・アプリケーションをクリックして、[SQL]タブを表示します。