Simba JDBCドライバーによるSpark SQL Thriftサーバーへのアクセス

Simba JDBCドライバーにより、Spark SQL Thriftサーバーにアクセスできます

Simba JDBC Driver for Sparkは、Spark SQL Thriftサーバーを実行しているDataStax Enterpriseに格納された情報への標準JDBCインターフェイスを提供します。

DSEライセンスには、Simbaドライバーの使用ライセンスが含まれています。

始める前に

実行中のDSE AnalyticsクラスターでSparkが有効になっていることと、Spark SQL Thriftサーバーを実行しているクラスター内のノードが1つ必要です。

手順

  1. DataStaxドライバー・ダウンロード・ページから、Simba JDBC Driver for Apache Sparkをダウンロードします。
  2. ドライバーを含むZIPファイルを展開します。
  3. JDBCアプリケーションで、以下の詳細を構成します。
    1. SparkJDBC41.jarとZIPファイルに含まれる残りのJARファイルをクラスパスに追加します。
    2. JDBCドライバー・クラスはcom.simba.spark.jdbc41.Driverで、JDBCデータ・ソースはcom.simba.spark.jdbc41.DataSourceです。
    3. 接続URLをjdbc:spark://<hostname>:<port>に設定します。ここで、<hostname>はSpark SQL Thriftサーバーが実行されているノードのホスト名で、<port>はSpark SQL Thriftサーバーがリッスンしているポート番号です。
      jdbc:spark://node1.example.com:10000
  4. 詳細については、ダウンロードしたSimbaドライバーのZIPファイルに含まれているドキュメントを参照してください。