認証が有効な場合にクラスター・モードでSparkアプリを有効にする
JARファイルがCassandraファイル・システム(CFS)上にあり、認証が有効になっている場合に、クラスター・モードでSparkアプリケーションを有効にするための構成手順。
spark-env.shファイルのデフォルトの場所は、インストールのタイプによって異なります。
パッケージ・インストールInstaller-Servicesインストール |
/etc/dse/spark/spark-env.sh |
tarボール・インストールInstaller-No Servicesインストール |
installation_location/resources/spark/conf/spark-env.sh |
手順
-
JARファイルがCFS上にあり、認証が有効になっている場合にクラスター・モードでSparkアプリケーションを有効にするには、以下のいずれかを行います。
-
すべてのDataStax Enterpriseノードのspark-env.shに次の文を追加します。
SPARK_WORKER_OPTS="$SPARK_WORKER_OPTS -Dspark.hadoop.cassandra.username=username -Dspark.hadoop.cassandra.password=password"
- DataStax Enterpriseサーバー・プロセスを開始する前に、SPARK_WORKER_OPTS環境変数を、DataStax Enterpriseサーバー・プロセスの可視性を保証するように設定します。
この環境変数は、
dse spark
またはdse spark-submit
コマンドを使用して送信されるアプリケーションに渡す必要はありません。
-
-
以下のベスト・プラクティスに従います。
- CFS上でのみ権限を持つ(関連するCFSキースペースへのアクセス)一意のユーザーを作成し、その一意のユーザー認証情報をSparkワーカー認証に使用します。このベスト・プラクティスによって、明示的なパーミッションがなくてもユーザーのSparkジョブを介してアクセスできる、データベース内の保護された情報の量が制限されます。
- 別のCFSディレクトリーを作成し、このディレクトリーへのアクセス権限を読み取り専用に限定します。