Spark MLlibデモ・アプリケーションの実行
Spark MLlibデモ・アプリケーションは、SparkおよびCassandraを使用してマシン・ラーニング分析ジョブを実行する方法を示します。
Spark MLlibデモ・アプリケーションは、SparkおよびCassandraを使用してマシン・ラーニング分析ジョブを実行する方法を示します。このデモでは、アイリスの花のデータ・セットを使用して、典型的なアイリスの花の分類問題を解決します。アプリケーションではアイリスの花のデータ・セットを使用して、4つの特徴の測定に基づいて花を認識するNaive Bayes分類子を構築します。
始める前に
Spark MLlibジョブを実行する前に、BLASライブラリをマシンにインストールすることを強くお勧めします。BLASライブラリをプラットフォームにインストールする方法については、「https://github.com/fommil/netlib-java/blob/master/README.md#machine-optimised-system-libraries」を参照してください。
BLASライブラリはライセンスの制約があるためにDataStax Enterpriseに同梱されていませんが、MLlibのパフォーマンスを大幅に向上させます。
デモを構築するには、Gradle構築ツールがインストールされている必要があります。使用しているOSにGradleをインストールする方法の詳細については、https://gradle.org/を参照してください。