DSE Analyticsについて

DSE Analyticsを使用して、非常に大きいデータベースを分析します。DSE Analyticsは、Apache Sparkと統合されています。

DataStax Enterprise(DSE)には、バッチ処理に対応したリアルタイムの運用分析機能とApache Sparkの機能強化バージョンが統合されています。DSE Analyticsを使用すると、非定型レポートを簡単に生成したり、パーソナライズを行って顧客を絞り込んだり、データ・ストリームをリアルタイムで処理することができます。分析ツールセットを使用すると、コードを1回記述しただけで、リアルタイムとバッチ処理の両方のワークロードに使用できます。

DSE Analyticsジョブでは、DataStax Enterpriseファイル・システム(DSEFS)を使用して、分析処理に一般に伴う大量のデータ・セットを処理できます。DSEFSは、CFS(Cassandraファイル・システム)に代わり導入されました。

DSE Analyticsの機能

単一障害点なし
DSE Analyticsでは、Sparkジョブを実行するために、ピアツーピア分散クラスターをサポートしています。クラスターのノードはすべてピアになるため、任意のデータ・ファイルを読み込むことができ、任意のAnalyticsノードがSparkマスターの役割を担うことができます。
Sparkマスター管理
DSE Analyticsには、自動Sparkマスター管理機能があります。
ETLなしの分析
DSE Analyticsを使用して、Sparkジョブをデータベース内のデータに対して直接実行します。1つのワークロードが他のワークロードのパフォーマンスに悪影響を与える心配をすることなく、リアルタイムのワークロードと分析ワークロードを同時に実行することができます。一部のクラスター・ノードをAnalyticsノードとして開始し、他のノードを純粋なトランザクションのリアルタイム・ノードとして開始すると、ノード間のデータが自動的にレプリケートされます。
DataStax Enterpriseファイル・システム(DSEFS
DSEFS(DataStax Enterpriseファイル・システム)は、DataStax Enterprise内のフォールト・トレランスな汎用分散ファイル・システムです。チェックポイント処理やログ先行書き込みなど、Spark Streamingアプリケーションのデータ取り込み、データ・ステージング、状態管理に分散ファイル・システムを活用するユース・ケース向けに設計されています。DSEFSはHDFSと似ていますが、HDFSによくあるデプロイ時の複雑さや単一障害点がありません。DSEFSはHDFSと互換性があり、SparkなどのシステムでHDFSの代わりに動作するよう設計されています。
DSE Analytics Solo
DSE Analytics Soloデータ・センターは、トランザクション・データと分析ジョブを分離する必要があるデプロイでは、DSE Analytics処理に集中します。
統合セキュリティ
DSE Analyticsでは、DSEの高度なセキュリティ機能を使用することで、デプロイと構成を容易にします。
AlwaysOn SQL
AlwaysOn SQLは、DSE AnalyticsデータにアクセスするアプリケーションにJDBCとODBCのインターフェイスを提供する高可用性サービスです。

DSE Analyticsの有効化

Anaylticsを有効にするには、クラスターのデータ・センターのワークロード・タイプを選択するためのアーキテクチャー・ガイドラインに従ってください。