DSE Analyticsについて
DSE Analyticsを使用して、非常に大きいデータベースを分析します。DSE Analyticsは、Apache Sparkと統合されています。
DataStax Enterprise(DSE)には、バッチ処理に対応したリアルタイムの運用分析機能とApache Spark™の機能強化バージョンが統合されています。DSE Analyticsを使用すると、非定型レポートを簡単に生成したり、パーソナライズを行って顧客を絞り込んだり、データ・ストリームをリアルタイムで処理することができます。分析ツールセットを使用すると、コードを1回記述しただけで、リアルタイムとバッチ処理の両方のワークロードに使用できます。
DSE Analyticsジョブでは、DataStax Enterpriseファイル・システム(DSEFS)を使用して、分析処理に一般に伴う大量のデータ・セットを処理できます。DSEFSは、CFS(Cassandraファイル・システム)に代わり導入されました。
DSE Analyticsの機能
- 単一障害点なし
- DSE Analyticsでは、Sparkジョブを実行するために、ピアツーピア分散クラスターをサポートしています。クラスターのノードはすべてピアになるため、任意のデータ・ファイルを読み込むことができ、任意のAnalyticsノードがSparkマスターの役割を担うことができます。
- Sparkマスター管理
- DSE Analyticsには、自動Sparkマスター管理機能があります。
- ETLなしの分析
- DSE Analyticsを使用して、Sparkジョブをデータベース内のデータに対して直接実行します。1つのワークロードが他のワークロードのパフォーマンスに悪影響を与える心配をすることなく、リアルタイムのワークロードと分析ワークロードを同時に実行することができます。一部のクラスター・ノードをAnalyticsノードとして開始し、他のノードを純粋なトランザクションのリアルタイム・ノードとして開始すると、ノード間のデータが自動的にレプリケートされます。
- DataStax Enterpriseファイル・システム(DSEFS)
- DSEFS(DataStax Enterpriseファイル・システム)は、DataStax Enterprise内のフォールト・トレランスな汎用分散ファイル・システムです。チェックポイント処理やログ先行書き込みなど、Spark Streamingアプリケーションのデータ取り込み、データ・ステージング、状態管理に分散ファイル・システムを活用するユース・ケース向けに設計されています。DSEFSはHDFSと似ていますが、HDFSによくあるデプロイ時の複雑さや単一障害点がありません。DSEFSはHDFSと互換性があり、SparkなどのシステムでHDFSの代わりに動作するよう設計されています。
- DSE Analytics Solo
- DSE Analytics Soloデータ・センターは、トランザクション・データと分析ジョブを分離する必要があるデプロイでは、DSE Analytics処理に集中します。
- 統合セキュリティ
- DSE Analyticsでは、DSEの高度なセキュリティ機能を使用することで、デプロイと構成を容易にします。
- AlwaysOn SQL
- AlwaysOn SQLは、DSE AnalyticsデータにアクセスするアプリケーションにJDBCとODBCのインターフェイスを提供する高可用性サービスです。
DSE Analyticsの有効化
Anaylticsを有効にするには、クラスターのデータ・センターのワークロード・タイプを選択するためのアーキテクチャー・ガイドラインに従ってください。