DSE Analytics Soloについて

DSE Analytics Soloデータ・センターでは、トランザクション・データベースのデータを格納せずに、Sparkと分散ストレージによってDSEFSを使用して分析処理を実行します。

DSE Analytics Soloデータ・センターでは、トランザクション・データベースのデータを格納せずに、Sparkと分散ストレージによってDSEFSを使用して分析処理を実行します。

DataStax Enterpriseは、Transactionalワークロードに呼応して、柔軟に分析処理をデプロイできます。DSE Analyticsをデプロイするには、データベース処理ノードとの併置してデプロイする方法と、独自のデータ・センター内の分離したマシンにデプロイする方法の主な2つの方法があります。

1. 従来のデプロイとDSE Analytics Soloのデプロイ

従来のデプロイとDSE Analytics Soloのデプロイ

従来のDSE Analyticsデプロイでは、DataStaxデータベース・プロセスとSparkプロセスが同じマシン上で実行されていました。この方法では、分析がそれほど集中していない場合や、データベースの使用頻度があまり高くない場合は、分析処理の簡単なデプロイが可能です。

DSE Analytics Soloを使用すると、トランザクションDSEノードとは異なるデータ・センターの分離したハードウェア構成でDSE Analytics処理をデプロイできます。この結果、コンピューターのリソースを取り合わない構成で両方のエンジンの一貫した動作が得られます。この構成は、処理集約型分析ワークロードに適しています。

DSE Analytics Soloでは、データベース・トランザクションに使用されるノードよりも多くのデータ処理専用のノードを柔軟に配置できます。これは、処理のニーズがトランザクション・リソースのニーズをはるかに超える状況で、特に役に立ちます。たとえば、着信データの99.9%を分析してフィルターするSpark Streamingジョブがあり、分析後のいくつかのレコードのみを格納するとします。トランザクション・データ・センターが要求するリソースは、データ分析に必要なリソースよりもはるかに少なくなります。

DSE Analytics Soloでは、クラスターでの分析処理をより柔軟にスケール・アップまたはスケール・ダウンできます。これは、分析ジョブが急増する一日の終わりや四半期末など、追加の分析処理が必要な場合に特に役に立ちます。DSE Analytics Soloノードにはデータベースのデータが格納されないため、新しいノードがクラスターに追加されると、ネットワークを通じて新しいノードに移動するデータはごくわずかですみます。分析とトランザクションが配列された環境では、ノードの追加は、既存のノードと新しいノード間でのトランザクション・データの移動を意味します。

DSE Analytics Soloデータ・センターの作成方法については、「DSE Analytics Soloデータ・センターの作成を参照してください。