DataStaxバルク・ローダーについて - dsbulk

DataStaxバルク・ローダー・ツールの紹介。

DataStaxバルク・ローダー・ツールdsbulkを使用すると、CSVまたはJSON形式でDSEデータの読み込みおよびアンロードを実行できます。

このドキュメントについて

DataStaxバルク・ローダー・ドキュメントにようこそ。このドキュメントを最大限に活用するために、「DataStaxドキュメントを使用するためのヒント」をご覧ください。

DataStaxバルク・ローダーについて - dsbulk

DataStaxバルク・ローダーは、ユーザーがDSEでデータの読み込みおよびアンロードを効率的かつ安全に行えるようにすることを目的としています。dsbulkは、量に関わらずデータを効率的に読み込み、開発者環境も生産環境もサポートします。dsbulkを使用すると、DSEでCSVまたはJSONファイルの読み込みまたはアンロードを迅速に実行できます。CSVまたはJSONファイルで、リレーショナル・データベースからエクスポートしたものや元データになっているものは、DSEトランザクション・データベースに挿入できます。このツールは、LinuxとWindowsの両方のプラットフォームでサポートされます。

DataStaxバルク・ローダーの特徴

  • DSEまたはApache CassandraTMクラスターから別のDSEにデータを移行できる
    • Cassandra 2.1以降のすべてのデータ・ソースからデータをアンロードできる
    • DSE 5.0以降にデータを読み込める
      注: DSE has reached EOSL.
  • サポート対象形式はCSVとJSON
  • ソースまたはデスティネーションとして、ファイル、ディレクトリー、stdin/stdout、およびWeb URLを使用
  • マルチスレッドの操作により、cqlsh COPYと比較して速度が2~3倍増加し、パフォーマンスが向上
  • KerberosまたはSSLでのユーザー名/パスワードによる安全な認証
  • 構成可能なデータ解析(たとえば、日付形式の構成が可能)
  • パフォーマンスおよび進捗状況の報告
  • LinuxとWindows用のコマンド・ライン・ツールには以下のような特徴があります。
    • 構成ファイルを使用したdsbulkのコマンド・ライン呼び出しの簡略化
    • 読み込みおよびアンロードの時間を最適にする調整可能なパラメーター
    • 機能強化により、データの読み込みおよびアンロードのための安全な接続を実現
DataStaxブログの記事「DataStaxバルク・ローダーのご紹介」を参照してください。