DataStaxバルク・ローダーについて - dsbulk
DataStaxバルク・ローダー・ツールの紹介。
DataStaxバルク・ローダー・ツールdsbulk
を使用すると、CSVまたはJSON形式でDSEデータの読み込みおよびアンロードを実行できます。
このドキュメントについて
DataStaxバルク・ローダー・ドキュメントにようこそ。このドキュメントを最大限に活用するために、「DataStaxドキュメントを使用するためのヒント」をご覧ください。
DataStaxバルク・ローダーについて - dsbulk
DataStaxバルク・ローダーは、ユーザーがDSEでデータの読み込みおよびアンロードを効率的かつ安全に行えるようにすることを目的としています。dsbulk
は、量に関わらずデータを効率的に読み込み、開発者環境も生産環境もサポートします。dsbulk
を使用すると、DSEでCSVまたはJSONファイルの読み込みまたはアンロードを迅速に実行できます。CSVまたはJSONファイルで、リレーショナル・データベースからエクスポートしたものや元データになっているものは、DSEトランザクション・データベースに挿入できます。このツールは、LinuxとWindowsの両方のプラットフォームでサポートされます。
DataStaxバルク・ローダーの特徴
- DSEまたはApache CassandraTMクラスターから別のDSEにデータを移行できる
- Cassandra 2.1以降のすべてのデータ・ソースからデータをアンロードできる
- DSE 5.0以降にデータを読み込める注: DSE has reached EOSL.
- サポート対象形式はCSVとJSON
- ソースまたはデスティネーションとして、ファイル、ディレクトリー、stdin/stdout、およびWeb URLを使用
- マルチスレッドの操作により、cqlsh COPYと比較して速度が2~3倍増加し、パフォーマンスが向上
- KerberosまたはSSLでのユーザー名/パスワードによる安全な認証
- 構成可能なデータ解析(たとえば、日付形式の構成が可能)
- パフォーマンスおよび進捗状況の報告
- LinuxとWindows用のコマンド・ライン・ツールには以下のような特徴があります。
- 構成ファイルを使用したdsbulkのコマンド・ライン呼び出しの簡略化
- 読み込みおよびアンロードの時間を最適にする調整可能なパラメーター
- 機能強化により、データの読み込みおよびアンロードのための安全な接続を実現