RDD

RDD(Resilient Distributed Datasets)はSparkの基盤データ構造であり、不変の分散型オブジェクト・コレクションです。RDDには、値を返すアクションと、新しいRDDにポインターを返す変換があります。