サポートされるSpark SQLの構文

Spark SQLはSQL-92言語のサブセットをサポートしています。

以下の構文はSELECTクエリーを定義します。

SELECT [DISTINCT] [column names]|[wildcard] 
FROM [keyspace name.]table name 
[JOIN clause table name ON join condition]
[WHERE condition]
[GROUP BY column name]
[HAVING conditions]
[ORDER BY column names [ASC | DSC]]

結合を使用したSELECTクエリーの構文は以下のとおりです。

SELECT statement
FROM statement
[JOIN | INNER JOIN | LEFT JOIN | LEFT SEMI JOIN | LEFT OUTER JOIN | RIGHT JOIN | RIGHT OUTER JOIN | FULL JOIN | FULL OUTER JOIN]
ON join condition

UNIONINTERSECT、またはEXCEPTの各クエリーでは、複数のselect句を組み合わせることができます。

SELECT statement 1
[UNION | UNION ALL | UNION DISTINCT | INTERSECT | EXCEPT]
SELECT statement 2
注: 新しいカラムに対して実行されるselectクエリーは、Noneの代わりに''、つまり空の結果を返します。

以下の構文はINSERTクエリーを定義します。

INSERT [OVERWRITE] INTO [keyspace name.]table name [(columns)]
VALUES values

以下の構文はCACHE TABLEクエリーを定義します。

CACHE TABLE table name [AS table alias]

UNCACHE TABLEクエリーを使用すると、キャッシュからテーブルを削除できます。

UNCACHE TABLE table name

Spark SQLのキーワード

Spark SQLでは以下のキーワードが予約されています。

  • ALL
  • AND
  • AS
  • ASC
  • APPROXIMATE
  • AVG
  • BETWEEN
  • BY
  • CACHE
  • CAST
  • COUNT
  • DESC
  • DISTINCT
  • FALSE
  • FIRST
  • LAST
  • FROM
  • FULL
  • GROUP
  • HAVING
  • IF
  • IN
  • INNER
  • INSERT
  • INTO
  • IS
  • JOIN
  • LEFT
  • LIMIT
  • MAX
  • MIN
  • NOT
  • NULL
  • ON
  • OR
  • OVERWRITE
  • LIKE
  • RLIKE
  • UPPER
  • LOWER
  • REGEXP
  • ORDER
  • OUTER
  • RIGHT
  • SELECT
  • SEMI
  • STRING
  • SUM
  • TABLE
  • TIMESTAMP
  • TRUE
  • UNCACHE
  • UNION
  • WHERE
  • INTERSECT
  • EXCEPT
  • SUBSTR
  • SUBSTRING
  • SQRT
  • ABS