輸入/輸出

DataFrameReader.csv(路徑、模式、sep…))

加載一個CSV文件,並返回結果DataFrame

DataFrameReader.format(源)

指定輸入數據源格式。

DataFrameReader.jdbc(url,表(列,…))

構造一個DataFrame表示數據庫表命名通過JDBC URLurl和連接屬性

DataFrameReader.json(路徑、模式…)

加載JSON文件並返回結果DataFrame

DataFrameReader.load([路徑、格式模式])

從一個數據源加載數據並返回它DataFrame

DataFrameReader.option(關鍵字,值)

添加了一個底層數據源的輸入選項。

DataFrameReader.options(* *選項)

增加了底層數據源的輸入選項。

DataFrameReader.orc(道路、mergeSchema…)

加載獸人文件,返回的結果DataFrame

DataFrameReader.parquet(*路徑,* *選項)

加載鋪文件,返回結果為DataFrame

DataFrameReader.schema(模式)

指定輸入模式。

DataFrameReader.table(表)

返回指定表的DataFrame

DataFrameReader.text(路徑[wholetext,…)

加載文本文件並返回DataFrame的模式從一個字符串列命名為“價值”,和緊隨其後的是如果有任何分區的列。

DataFrameWriter.bucketBy(col numBuckets *峽路)

桶的輸出給定的列。

DataFrameWriter.csv(路徑、模式、…)

保存的內容DataFrame在CSV格式指定的路徑。

DataFrameWriter.format(源)

指定底層輸出數據源。

DataFrameWriter.insertInto(表[…])

插入的內容DataFrame指定的表。

DataFrameWriter.jdbc(url,表[、模式、…))

保存的內容DataFrame通過JDBC外部數據庫表。

DataFrameWriter.json(路徑、模式、…)

保存的內容DataFrame在JSON格式(JSON文本格式或用JSON在指定的路徑)。

DataFrameWriter.mode(saveMode)

指定的行為當數據或表已經存在。

DataFrameWriter.option(關鍵字,值)

增加了一個輸出選擇基礎數據源。

DataFrameWriter.options(* *選項)

為底層數據源添加了輸出選項。

DataFrameWriter.orc(路徑、模式、…)

保存的內容DataFrame在獸人格式指定的路徑。

DataFrameWriter.parquet(路徑、模式、…)

保存的內容DataFrame在拚花格式指定的路徑。

DataFrameWriter.partitionBy(*峽路)

分區文件係統上的輸出通過給定的列。

DataFrameWriter.save([路徑、格式、模式、…))

保存的內容DataFrame一個數據源。

DataFrameWriter.saveAsTable(名稱、格式、…)

保存的內容DataFrame指定的表。

DataFrameWriter.sortBy(*關口坳)

在每個桶排序輸出給定的列在文件係統。

DataFrameWriter.text(道路、壓縮、…)

保存的內容DataFrame在文本文件在指定的路徑。