輸入/輸出

數據生成器

範圍(開始、結束步驟,num_partitions])

創建一個DataFrame範圍的數字。

火花Metastore表

read_table(名字[index_col])

讀表並返回一個DataFrame火花。

DataFrame.to_table(名稱、格式、模式,…))

寫DataFrame火花表。

三角洲湖

read_delta(路徑、版本、時間戳、index_col])

三角洲湖表一些文件係統讀取並返回一個DataFrame。

DataFrame.to_delta(路徑、模式、…)

寫DataFrame三角洲湖表。

拚花

read_parquet(道路、列index_col,…)

從文件路徑加載一個拚花對象,返回一個DataFrame。

DataFrame.to_parquet(路徑、模式、…)

寫DataFrame拚花文件或目錄。

獸人

read_orc(道路、列index_col])

從文件路徑加載一個獸人對象,返回一個DataFrame。

DataFrame.to_orc(路徑、模式、…)

寫DataFrame獸人文件或目錄。

通用I / O火花

read_spark_io([路徑、格式、模式index_col])

加載一個DataFrame火花數據源。

DataFrame.to_spark_io([路徑、格式、模式、…))

寫DataFrame火花數據源。

平麵文件/ CSV

read_csv(路徑[9頭,名字,…))

CSV(逗號分隔)文件讀入DataFrame或係列。

DataFrame.to_csv([路徑,9月,na_rep…))

對象寫入一個逗號分隔值(csv)文件。

剪貼板

read_clipboard([9])

從剪貼板並通過read_csv閱讀文本。

DataFrame.to_clipboard([excel, 9])

將對象複製到係統剪貼板。

Excel

read_excel(io [sheet_name頭,名字,…))

Excel文件讀入pandas-on-Spark DataFrame或係列。

DataFrame.to_excel(excel_writer […])

對象寫入一個Excel表。

JSON

read_json(道路、線、index_col])

DataFrame轉換為一個JSON字符串。

DataFrame.to_json([路徑、壓縮、…)

將對象轉換為一個JSON字符串。

HTML

read_html(io、匹配味道,頭,…))

讀到一個HTML表列表DataFrame對象。

DataFrame.to_html([buf、列col_space,…)

呈現一個DataFrame作為HTML表。

SQL

read_sql_table(table_name反對[、模式…])

讀成DataFrame SQL數據庫表。

read_sql_query(sql,反對[index_col])

讀DataFrame SQL查詢。

read_sql(sql,反對[index_col,列])

讀取SQL查詢或DataFrame數據庫表。