pyspark.sql.DataFrameReader.csv

DataFrameReader。 csv 路徑聯盟str列表str模式(pyspark.sql.types聯盟。StructType, str, None]沒有一個9月可選str沒有一個編碼可選str沒有一個報價可選str沒有一個逃避可選str沒有一個評論可選str沒有一個Union[bool, str, None]沒有一個inferSchemaUnion[bool, str, None]沒有一個ignoreLeadingWhiteSpaceUnion[bool, str, None]沒有一個ignoreTrailingWhiteSpaceUnion[bool, str, None]沒有一個nullValue可選str沒有一個nanValue可選str沒有一個positiveInf可選str沒有一個negativeInf可選str沒有一個dateFormat可選str沒有一個timestampFormat可選str沒有一個maxColumnsUnion[str, int, None]沒有一個maxCharsPerColumnUnion[str, int, None]沒有一個maxMalformedLogPerPartitionUnion[str, int, None]沒有一個模式可選str沒有一個columnNameOfCorruptRecord可選str沒有一個多行Union[bool, str, None]沒有一個charToEscapeQuoteEscaping可選str沒有一個samplingRatioUnion[str, float, None]沒有一個enforceSchemaUnion[bool, str, None]沒有一個emptyValue可選str沒有一個語言環境可選str沒有一個lineSep可選str沒有一個pathGlobFilterUnion[bool, str, None]沒有一個recursiveFileLookupUnion[bool, str, None]沒有一個modifiedBeforeUnion[bool, str, None]沒有一個modifiedAfterUnion[bool, str, None]沒有一個unescapedQuoteHandling可選str沒有一個 →DataFrame

加載CSV文件並將結果返回為DataFrame

如果,此函數將遍曆輸入一次以確定輸入模式inferSchema啟用。為了避免一次遍曆整個數據,請禁用inferSchema選項或使用顯式地指定模式模式

參數
路徑 STR或list

字符串,或字符串列表,用於輸入路徑,或存儲CSV行的字符串的RDD。

模式 pyspark.sql.types.StructType或者str,可選

一個可選的pyspark.sql.types.StructType用於輸入模式或ddl格式的字符串(例如col0INT,col1).

其他參數
額外的選項

有關其他選項,請參閱數據源選項在你使用的版本中。

例子

>>>df火花csv“python / test_support / sql / ages.csv”>>>dfdtypes[('_c0', 'string'), ('_c1', 'string')]>>>抽樣sc文本文件“python / test_support / sql / ages.csv”>>>df2火花csv抽樣>>>df2dtypes[('_c0', 'string'), ('_c1', 'string')]