pyspark.sql.functions.schema_of_csv

pyspark.sql.functions。 schema_of_csv ( csv:ColumnOrName,選項:可選(Dict(str,str]]=沒有一個 )→pyspark.sql.column.Column

解析CSV格式字符串並推斷其模式DDL。

參數
csv 或str

CSV字符串或一個可折疊的字符串列包含一個CSV字符串。

選項 東西,可選

選項來控製解析。接受相同的選項CSV數據源。看到數據源的選擇在你使用的版本。

例子

> > >df=火花範圍(1)> > >df選擇(schema_of_csv(點燃(‘1 |),{“9”:“|”})別名(“csv”))收集()行(csv = ' STRUCT < _c0: INT, _c1: STRING > '))> > >df選擇(schema_of_csv(‘1 |,{“9”:“|”})別名(“csv”))收集()行(csv = ' STRUCT < _c0: INT, _c1: STRING > '))