pyspark.sql.avro.functions.to_avro

pyspark.sql.avro.functions。 to_avro ( 數據:ColumnOrName,jsonFormatSchema:str= )→pyspark.sql.column.Column

avro列轉換成二進製格式。

參數
數據 或str

列的數據。

jsonFormatSchema str,可選

指定輸出avro JSON字符串格式的模式。

筆記

Avro內置,但因為火花2.4外部數據源模塊。請部署應用程序的部署部分按“Apache Avro數據源向導”。

例子

> > >pyspark.sql進口> > >pyspark.sql.avro.functions進口to_avro> > >數據=(“黑桃”]> > >df=火花createDataFrame(數據,“字符串”)> > >df選擇(to_avro(df價值)別名(“套房”))收集()(套件=[行中bytearray (b \ x00 \ x0cSPADES)))
> > >jsonFormatSchema=”(“空”,{“類型”:“枚舉”,“名字”:“價值”,“符號”:[“黑桃”、“心”、“鑽石”、“俱樂部”)})”> > >df選擇(to_avro(df價值,jsonFormatSchema)別名(“套房”))收集()(套件=[行中bytearray (b \ x02 \ x00)))