pyspark.sql.avro.functions.to_avro¶
-
pyspark.sql.avro.functions。
to_avro
( 數據:ColumnOrName,jsonFormatSchema:str=” )→pyspark.sql.column.Column¶ -
avro列轉換成二進製格式。
- 參數
-
-
數據
列
或str -
列的數據。
- jsonFormatSchema str,可選
-
指定輸出avro JSON字符串格式的模式。
-
數據
筆記
Avro內置,但因為火花2.4外部數據源模塊。請部署應用程序的部署部分按“Apache Avro數據源向導”。
例子
> > >從pyspark.sql進口行> > >從pyspark.sql.avro.functions進口to_avro> > >數據=(“黑桃”]> > >df=火花。createDataFrame(數據,“字符串”)> > >df。選擇(to_avro(df。價值)。別名(“套房”))。收集()(套件=[行中bytearray (b \ x00 \ x0cSPADES)))
> > >jsonFormatSchema=”(“空”,{“類型”:“枚舉”,“名字”:“價值”,…“符號”:[“黑桃”、“心”、“鑽石”、“俱樂部”)})”> > >df。選擇(to_avro(df。價值,jsonFormatSchema)。別名(“套房”))。收集()(套件=[行中bytearray (b \ x02 \ x00)))