pyspark.sql.functions.array_distinct

pyspark.sql.functions。 array_distinct ( 上校:ColumnOrName )→pyspark.sql.column.Column

收藏功能:數組中重複的值。

參數
上校 或str

的名字列或表達式

例子

> > >df=火花createDataFrame((((1,2,3,2),),([4,5,5,4),),(“數據”])> > >df選擇(array_distinct(df數據))收集()行(array_distinct(數據)=[1,2,3])、行(array_distinct(數據)= (4、5)))