pyspark.sql.functions。
array_distinct
收藏功能:數組中重複的值。
列
的名字列或表達式
例子
> > >df=火花。createDataFrame((((1,2,3,2),),([4,5,5,4),),(“數據”])> > >df。選擇(array_distinct(df。數據))。收集()行(array_distinct(數據)=[1,2,3])、行(array_distinct(數據)= (4、5)))
以前的
pyspark.sql.functions.array_remove
下一個
pyspark.sql.functions.array_intersect