pyspark.sql.functions.array_distinct¶

pyspark.sql.functions。 array_distinct ( 上校:ColumnOrName )→pyspark.sql.column.Column¶

收藏功能:數組中重複的值。

參數

上校 列或str: 的名字列或表達式

例子

           > > >df=火花。createDataFrame((((1,2,3,2),),([4,5,5,4),),(“數據”])> > >df。選擇(array_distinct(df。數據))。收集()行(array_distinct(數據)=[1,2,3])、行(array_distinct(數據)= (4、5)))
          

以前的

pyspark.sql.functions.array_remove

下一個

pyspark.sql.functions.array_intersect