pyspark.sql.functions.count_distinct¶

pyspark.sql.functions。 count_distinct ( 上校:ColumnOrName,*關口:ColumnOrName )→pyspark.sql.column.Column¶

返回一個新的列對於不同的數上校或關口。

例子

           > > >df。gg(count_distinct(df。年齡,df。的名字)。別名(“c”))。收集()(行(c = 2))
          

           > > >df。gg(count_distinct(“年齡”,“名稱”)。別名(“c”))。收集()(行(c = 2))
          

以前的

pyspark.sql.functions.count

下一個

pyspark.sql.functions.countDistinct