pyspark.sql.functions.count_distinct

pyspark.sql.functions。 count_distinct ( 上校:ColumnOrName,*關口:ColumnOrName )→pyspark.sql.column.Column

返回一個新的對於不同的數上校關口

例子

> > >dfgg(count_distinct(df年齡,df的名字)別名(“c”))收集()(行(c = 2))
> > >dfgg(count_distinct(“年齡”,“名稱”)別名(“c”))收集()(行(c = 2))