pyspark.sql.functions.approx_count_distinct¶

pyspark.sql.functions。 approx_count_distinct ( 上校:ColumnOrName,標準偏差:可選(浮動]=沒有一個 )→pyspark.sql.column.Column¶

聚合函數:返回一個新的列近似不同的列數上校。

參數

例子

           > > >df。gg(approx_count_distinct(df。年齡)。別名(“distinct_ages”))。收集()(行(distinct_ages = 2))
          

以前的

pyspark.sql.functions.approxCountDistinct

下一個

pyspark.sql.functions.avg