KernelDensity

pyspark.mllib.stat。 KernelDensity

估計概率密度在需要點給定樣本人口的抽樣。

例子

> > >kd=KernelDensity()> > >樣本=sc並行化([0.0,1.0])> > >kdsetSample(樣本)> > >kd估計([0.0,1.0])陣列([0.12938758,0.12938758])

方法

估計(分)

估計概率密度點

setBandwidth(帶寬)

設置每個樣本的帶寬。

setSample(樣本)

設置采樣點的數量。

方法的文檔

估計 ( :Iterable(浮動] )→numpy.ndarray

估計概率密度點

setBandwidth ( 帶寬:浮動 )→沒有

設置每個樣本的帶寬。默認為1.0

setSample ( 樣本:pyspark.rdd.RDD(浮動] )→沒有

設置采樣點的數量。應該是一個抽樣