pyspark.pandas.Series.quantile

係列。 分位數 ( :聯盟(浮動,Iterable(浮動]]=0.5,精度:int=10000年 )→聯盟(整數、浮點數、保齡球、str字節,小數。十進製、datetime。日期,日期時間。datetime,沒有,pyspark.pandas.series.Series]

返回值在給定的分位數。

請注意

不像大熊貓,pandas-on-Spark是一個近似的分位數分位數基於近似計算分位數百分比計算,因為在一個大型數據集是非常昂貴的。

參數
浮動或數組類,默認0.5(50%分位數)

0 < = q < = 1,分位數(s)來計算。

精度 int,可選

默認的近似精度。大的值意味著更好的精度。相對誤差可以推導出由1.0 /準確性。

返回
浮動或係列

如果當前的對象是一個係列是一個數組,返回一係列指數在哪裏嗎和分位數的值,否則將返回一個浮點數。

例子

> > >年代=ps係列([1,2,3,4,5])> > >年代分位數(5)3.0
> > >(年代+1)分位數(5)4.0
> > >年代分位數([二十五分,5,綜合成績])0.25 - 2.00.50 - 3.00.75 - 4.0dtype: float64
> > >(年代+1)分位數([二十五分,5,綜合成績])0.25 - 3.00.50 - 4.00.75 - 5.0dtype: float64