pyspark.pandas.Series.quantile¶
-
係列。
分位數
( 問:聯盟(浮動,Iterable(浮動]]=0.5,精度:int=10000年 )→聯盟(整數、浮點數、保齡球、str字節,小數。十進製、datetime。日期,日期時間。datetime,沒有,pyspark.pandas.series.Series]¶ -
返回值在給定的分位數。
請注意
不像大熊貓,pandas-on-Spark是一個近似的分位數分位數基於近似計算分位數百分比計算,因為在一個大型數據集是非常昂貴的。
- 參數
-
- 問 浮動或數組類,默認0.5(50%分位數)
-
0 < = q < = 1,分位數(s)來計算。
- 精度 int,可選
-
默認的近似精度。大的值意味著更好的精度。相對誤差可以推導出由1.0 /準確性。
- 返回
-
- 浮動或係列
-
如果當前的對象是一個係列
問
是一個數組,返回一係列指數在哪裏嗎問
和分位數的值,否則將返回一個浮點數。
例子
> > >年代=ps。係列([1,2,3,4,5])> > >年代。分位數(5)3.0
> > >(年代+1)。分位數(5)4.0
> > >年代。分位數([二十五分,5,綜合成績])0.25 - 2.00.50 - 3.00.75 - 4.0dtype: float64
> > >(年代+1)。分位數([二十五分,5,綜合成績])0.25 - 3.00.50 - 4.00.75 - 5.0dtype: float64