pyspark.pandas.Series.median

係列。 中位數 ( :聯盟(int, str,沒有)=沒有一個,skipna:bool=真正的,numeric_only:bool=沒有一個,精度:int=10000年 )→聯盟(整數、浮點數、保齡球、str字節,小數。十進製、datetime。日期,日期時間。datetime,沒有一個係列)

返回所請求的軸的值的中值。

請注意

不像大熊貓,中位數在pandas-on-Spark近似基於中值近似百分比計算,因為計算值在一個大型數據集非常昂貴。

參數
{指數(0),列(1)}

軸的功能應用。

skipna bool,默認的真

排除NA / null值,當計算結果。

支持包括NA / null值。

numeric_only bool,默認沒有

隻包括浮動,int,布爾列。錯誤的不支持。這個參數主要是熊貓兼容性。

精度 int,可選

默認的近似精度。大的值意味著更好的精度。相對誤差可以推導出由1.0 /準確性。

返回
中位數 標量或係列

例子

> > >df=psDataFrame({“一個”:(24。,21。,25。,33。,26歲。),“b”:(1,2,3,4,5)},=(“一個”,“b”])> > >df一個b0 24.0 - 11 21.0 - 22 25.0 - 33 33.0 - 44 26.0 - 5

DataFrame:

> > >df中位數()25.0b 3.0dtype: float64

在一個係列:

> > >df(“一個”]中位數()25.0> > >(df(“b”]+One hundred.)中位數()103.0

多索引的列,

> > >df=pdMultiIndexfrom_tuples(((“x”,“一個”),(“y”,“b”)))> > >dfx y一個b0 24.0 - 11 21.0 - 22 25.0 - 33 33.0 - 44 26.0 - 5

DataFrame:

> > >df中位數()x 25.0y b 3.0dtype: float64
> > >df中位數(=1)0 12.51 11.52 14.03 18.54 15.5dtype: float64

在一個係列:

> > >df((“x”,“一個”)]中位數()25.0> > >(df((“y”,“b”)]+One hundred.)中位數()103.0