pyspark.pandas.Series.median¶
-
係列。
中位數
( 軸:聯盟(int, str,沒有)=沒有一個,skipna:bool=真正的,numeric_only:bool=沒有一個,精度:int=10000年 )→聯盟(整數、浮點數、保齡球、str字節,小數。十進製、datetime。日期,日期時間。datetime,沒有一個係列)¶ -
返回所請求的軸的值的中值。
請注意
不像大熊貓,中位數在pandas-on-Spark近似基於中值近似百分比計算,因為計算值在一個大型數據集非常昂貴。
- 參數
-
- 軸 {指數(0),列(1)}
-
軸的功能應用。
- skipna bool,默認的真
-
排除NA / null值,當計算結果。
支持包括NA / null值。
- numeric_only bool,默認沒有
-
隻包括浮動,int,布爾列。錯誤的不支持。這個參數主要是熊貓兼容性。
- 精度 int,可選
-
默認的近似精度。大的值意味著更好的精度。相對誤差可以推導出由1.0 /準確性。
- 返回
-
- 中位數 標量或係列
例子
> > >df=ps。DataFrame({…“一個”:(24。,21。,25。,33。,26歲。),“b”:(1,2,3,4,5)},列=(“一個”,“b”])> > >df一個b0 24.0 - 11 21.0 - 22 25.0 - 33 33.0 - 44 26.0 - 5
DataFrame:
> > >df。中位數()25.0b 3.0dtype: float64
在一個係列:
> > >df(“一個”]。中位數()25.0> > >(df(“b”]+One hundred.)。中位數()103.0
多索引的列,
> > >df。列=pd。MultiIndex。from_tuples(((“x”,“一個”),(“y”,“b”)))> > >dfx y一個b0 24.0 - 11 21.0 - 22 25.0 - 33 33.0 - 44 26.0 - 5
DataFrame:
> > >df。中位數()x 25.0y b 3.0dtype: float64
> > >df。中位數(軸=1)0 12.51 11.52 14.03 18.54 15.5dtype: float64
在一個係列:
> > >df((“x”,“一個”)]。中位數()25.0> > >(df((“y”,“b”)]+One hundred.)。中位數()103.0