pyspark.pandas.DataFrame.truncate

DataFrame。 截斷 ( 之前:可選(任何]=沒有一個,:可選(任何]=沒有一個,:聯盟(int, str,沒有)=沒有一個,複製:bool=真正的 )→聯盟(DataFrame,係列]

截斷或一係列DataFrame之前和之後的一些索引值。

這是一個有用的簡稱布爾索引基於索引值高於或低於一定的閾值。

請注意

這個API是依賴Index.is_monotonic_increasing ()它可以是昂貴的。

參數
之前 日期、str int

截斷所有行之前這個索引值。

日期、str int

這個索引值後截斷所有行。

{0或“指數”,或“列”},可選的

軸截斷。默認索引截斷(行)。

複製 bool,默認是正確的,

返回一個副本截斷部分。

返回
類型的調用者

截斷係列或DataFrame。

另請參閱

DataFrame.loc

選擇一個子集DataFrame的標簽。

DataFrame.iloc

選擇一個子集DataFrame的位置。

例子

> > >df=psDataFrame({“一個”:(“一個”,“b”,“c”,' d ',“e”),“B”:(“f”,‘g’,“h”,“我”,“j”),“C”:(“k”,“l”,“米”,“n”,“o”)},指數=(1,2,3,4,5])> > >dfA B C1 f k2 b g l3 c h m4 d i n5 e j o
> > >df截斷(之前=2,=4)A B C2 b g l3 c h m4 d i n

DataFrame的列可以被截斷。

> > >df截斷(之前=“一個”,=“B”,=“列”)一個B1 f2 b g3 c h4 d我5 e j

係列,隻有行可以截斷。

> > >df(“一個”]截斷(之前=2,=4)2 b3 c4 d名稱:dtype:對象

一係列指數排序的整數。

> > >年代=ps係列([10,20.,30.,40,50,60,70年),指數=(1,2,3,4,5,6,7])> > >年代1 102 203 304個405 506 6070年7dtype: int64
> > >年代截斷(2,5)2 203 304個405 50dtype: int64

一係列指數排序字符串。

> > >年代=ps係列([10,20.,30.,40,50,60,70年),指數=(“一個”,“b”,“c”,' d ',“e”,“f”,‘g’])> > >年代一個10b 20c 30d 40e 50f 60g 70dtype: int64
> > >年代截斷(“b”,“e”)b 20c 30d 40e 50dtype: int64