pyspark.pandas.DataFrame.truncate¶
-
DataFrame。
截斷
( 之前:可選(任何]=沒有一個,後:可選(任何]=沒有一個,軸:聯盟(int, str,沒有)=沒有一個,複製:bool=真正的 )→聯盟(DataFrame,係列] ¶ -
截斷或一係列DataFrame之前和之後的一些索引值。
這是一個有用的簡稱布爾索引基於索引值高於或低於一定的閾值。
請注意
這個API是依賴
Index.is_monotonic_increasing ()
它可以是昂貴的。- 參數
-
- 之前 日期、str int
-
截斷所有行之前這個索引值。
- 後 日期、str int
-
這個索引值後截斷所有行。
- 軸 {0或“指數”,或“列”},可選的
-
軸截斷。默認索引截斷(行)。
- 複製 bool,默認是正確的,
-
返回一個副本截斷部分。
- 返回
-
- 類型的調用者
-
截斷係列或DataFrame。
另請參閱
-
DataFrame.loc
-
選擇一個子集DataFrame的標簽。
-
DataFrame.iloc
-
選擇一個子集DataFrame的位置。
例子
> > >df=ps。DataFrame({“一個”:(“一個”,“b”,“c”,' d ',“e”),…“B”:(“f”,‘g’,“h”,“我”,“j”),…“C”:(“k”,“l”,“米”,“n”,“o”)},…指數=(1,2,3,4,5])> > >dfA B C1 f k2 b g l3 c h m4 d i n5 e j o
> > >df。截斷(之前=2,後=4)A B C2 b g l3 c h m4 d i n
DataFrame的列可以被截斷。
> > >df。截斷(之前=“一個”,後=“B”,軸=“列”)一個B1 f2 b g3 c h4 d我5 e j
係列,隻有行可以截斷。
> > >df(“一個”]。截斷(之前=2,後=4)2 b3 c4 d名稱:dtype:對象
一係列指數排序的整數。
> > >年代=ps。係列([10,20.,30.,40,50,60,70年),…指數=(1,2,3,4,5,6,7])> > >年代1 102 203 304個405 506 6070年7dtype: int64
> > >年代。截斷(2,5)2 203 304個405 50dtype: int64
一係列指數排序字符串。
> > >年代=ps。係列([10,20.,30.,40,50,60,70年),…指數=(“一個”,“b”,“c”,' d ',“e”,“f”,‘g’])> > >年代一個10b 20c 30d 40e 50f 60g 70dtype: int64
> > >年代。截斷(“b”,“e”)b 20c 30d 40e 50dtype: int64