pyspark.pandas.DataFrame.truncate¶

DataFrame。 截斷 ( 之前:可選(任何]=沒有一個,後:可選(任何]=沒有一個,軸:聯盟(int, str,沒有)=沒有一個,複製:bool=真正的 )→聯盟(DataFrame,係列] ¶

截斷或一係列DataFrame之前和之後的一些索引值。

這是一個有用的簡稱布爾索引基於索引值高於或低於一定的閾值。

請注意

這個API是依賴Index.is_monotonic_increasing ()它可以是昂貴的。

參數

之前日期、str int: 截斷所有行之前這個索引值。
後日期、str int: 這個索引值後截斷所有行。
軸 {0或“指數”,或“列”},可選的: 軸截斷。默認索引截斷(行)。
複製 bool,默認是正確的,: 返回一個副本截斷部分。

返回

類型的調用者: 截斷係列或DataFrame。

另請參閱

DataFrame.loc: 選擇一個子集DataFrame的標簽。
DataFrame.iloc: 選擇一個子集DataFrame的位置。

例子

           > > >df=ps。DataFrame({“一個”:(“一個”,“b”,“c”,' d ',“e”),…“B”:(“f”,‘g’,“h”,“我”,“j”),…“C”:(“k”,“l”,“米”,“n”,“o”)},…指數=(1,2,3,4,5])> > >dfA B C1 f k2 b g l3 c h m4 d i n5 e j o
          

           > > >df。截斷(之前=2,後=4)A B C2 b g l3 c h m4 d i n
          

DataFrame的列可以被截斷。

           > > >df。截斷(之前=“一個”,後=“B”,軸=“列”)一個B1 f2 b g3 c h4 d我5 e j
          

係列,隻有行可以截斷。

           > > >df(“一個”]。截斷(之前=2,後=4)2 b3 c4 d名稱:dtype:對象
          

一係列指數排序的整數。

           > > >年代=ps。係列([10,20.,30.,40,50,60,70年),…指數=(1,2,3,4,5,6,7])> > >年代1 102 203 304個405 506 6070年7dtype: int64
          

           > > >年代。截斷(2,5)2 203 304個405 50dtype: int64
          

一係列指數排序字符串。

           > > >年代=ps。係列([10,20.,30.,40,50,60,70年),…指數=(“一個”,“b”,“c”,' d ',“e”,“f”,‘g’])> > >年代一個10b 20c 30d 40e 50f 60g 70dtype: int64
          

           > > >年代。截斷(“b”,“e”)b 20c 30d 40e 50dtype: int64
          

以前的

pyspark.pandas.DataFrame.sample

下一個

pyspark.pandas.DataFrame.backfill