pyspark.pandas.DataFrame.drop

DataFrame。 下降 ( 標簽:聯盟(任何元組(,…),列表(聯盟[任何元組[,…]]],沒有)=沒有一個,:聯盟(int, str,沒有)=0,指數:聯盟(任何元組(,…),列表(聯盟[任何元組[,…]]]]=沒有一個,:聯盟(任何元組(,…),列表(聯盟[任何元組[,…]]]]=沒有一個 )→pyspark.pandas.frame.DataFrame

從列指定的標簽。

刪除行和/或列通過指定標簽名稱和對應的軸,或直接通過指定索引和/或列名。下降的行MultiIndex DataFrame還不支持。

參數
標簽 單一的標簽或類似

列標簽。

{0或“指數”,或“列”},默認為0

設置默認下降指數。

指數 單一的標簽或類似

選擇指定軸(標簽,軸= 0是quivalent=列建立索引)。

添加刪除行“指數”。

單一的標簽或類似

選擇指定軸(標簽,軸= 1相當於列=標簽)。

返回
下降了 DataFrame

另請參閱

Series.dropna

筆記

目前,放棄行MultiIndex DataFrame還不支持。

例子

> > >df=psDataFrame(np不等(12)重塑(3,4),=(“一個”,“B”,“C”,' D '])> > >dfA B C D0 0 1 2 31 4 5 6 72 8 9 10 11

刪除列

> > >df下降([“B”,“C”),=1)D0 0 31 4 72 8 11
> > >df下降(=(“B”,“C”])D0 0 31 4 72 8 11

通過指數連續下降

> > >df下降([0,1])A B C D2 8 9 10 11
> > >df下降(指數=(0,1),=“一個”)B C D2 9 10 11

也支持MultiIndex刪除列

> > >df=psDataFrame({“x”:(1,2),“y”:(3,4),“z”:(5,6),' w ':(7,8)},=(“x”,“y”,“z”,' w '])> > >=((“一個”,“x”),(“一個”,“y”),(“b”,“z”),(“b”,' w ')]> > >df=pdMultiIndexfrom_tuples()> > >df一個bx y z w0 1 3 5 71 2 4 6 8> > >df下降(標簽=“一個”,=1)bz w0 5 71 6 8