pyspark.pandas.DataFrame.dropna

DataFrame。 dropna ( :聯盟(int,str]=0,如何:str=“任何”,:可選(int]=沒有一個,子集:聯盟(任何元組(,…),列表(聯盟[任何元組[,…]]],沒有)=沒有一個,原地:bool= )→可選(pyspark.pandas.frame.DataFrame]

刪除缺失值。

參數
{0或“指數”},默認為0

確定刪除行或列含有缺失值。

  • 0,或者“指數”:含有缺失值的行。

如何 {'任何','所有'},默認“任何”

從DataFrame確定刪除行或列,當我們有至少一個NA NA或全部。

  • “任何”:如果任何NA值存在,刪除行或列。

  • “所有”:如果所有值NA,下降這一行或一列。

int,可選

要求許多non-NA值。

子集 數組類,可選

標簽以及其他軸考慮,例如如果你放棄行這些將列的列表包括。

原地 bool,默認的錯誤

如果這是真的,做原地操作並返回None。

返回
DataFrame

與NA DataFrame條目了。

另請參閱

DataFrame.drop

從列指定的標簽。

DataFrame.isnull

顯示缺失值。

DataFrame.notnull

顯示現有的(non-missing)值。

例子

> > >df=psDataFrame({“名稱”:(“阿爾弗雷德”,“蝙蝠俠”,“貓女”),“玩具”:(沒有一個,“蝙蝠俠”,“牛鞭”),“生”:(沒有一個,“1940-04-25”,沒有一個)},=(“名字”,“玩具”,“生”])> > >df名字玩具出生0阿爾弗雷德沒有沒有1蝙蝠俠蝙蝠車1940-04-252貓女牛鞭沒有

刪除行,至少有一個元素是失蹤。

> > >dfdropna()名字玩具出生1蝙蝠俠蝙蝠車1940-04-25

刪除列,至少有一個元素是失蹤。

> > >dfdropna(=“列”)的名字0阿爾弗雷德1蝙蝠俠2貓女

刪除行,所有元素都不見了。

> > >dfdropna(如何=“所有”)名字玩具出生0阿爾弗雷德沒有沒有1蝙蝠俠蝙蝠車1940-04-252貓女牛鞭沒有

隻保留使用至少2 non-NA值的行。

> > >dfdropna(=2)名字玩具出生1蝙蝠俠蝙蝠車1940-04-252貓女牛鞭沒有

尋找失蹤的值定義的列。

> > >dfdropna(子集=(“名字”,“生”])名字玩具出生1蝙蝠俠蝙蝠車1940-04-25

保持DataFrame憑有效條目在同一個變量。

> > >dfdropna(原地=真正的)> > >df名字玩具出生1蝙蝠俠蝙蝠車1940-04-25