pyspark.pandas.DataFrame.dropna¶
-
DataFrame。
dropna
( 軸:聯盟(int,str]=0,如何:str=“任何”,打:可選(int]=沒有一個,子集:聯盟(任何元組(,…),列表(聯盟[任何元組[,…]]],沒有)=沒有一個,原地:bool=假 )→可選(pyspark.pandas.frame.DataFrame] ¶ -
刪除缺失值。
- 參數
-
- 軸 {0或“指數”},默認為0
-
確定刪除行或列含有缺失值。
0,或者“指數”:含有缺失值的行。
- 如何 {'任何','所有'},默認“任何”
-
從DataFrame確定刪除行或列,當我們有至少一個NA NA或全部。
“任何”:如果任何NA值存在,刪除行或列。
“所有”:如果所有值NA,下降這一行或一列。
- 打 int,可選
-
要求許多non-NA值。
- 子集 數組類,可選
-
標簽以及其他軸考慮,例如如果你放棄行這些將列的列表包括。
- 原地 bool,默認的錯誤
-
如果這是真的,做原地操作並返回None。
- 返回
-
- DataFrame
-
與NA DataFrame條目了。
另請參閱
-
DataFrame.drop
-
從列指定的標簽。
-
DataFrame.isnull
-
顯示缺失值。
-
DataFrame.notnull
-
顯示現有的(non-missing)值。
例子
> > >df=ps。DataFrame({“名稱”:(“阿爾弗雷德”,“蝙蝠俠”,“貓女”),…“玩具”:(沒有一個,“蝙蝠俠”,“牛鞭”),…“生”:(沒有一個,“1940-04-25”,沒有一個)},…列=(“名字”,“玩具”,“生”])> > >df名字玩具出生0阿爾弗雷德沒有沒有1蝙蝠俠蝙蝠車1940-04-252貓女牛鞭沒有
刪除行,至少有一個元素是失蹤。
> > >df。dropna()名字玩具出生1蝙蝠俠蝙蝠車1940-04-25
刪除列,至少有一個元素是失蹤。
> > >df。dropna(軸=“列”)的名字0阿爾弗雷德1蝙蝠俠2貓女
刪除行,所有元素都不見了。
> > >df。dropna(如何=“所有”)名字玩具出生0阿爾弗雷德沒有沒有1蝙蝠俠蝙蝠車1940-04-252貓女牛鞭沒有
隻保留使用至少2 non-NA值的行。
> > >df。dropna(打=2)名字玩具出生1蝙蝠俠蝙蝠車1940-04-252貓女牛鞭沒有
尋找失蹤的值定義的列。
> > >df。dropna(子集=(“名字”,“生”])名字玩具出生1蝙蝠俠蝙蝠車1940-04-25
保持DataFrame憑有效條目在同一個變量。
> > >df。dropna(原地=真正的)> > >df名字玩具出生1蝙蝠俠蝙蝠車1940-04-25