pyspark.pandas.DataFrame.where

DataFrame。 在哪裏 ( 氣孔導度:聯盟(DataFrame,係列],其他:聯盟(DataFrame,係列,任何]=,:聯盟(int,str]=沒有一個 )→DataFrame

替換值的條件是錯誤的。

參數
氣孔導度 布爾DataFrame

電導率是真的,保持原來的值。從其他錯誤,替換為相應的價值。

其他 標量,DataFrame

條目,氣孔導度是假從其他替換為相應的價值。

int,默認沒有

目前隻能設置為0,與熊貓的兼容性。

返回
DataFrame

例子

> > >pyspark.pandas.config進口set_option,reset_option> > >set_option(“compute.ops_on_diff_frames”,真正的)> > >df1=psDataFrame({“一個”:(0,1,2,3,4),“B”:【One hundred.,200年,300年,400年,500年]})> > >df2=psDataFrame({“一個”:(0,- - - - - -1,- - - - - -2,- - - - - -3,- - - - - -4),“B”:【- - - - - -One hundred.,- - - - - -200年,- - - - - -300年,- - - - - -400年,- - - - - -500年]})> > >df1一個B0 0 1001 1 2002 2 3003 4004 4 500> > >df2一個B0 0 -1001 1 -2002 2 -3003 -4004 4 -500
> > >df1在哪裏(df1>0)sort_index()一個B0南100.01)1.0 - 200.02 2.0 - 300.03 3.0 - 400.04 4.0 - 500.0
> > >df1在哪裏(df1>1,10)sort_index()一個B0 10 1001 2002 2 3003 4004 4 500
> > >df1在哪裏(df1>1,df1+One hundred.)sort_index()一個B0 100 1001 101 2002 2 3003 4004 4 500
> > >df1在哪裏(df1>1,df2)sort_index()一個B0 0 1001 1 2002 2 3003 4004 4 500

當氣孔導度的列名不同於自我,對待所有的值都是虛假的

> > >氣孔導度=psDataFrame({“C”:(0,- - - - - -1,- - - - - -2,- - - - - -3,- - - - - -4),' D ':【4,3,2,1,0]})%3= =0> > >氣孔導度C D0真的假1假真2假假3真正的假4虛假的真
> > >df1在哪裏(氣孔導度)sort_index()一個B0南南1南南2南南3南南4南南

係列電導率的類型時,它檢查布爾無論列名

> > >氣孔導度=ps係列([1,2])>1> > >氣孔導度0錯誤1真正的dtype: bool
> > >df1在哪裏(氣孔導度)sort_index()一個B0南南1)1.0 - 200.02南南3南南4南南
> > >reset_option(“compute.ops_on_diff_frames”)