pyspark.pandas.DataFrame.where¶
-
DataFrame。
在哪裏
( 氣孔導度:聯盟(DataFrame,係列],其他:聯盟(DataFrame,係列,任何]=南,軸:聯盟(int,str]=沒有一個 )→DataFrame¶ -
替換值的條件是錯誤的。
- 參數
-
- 氣孔導度 布爾DataFrame
-
電導率是真的,保持原來的值。從其他錯誤,替換為相應的價值。
- 其他 標量,DataFrame
-
條目,氣孔導度是假從其他替換為相應的價值。
- 軸 int,默認沒有
-
目前隻能設置為0,與熊貓的兼容性。
- 返回
-
- DataFrame
例子
> > >從pyspark.pandas.config進口set_option,reset_option> > >set_option(“compute.ops_on_diff_frames”,真正的)> > >df1=ps。DataFrame({“一個”:(0,1,2,3,4),“B”:【One hundred.,200年,300年,400年,500年]})> > >df2=ps。DataFrame({“一個”:(0,- - - - - -1,- - - - - -2,- - - - - -3,- - - - - -4),“B”:【- - - - - -One hundred.,- - - - - -200年,- - - - - -300年,- - - - - -400年,- - - - - -500年]})> > >df1一個B0 0 1001 1 2002 2 3003 4004 4 500> > >df2一個B0 0 -1001 1 -2002 2 -3003 -4004 4 -500
> > >df1。在哪裏(df1>0)。sort_index()一個B0南100.01)1.0 - 200.02 2.0 - 300.03 3.0 - 400.04 4.0 - 500.0
> > >df1。在哪裏(df1>1,10)。sort_index()一個B0 10 1001 2002 2 3003 4004 4 500
> > >df1。在哪裏(df1>1,df1+One hundred.)。sort_index()一個B0 100 1001 101 2002 2 3003 4004 4 500
> > >df1。在哪裏(df1>1,df2)。sort_index()一個B0 0 1001 1 2002 2 3003 4004 4 500
當氣孔導度的列名不同於自我,對待所有的值都是虛假的
> > >氣孔導度=ps。DataFrame({“C”:(0,- - - - - -1,- - - - - -2,- - - - - -3,- - - - - -4),' D ':【4,3,2,1,0]})%3= =0> > >氣孔導度C D0真的假1假真2假假3真正的假4虛假的真
> > >df1。在哪裏(氣孔導度)。sort_index()一個B0南南1南南2南南3南南4南南
係列電導率的類型時,它檢查布爾無論列名
> > >氣孔導度=ps。係列([1,2])>1> > >氣孔導度0錯誤1真正的dtype: bool
> > >df1。在哪裏(氣孔導度)。sort_index()一個B0南南1)1.0 - 200.02南南3南南4南南
> > >reset_option(“compute.ops_on_diff_frames”)