pyspark.pandas.DataFrame.pipe¶
-
DataFrame。
管
( 函數:可調用的[[…],任何),*arg遊戲:任何,* *kwargs:任何 )→任何¶ -
應用函數(自我,* args, * * kwargs)。
- 參數
-
- 函數 函數
-
函數適用於DataFrame。
arg遊戲
,kwargs
傳遞給函數
。另外一個(可調用的,data_keyword)
元組,data_keyword
是一個字符串顯示關鍵字的可調用的
預計DataFrames。 - arg遊戲 iterable,可選
-
位置參數傳遞給
函數
。 - kwargs 映射,可選
-
字典的關鍵字參數傳入
函數
。
- 返回
-
-
對象
的返回類型
函數
。
-
對象
的返回類型
筆記
使用
.pipe
當鏈接在一起的功能期待係列,DataFrames或GroupBy對象。例如,給定> > >df=ps。DataFrame({“類別”:(“一個”,“一個”,“B”),…“col1”:(1,2,3),…“col2”:(4,5,6)},…列=(“類別”,“col1”,“col2”])> > >defkeep_category_a(df):…返回df(df(“類別”]= =“一個”]> > >defadd_one(df,列):…返回df。分配(col3=df(列]+1)> > >def乘(df,column1,column2):…返回df。分配(col4=df(column1]*df(column2])
而不是寫
> > >乘(add_one(keep_category_a(df),列=“col1”),column1=“col2”,column2=“col3”)col1 col2 col3 col4類別0 1 2 4 81 2 5 3 15
你可以寫
> > >(df。管(keep_category_a)…。管(add_one,列=“col1”)…。管(乘,column1=“col2”,column2=“col3”)…)col1 col2 col3 col4類別0 1 2 4 81 2 5 3 15
如果你有一個函數,將數據作為第二個參數(說),通過一個元組表示關鍵字預計數據。例如,假設
f
以數據為df
:> > >defmultiply_2(column1,df,column2):…返回df。分配(col4=df(column1]*df(column2])
然後你可以寫
> > >(df。管(keep_category_a)…。管(add_one,列=“col1”)…。管((multiply_2,“df”),column1=“col2”,column2=“col3”)…)col1 col2 col3 col4類別0 1 2 4 81 2 5 3 15
您可以使用lambda逢
> > >ps。係列([1,2,3])。管(λx:(x+1)。重命名(“價值”))0 21 32 4名稱:價值,dtype: int64