pyspark.sql.DataFrame.transform

DataFrame。 變換 ( 函數:可調用的[[…],DataFrame],*arg遊戲:任何,* *kwargs:任何 )→pyspark.sql.dataframe.DataFrame

返回一個新的DataFrame。簡潔的語法鏈接自定義轉換。

參數
函數 函數

一個函數,並返回一個DataFrame

* args

位置參數傳遞給函數。

* * kwargs

關鍵字參數傳遞給函數。

例子

> > >pyspark.sql.functions進口上校> > >df=火花createDataFrame(((1,1.0),(2,2.0)),(“int”,“浮動”])> > >defcast_all_to_int(input_df):返回input_df選擇([上校(col_name)(“int”)col_nameinput_df])> > >defsort_columns_asc(input_df):返回input_df選擇(*排序(input_df))> > >df變換(cast_all_to_int)變換(sort_columns_asc)顯示()+ - - - + - - - +| | int |浮動+ - - - + - - - +| 1 | 1 || 2 | 2 |+ - - - + - - - +> > >defadd_n(input_df,n):返回input_df選擇(((上校(col_name)+n)別名(col_name)col_nameinput_df])> > >df變換(add_n,1)變換(add_n,n=10)顯示()+ - - - + - - - +int | | |浮動+ - - - + - - - +12 | | 12.0 |13 | | 13.0 |+ - - - + - - - +