pyspark.sql.functions.array_union

pyspark.sql.functions。 array_union ( col1:ColumnOrName,col2:ColumnOrName )→pyspark.sql.column.Column

收藏功能:返回一個數組元素的col1和col2的聯盟,沒有重複。

參數
col1 或str

列的名稱包含數組

col2 或str

列的名稱包含數組

例子

> > >pyspark.sql進口> > >df=火花createDataFrame([(c1=(“b”,“一個”,“c”),c2=(“c”,“d”,“一個”,“f”))))> > >df選擇(array_union(dfc1,dfc2))收集()行(array_union (c1, c2) = [' b ', ' ', ' c ', ' d ', ' f ']))