pyspark.sql.functions.array_intersect

pyspark.sql.functions。 array_intersect ( col1:ColumnOrName,col2:ColumnOrName )→pyspark.sql.column.Column

集合功能:返回一個數組的元素在col1和col2的交集,沒有重複。

參數
col1 或str

列的名稱包含數組

col2 或str

列的名稱包含數組

例子

> > >pyspark.sql進口> > >df=火花createDataFrame([(c1=(“b”,“一個”,“c”),c2=(“c”,“d”,“一個”,“f”))))> > >df選擇(array_intersect(dfc1,dfc2))收集()行(array_intersect (c1, c2) = [' a ', ' c ']))