pyspark.SparkContext.union¶
-
SparkContext。
聯盟
( 抽樣:列表(pyspark.rdd.RDD(T]] )→pyspark.rdd.RDD(T] ¶ -
建立聯盟的抽樣的列表。
這支持工會()的抽樣不同的序列化格式,盡管這迫使他們reserialized使用默認的序列化器:
例子
> > >路徑=操作係統。路徑。加入(tempdir,“union-text.txt”)> > >與開放(路徑,“w”)作為測試文件:…_=測試文件。寫(“你好”)> > >文本文件=sc。文本文件(路徑)> > >文本文件。收集()['你好']> > >並行=sc。並行化([“世界!”])> > >排序(sc。聯盟([文本文件,並行])。收集())(“你好”,“世界!”)