pyspark.SparkContext.union

SparkContext。 聯盟 ( 抽樣:列表(pyspark.rdd.RDD(T]] )→pyspark.rdd.RDD(T]

建立聯盟的抽樣的列表。

這支持工會()的抽樣不同的序列化格式,盡管這迫使他們reserialized使用默認的序列化器:

例子

> > >路徑=操作係統路徑加入(tempdir,“union-text.txt”)> > >開放(路徑,“w”)作為測試文件:_=測試文件(“你好”)> > >文本文件=sc文本文件(路徑)> > >文本文件收集()['你好']> > >並行=sc並行化([“世界!”])> > >排序(sc聯盟([文本文件,並行])收集())(“你好”,“世界!”)