pyspark.RDD.sortBy

抽樣。 sortBy ( keyfunc:可調用的((T],年代],提升:bool=真正的,numPartitions:可選(int]=沒有一個 )→抽樣(T]

鑒於keyfunc排序這個抽樣

例子

> > >tmp=((“一個”,1),(“b”,2),(' 1 ',3),(' d ',4),(' 2 ',5)]> > >sc並行化(tmp)sortBy(λx:x(0])收集()(' 1 ',3),(' 2 ',5),(' a ', 1), (' b ', 2), (' d ', 4)]> > >sc並行化(tmp)sortBy(λx:x(1])收集()[(' a ', 1), (' b ', 2), (' 1 ', 3), (' d ', 4), (' 2 ', 5)]