pyspark.pandas.MultiIndex.sort_values¶

MultiIndex。 sort_values ( return_indexer:bool=假,提升:bool=真正的 )→聯盟(pyspark.pandas.indexes.base.Index,元組(pyspark.pandas.indexes.base.Index,pyspark.pandas.indexes.base.Index] ] ¶

返回一個分類指數的副本,並可選地返回排序索引本身的指標。

請注意

這個方法不支持熊貓當指數NaN值。熊貓引發了意想不到的TypeError,但我們支持治療南作為最小的值。該方法返回索引器pandas-on-Spark指數,而熊貓返回列表。這是因為在pandas-on-Spark可能不適合在內存中索引器。

參數

return_indexer bool,默認的錯誤: 的指數排序索引應該返回。
提升 bool,默認的真: 索引值應該在升序排序。

返回

sorted_index ps.Index或ps.MultiIndex: 排序的索引。
索引器 ps.Index: 本身是按指數的指數。

另請參閱

Series.sort_values: 一係列的值。
DataFrame.sort_values: DataFrame排序值。

例子

           > > >idx=ps。指數([10,One hundred.,1,1000年])> > >idxInt64Index ((100, 1000), dtype =“int64”)
          

值按升序排序(默認行為)。

           > > >idx。sort_values()Int64Index ([1、10、100、1000], dtype =“int64”)
          

在降序排序值。

           > > >idx。sort_values(提升=假)Int64Index([1] 1000、100、10日,dtype =“int64”)
          

在降序排序值,也得到了指數idx排序了。

           > > >idx。sort_values(提升=假,return_indexer=真正的)(Int64Index([1] 1000、100、10日,dtype =“int64”), Int64Index ([3 1 0 2], dtype = ' int64 '))
          

支持MultiIndex。

           > > >psidx=ps。MultiIndex。from_tuples(((“一個”,“x”,1),(“c”,“y”,2),(“b”,“z”,3)))> > >psidxMultiIndex ([(' a ', ' x ', 1),(' c ', ' y ', 2),(' b ', ' z ', 3)),)
          

           > > >psidx。sort_values()MultiIndex ([(' a ', ' x ', 1),(' b ', ' z ', 3),(' c ', ' y ', 2)),)
          

           > > >psidx。sort_values(提升=假)MultiIndex ([(' c ', ' y ', 2),(' b ', ' z ', 3),(' a ', ' x ', 1)),)
          

           > > >psidx。sort_values(提升=假,return_indexer=真正的)(MultiIndex (((' c ', ' y ', 2),(' b ', ' z ', 3),(' a ', ' x ', 1)),),Int64Index ([1 2 0], dtype = ' int64 '))
          

以前的

pyspark.pandas.MultiIndex.spark.transform

下一個

pyspark.pandas.DatetimeIndex