pyspark.pandas.Index.sort_values

索引。 sort_values ( return_indexer:bool=,提升:bool=真正的 )→聯盟(pyspark.pandas.indexes.base.Index,元組(pyspark.pandas.indexes.base.Index,pyspark.pandas.indexes.base.Index] ]

返回一個分類指數的副本,並可選地返回排序索引本身的指標。

請注意

這個方法不支持熊貓當指數NaN值。熊貓引發了意想不到的TypeError,但我們支持治療南作為最小的值。該方法返回索引器pandas-on-Spark指數,而熊貓返回列表。這是因為在pandas-on-Spark可能不適合在內存中索引器。

參數
return_indexer bool,默認的錯誤

的指數排序索引應該返回。

提升 bool,默認的真

索引值應該在升序排序。

返回
sorted_index ps.Index或ps.MultiIndex

排序的索引。

索引器 ps.Index

本身是按指數的指數。

另請參閱

Series.sort_values

一係列的值。

DataFrame.sort_values

DataFrame排序值。

例子

> > >idx=ps指數([10,One hundred.,1,1000年])> > >idxInt64Index ((100, 1000), dtype =“int64”)

值按升序排序(默認行為)。

> > >idxsort_values()Int64Index ([1、10、100、1000], dtype =“int64”)

在降序排序值。

> > >idxsort_values(提升=)Int64Index([1] 1000、100、10日,dtype =“int64”)

在降序排序值,也得到了指數idx排序了。

> > >idxsort_values(提升=,return_indexer=真正的)(Int64Index([1] 1000、100、10日,dtype =“int64”), Int64Index ([3 1 0 2], dtype = ' int64 '))

支持MultiIndex。

> > >psidx=psMultiIndexfrom_tuples(((“一個”,“x”,1),(“c”,“y”,2),(“b”,“z”,3)))> > >psidxMultiIndex ([(' a ', ' x ', 1),(' c ', ' y ', 2),(' b ', ' z ', 3)),)
> > >psidxsort_values()MultiIndex ([(' a ', ' x ', 1),(' b ', ' z ', 3),(' c ', ' y ', 2)),)
> > >psidxsort_values(提升=)MultiIndex ([(' c ', ' y ', 2),(' b ', ' z ', 3),(' a ', ' x ', 1)),)
> > >psidxsort_values(提升=,return_indexer=真正的)(MultiIndex (((' c ', ' y ', 2),(' b ', ' z ', 3),(' a ', ' x ', 1)),),Int64Index ([1 2 0], dtype = ' int64 '))