pyspark.pandas.Index.sort_values¶
-
索引。
sort_values
( return_indexer:bool=假,提升:bool=真正的 )→聯盟(pyspark.pandas.indexes.base.Index,元組(pyspark.pandas.indexes.base.Index,pyspark.pandas.indexes.base.Index] ] ¶ -
返回一個分類指數的副本,並可選地返回排序索引本身的指標。
請注意
這個方法不支持熊貓當指數NaN值。熊貓引發了意想不到的TypeError,但我們支持治療南作為最小的值。該方法返回索引器pandas-on-Spark指數,而熊貓返回列表。這是因為在pandas-on-Spark可能不適合在內存中索引器。
- 參數
-
- return_indexer bool,默認的錯誤
-
的指數排序索引應該返回。
- 提升 bool,默認的真
-
索引值應該在升序排序。
- 返回
-
- sorted_index ps.Index或ps.MultiIndex
-
排序的索引。
- 索引器 ps.Index
-
本身是按指數的指數。
另請參閱
-
Series.sort_values
-
一係列的值。
-
DataFrame.sort_values
-
DataFrame排序值。
例子
> > >idx=ps。指數([10,One hundred.,1,1000年])> > >idxInt64Index ((100, 1000), dtype =“int64”)
值按升序排序(默認行為)。
> > >idx。sort_values()Int64Index ([1、10、100、1000], dtype =“int64”)
在降序排序值。
> > >idx。sort_values(提升=假)Int64Index([1] 1000、100、10日,dtype =“int64”)
在降序排序值,也得到了指數idx排序了。
> > >idx。sort_values(提升=假,return_indexer=真正的)(Int64Index([1] 1000、100、10日,dtype =“int64”), Int64Index ([3 1 0 2], dtype = ' int64 '))
支持MultiIndex。
> > >psidx=ps。MultiIndex。from_tuples(((“一個”,“x”,1),(“c”,“y”,2),(“b”,“z”,3)))> > >psidxMultiIndex ([(' a ', ' x ', 1),(' c ', ' y ', 2),(' b ', ' z ', 3)),)
> > >psidx。sort_values()MultiIndex ([(' a ', ' x ', 1),(' b ', ' z ', 3),(' c ', ' y ', 2)),)
> > >psidx。sort_values(提升=假)MultiIndex ([(' c ', ' y ', 2),(' b ', ' z ', 3),(' a ', ' x ', 1)),)
> > >psidx。sort_values(提升=假,return_indexer=真正的)(MultiIndex (((' c ', ' y ', 2),(' b ', ' z ', 3),(' a ', ' x ', 1)),),Int64Index ([1 2 0], dtype = ' int64 '))