pyspark.pandas.MultiIndex

pyspark.pandas。 MultiIndex

pandas-on-Spark MultiIndex對應於熊貓MultiIndex邏輯。這也許能引發列內部。

參數
水平 序列的數組

每一層的獨特的標簽。

代碼 序列的數組

整數為每個級別指定哪個標簽在每個位置。

排序方式 可選的int

sortedness水平(必須由這一水平按字母排序)。

的名字 可選對象序列

名稱為每個索引的水平。(名字是接受兼容)。

複製 bool,默認的錯誤

複製元數據。

verify_integrity bool,默認的真

檢查水平/代碼是一致的和有效的。

另請參閱

MultiIndex.from_arrays

MultiIndex轉換列表的數組。

MultiIndex.from_product

創建一個笛卡兒積的MultiIndex iterable。

MultiIndex.from_tuples

MultiIndex轉換的元組列表。

MultiIndex.from_frame

做一個從DataFrame MultiIndex。

指數

一個單一索引。

例子

> > >psDataFrame({“一個”:(“一個”,“b”,“c”)},指數=[[1,2,3),(4,5,6]])指數MultiIndex ([(1、4)(2、5),(3、6)),)
> > >psDataFrame({“一個”:(1,2,3)},指數=(列表(“abc”),列表(“def”)))指數MultiIndex ([(' a ', ' d '),(' b ', ' e '),(' c ', ' f ')),)

方法

所有(* * kwargs * args)

返回所有元素是否正確。

任何(* * kwargs * args)

返回任何元素是否為真。

附加(其他)

添加索引選項的集合在一起。

argmax()

返回一個最大參數索引器。

argmin()

返回一個最小參數索引器。

asof(標簽)

返回標簽從索引中,或者,如果不存在,那麼前一個。

astype(dtype)

把指定dtype pandas-on-Spark對象dtype

複製((深))

這個對象的一個副本。

刪除(loc)

與通過新索引位置(- s)刪除。

區別(其他[,])

返回一個新的索引的元素索引不其他

下降(代碼[,])

使新MultiIndex通過標簽列表刪除

drop_duplicates([繼續])

返回MultiIndex刪除重複的值。

droplevel(高度)

返回索引刪除請求級別(s)。

dropna([如何])

返回索引或MultiIndex NA /南值

equal_levels(其他)

返回True,如果MultiIndex對象的水平是一樣的

=(其他)

確定兩個索引對象包含相同的元素。

因式分解([,na_sentinel])

編碼對象為枚舉類型或類別變量。

fillna(值)

NA / NaN值填充指定的值。

from_arrays(數組、排序方式、名稱)

將數組轉換為MultiIndex。

from_frame(df[名字])

做一個從DataFrame MultiIndex。

from_product(iterable[,排序方式,名字])

做一個笛卡兒積的MultiIndex多個iterable。

from_tuples(元組,排序方式,名字)

轉換MultiIndex元組的列表。

get_level_values(高度)

返回所請求的標簽值向量,等於指數的長度。

holds_integer()

是否類型是整數類型。

相同的(其他)

類似於等於,但檢查其他類似的屬性也相等。

插入(loc項)

做出新的MultiIndex插入新項的位置。

十字路口(其他)

形成兩個索引對象的交集。

is_boolean()

返回如果當前索引類型是一個布爾類型。

is_categorical()

返回如果當前索引類型分類類型。

is_floating()

返回如果當前索引類型是一個浮動的類型。

is_integer()

返回如果當前指數類型是整數類型。

is_interval()

返回如果當前指數類型是一個間隔類型。

is_numeric()

返回如果當前索引類型是數字類型。

is_object()

返回如果當前指數類型是對象類型。

is_type_compatible(一)

索引類型是否與所提供的類型兼容。

型號(值)

檢查是否包含在係列或索引。

並網發電()

檢測現有(non-missing)值。

isnull()

檢測現有(non-missing)值。

()

返回第一個元素的底層數據作為一個python tuple。

地圖([mapper, na_action])

映射值使用輸入對應(dict係列,或函數)。

馬克斯()

返回索引的最大價值。

最小值()

返回索引的最小值。

notna()

檢測現有(non-missing)值。

notnull()

檢測現有(non-missing)值。

nunique([dropna,大約,rsd])

返回對象的獨特的元素數量。

重命名(名稱[,原地])

改變指數或MultiIndex名稱。

重複(重複)

重複的元素索引/ MultiIndex。

set_names(名稱、級別,原地)

設置索引或MultiIndex名字。

轉變([時期,fill_value])

轉變係列/索引所需數量的時期。

排序(* * kwargs * args)

使用sort_values代替。

sort_values([return_indexer,提升])

返回一個分類指數的副本,並可選地返回排序索引本身的指標。

swaplevel((i, j))

交換級別我和j。

symmetric_difference(其他,result_name])

計算兩個MultiIndex對象的對稱差分。

(指標)

返回給定的元素位置指數沿著一個軸。

to_frame([指數名稱])

創建一個DataFrame MultiIndex為列的水平。

to_list()

返回的列表值。

to_numpy([dtype,複製])

一個NumPy ndarray指數或MultiIndex代表值。

to_pandas()

返回一個熊貓MultiIndex。

to_series([名字])

創建一係列索引和索引鍵值等於有用地圖返回一個基於索引的索引器。

tolist()

返回的列表值。

轉置()

返回轉置為索引,索引本身。

聯盟(其他[,])

兩個索引對象的結合形式。

獨特的((水平))

返回索引中惟一值。

value_counts([正常化,排序,提升,…))

返回包含項係列獨特的價值觀。

視圖()

這是定義為一個複製相同的身份

屬性

T

返回轉置為索引,索引本身。

asi8

整數表示的值。

dtype

返回dtype底層數據的對象。

dtypes

返回dtypes作為底層MultiIndex係列。

返回true,如果當前對象是空的。

has_duplicates

如果指數有重複,返回True,否則錯誤的。

hasnans

如果有任何遺漏值返回True。

inferred_type

返回一個字符串的類型推斷值。

is_all_dates

is_all_dates MultiIndex總是返回False

is_monotonic

返回布爾值的對象是單調遞增的。

is_monotonic_decreasing

返回布爾值的對象是否單調下降。

is_monotonic_increasing

返回布爾值的對象是單調遞增的。

is_unique

返回如果指數具有獨特的價值。

levshape

一個元組,每一層的長度。

的名字

返回索引的名稱。

的名字

返回索引的名稱。

ndim

返回一個int數組維數代表的數量。

nlevels

的水平指數和MultiIndex。

形狀

返回一個元組的底層數據的形狀。

大小

返回一個int代表該對象的元素數量。

返回一個數組代表數據的索引。