pyspark.pandas.Series

pyspark.pandas。 係列 ( 數據=沒有一個,指數=沒有一個,dtype=沒有一個,的名字=沒有一個,複製=,fastpath= )

pandas-on-Spark係列對應於熊貓係列邏輯。這將引發列內部。

變量
  • _internal——一個內部不變的框架來管理元數據。

  • _psdf——父母的pandas-on-Spark DataFrame

參數
數據 數組類、dict或標量值,熊貓係列

注意,如果包含存儲在數據係列數據是一個熊貓係列,其他參數不應使用。

指數 類數組或索引(1 d)

值必須是hashable和有相同的長度數據。非唯一索引值是允許的。將默認為RangeIndex (0, 1, 2,…, n)如果沒有提供。如果使用dict和指數序列,該指數將會覆蓋的鑰匙在關鍵字中找到。

dtype numpy。dtype或沒有一個

如果沒有,dtype將推斷

複製 布爾,默認的錯誤

複製輸入數據

方法

腹肌()

返回一個係列/ DataFrame與每個元素的絕對數值。

添加(其他)

返回的係列和其他,element-wise(二元運算符+)。

add_prefix(前綴)

前綴標簽用繩子前綴

add_suffix(後綴)

後綴標簽與字符串的後綴。

gg(函數)

總軸指定使用一個或多個操作。

(函數)

總軸指定使用一個或多個操作。

對齊(其他[加入,軸,複製))

使兩個物體的軸與指定的連接方法。

所有([軸,skipna])

返回所有元素是否正確。

任何((軸))

返回任何元素是否為真。

附加(to_append [ignore_index,…)

連接兩個或更多的係列。

應用(函數[,args))

調用函數的值。

argmax([軸,skipna])

返回int係列最大的價值。

argmin()

返回int係列中最小值的位置。

argsort()

返回整數指數係列值排序。

asof(在那裏)

返回最後一行(s)沒有任何nan在哪裏

astype(dtype)

把指定dtype pandas-on-Spark對象dtype

at_time(時間(asof,軸))

選擇在一天中的特定時間值(例如:)早上九時三十分。

autocorr([時間])

計算lag-N自相關。

回填([軸,原地,限製])

的同義詞DataFrame.fillna ()Series.fillna ()方法= ' bfill '

之間的(、包容)(左,右)

返回布爾係列相當於左< = < =。

between_time(start_time end_time […])

選擇在一天的特定時間之間的值(例如:9:00-9:30點)。

bfill([軸,原地,限製])

的同義詞DataFrame.fillna ()Series.fillna ()方法= ' bfill '

bool()

返回布爾值的單個元素在當前對象。

剪輯([低,上部,原地])

調整值在輸入閾值(s)。

combine_first(其他)

結合係列值,選擇調用係列的價值觀。

比較(其他[、keep_shape keep_equal])

與另一個係列,顯示差異。

複製((深))

複製這個對象的指標和數據。

相關係數(其他[方法])

計算相關其他係列中,除缺失值。

([軸,numeric_only])

對每一列數non-NA細胞。

(其他[min_periods])

計算協方差與係列中,除缺失值。

cummax([skipna])

返回在DataFrame累積最大或係列軸。

孜然芹([skipna])

返回累積在DataFrame最低或係列軸。

cumprod([skipna])

返回在DataFrame累積產品或係列軸。

cumsum([skipna])

返回累積求和DataFrame或係列軸。

描述((百分位數))

產生描述性統計,總結集中趨勢,分散和形狀數據集的分布、排除值。

diff([時間])

第一個離散元素的差異。

div(其他)

返回漂浮係列和其他分工,element-wise(二元運算符/)。

(其他)

返回漂浮係列和其他分工,element-wise(二元運算符/)。

divmod(其他)

返回整數除法和模係列和其他,element-wise(二元運算符divmod)。

(其他)

計算的點積係列和其他的列。

下降([標簽、索引列,水平,原地])

返回刪除指定索引標簽。

drop_duplicates([保持原地])

返回刪除了重複的值。

droplevel(高度)

返回所請求係列指數水平(s)移除。

dropna([軸,原地])

返回一個新的係列缺失值刪除。

複製([繼續])

顯示重複的係列值。

情商(其他)

比較如果當前值等於另一個。

=(其他)

比較如果當前值等於另一個。

ewm([com、跨度、半衰期、α…))

提供指數加權窗口轉換。

擴大([min_periods])

提供擴展轉換。

爆炸()

連續變換類似的每個元素。

因式分解([,na_sentinel])

編碼對象為枚舉類型或類別變量。

ffill([軸,原地,限製])

的同義詞DataFrame.fillna ()Series.fillna ()方法= ' ffill '

fillna([值,方法,軸,原地,限製))

填補NA / NaN值。

過濾器([項目,正則表達式,軸])

行或列的子集dataframe根據標簽指定的索引。

第一個(抵消)

選擇第一個基於日期的時間序列數據偏移量。

first_valid_index()

檢索第一個有效的索引值。

floordiv(其他)

返回整數除法的係列和其他,element-wise(二元運算符/ /)。

通用電氣(其他)

比較當前值是否大於或等於另一個。

得到(關鍵(違約))

獲取項目從對象給定鍵(DataFrame列,板片等)。

get_dtype_counts()

返回數的獨特dtypes對象。

groupby(由軸、as_index dropna])

使用一係列列組DataFrame或係列。

gt(其他)

比較如果當前值大於另一個。

([n])

返回第一個n行。

((箱))

畫一個直方圖DataFrame的列。

idxmax([skipna])

返回的行標簽的最大價值。

idxmin([skipna])

返回的行標簽的最小值。

插入((方法、限製…))

填補NaN值使用插值法。

型號(值)

檢查是否包含在係列或索引。

並網發電()

檢測現有(non-missing)值。

isnull()

檢測現有(non-missing)值。

()

返回第一個元素的底層數據作為一個Python標量。

項目()

這是一個別名iteritems

iteritems()

懶洋洋地遍曆元組(指數、價值)。

()

返回索引別名。

庫爾特([軸,skipna numeric_only])

返回不偏峰度使用費舍爾峰度的定義(峰度正常= = 0.0)。

峰度([軸,skipna numeric_only])

返回不偏峰度使用費舍爾峰度的定義(峰度正常= = 0.0)。

去年(抵消)

選擇最終的時間序列數據基於日期抵消。

last_valid_index()

回報指數去年non-NA /空值。

(其他)

比較如果當前值小於或等於另一個。

lt(其他)

比較如果當前值小於另一個。

瘋了()

返回值的平均絕對偏差。

地圖(arg [na_action])

映射的值根據輸入對應係列。

麵具(氣孔導度[其他])

更換條件為真值。

馬克斯([軸,skipna numeric_only])

返回值的最大。

的意思是([軸,skipna numeric_only])

返回值的均值。

中位數([軸、skipna numeric_only、準確性))

返回所請求的軸的值的中值。

最小值([軸,skipna numeric_only])

返回的最小值。

國防部(其他)

返回模係列等,element-wise(二元運算符%)。

模式([dropna])

返回數據集的模式(s)。

mul(其他)

返回乘法係列和其他,element-wise(二元運算符*)。

(其他)

返回乘法係列和其他,element-wise(二元運算符*)。

(其他)

比較,如果當前值不等於另一個。

nlargest([n])

返回的最大n元素。

notna()

檢測現有(non-missing)值。

notnull()

檢測現有(non-missing)值。

nsmallest([n])

返回最小的n元素。

nunique([dropna,大約,rsd])

返回對象的獨特的元素數量。

([軸,原地,限製])

的同義詞DataFrame.fillna ()Series.fillna ()方法= ' ffill '

pct_change([時間])

當前和前一個元素之間的百分比變化。

(* args func * * kwargs)

應用函數(自我,* args, * * kwargs)。

流行(項)

返回物品放係列。

戰俘(其他)

回報指數係列的係列和其他的力量,element-wise(二元運算符* *)。

刺激([軸、skipna numeric_only min_count])

返回值的乘積。

產品([軸、skipna numeric_only min_count])

返回值的乘積。

分位數([q、準確性)

返回值在給定的分位數。

列地址(其他)

返回逆轉係列和其他element-wise(二元運算符+)。

排名([方法、提升numeric_only])

計算數值數據(1到n)沿軸。

rdiv(其他)

返回反向浮動係列和其他分工,element-wise(二元運算符/)。

rdivmod(其他)

返回整數除法和模係列和其他,element-wise(二元運算符rdivmod)。

重建索引([指數,fill_value])

符合係列與可選填新索引邏輯,把NA /南在前麵的位置沒有價值指數。

reindex_like(其他)

像其他對象返回一個係列匹配指數。

重命名((指數))

修改索引標簽或係列的名字。

rename_axis([映射器、索引、原地])

設置軸為索引或列的名稱。

重複(重複)

一係列的重複元素。

取代([to_replace,價值,regex])

用價值代替to_replace中給定值。

重新取樣(規則(關於),關閉,標簽,)

重新取樣時間序列數據。

reset_index([水平下降,名字,原地])

生成一個新的DataFrame或係列索引重置。

rfloordiv(其他)

返回反整數除法的係列和其他,element-wise(二元運算符/ /)。

rmod(其他)

返回反向模係列等,element-wise(二元運算符%)。

rmul(其他)

返回反向乘法係列等,element-wise(二元運算符*)。

滾動(窗口[min_periods])

提供軋製轉換。

((小數))

圓的每個值在一係列給定數量的小數。

rpow(其他)

返回反向指數係列和其他的力量,element-wise(二元運算符* *)。

rsub(其他)

返回反向減法係列和其他,element-wise(二元運算符- - - - - -)。

rtruediv(其他)

返回反向浮動係列和其他分工,element-wise(二元運算符/)。

樣本([n,壓裂、替換random_state,…))

返回一個隨機樣本的物品從一個軸的對象。

掃描電鏡([軸、skipna ddof numeric_only])

返回所請求無偏平均數標準誤差在軸。

轉變([時期,fill_value])

轉變係列/索引所需數量的時期。

([軸,skipna numeric_only])

返回無偏斜規範化的n - 1。

sort_index([軸水平、提升、…))

類對象的標簽(沿著一個軸)

sort_values([提升、原地…)

類型的值。

擠壓((軸))

擠壓1維軸標量對象。

性病([軸、skipna ddof numeric_only])

返回樣本標準差。

(其他)

返回減法係列和其他,element-wise(二元運算符- - - - - -)。

減去(其他)

返回減法係列和其他,element-wise(二元運算符- - - - - -)。

總和([軸、skipna numeric_only min_count])

返回值的總和。

swapaxes(i, j[,複製)

適當的交換和交換值軸軸。

swaplevel((i, j,複製))

交換水平MultiIndex i和j。

尾巴([n])

返回最後一個n行。

(指標)

返回給定的元素位置指數沿著一個軸。

to_clipboard([excel, 9])

將對象複製到係統剪貼板。

to_csv([路徑、sep na_rep、列標題,…))

對象寫入一個逗號分隔值(csv)文件。

to_dataframe([名字])

轉換係列DataFrame。

to_dict([到])

轉換係列{標簽- >價值}dict類型或dict-like對象。

to_excel(excel_writer [, na_rep sheet_name…))

對象寫入一個Excel表。

to_frame([名字])

轉換係列DataFrame。

to_json([路徑、壓縮、num_files…))

將對象轉換為一個JSON字符串。

to_latex([col_space buf、列,標題,…))

呈現一個對象乳膠表格環境表。

to_list()

返回的列表值。

to_markdown([buf模式])

打印係列或DataFrame Markdown-friendly格式。

to_numpy()

一個NumPy ndarray DataFrame或係列的代表值。

to_pandas()

返回一個熊貓係列。

to_string([buf、na_rep float_format,…)

呈現一個係列的字符串表示。

tolist()

返回的列表值。

變換(func(軸))

調用函數產生相同的類型自我用轉換值,具有相同的軸長度作為輸入。

轉置(* * kwargs * args)

返回轉置,這是由定義自我。

truediv(其他)

返回漂浮係列和其他分工,element-wise(二元運算符/)。

截斷([之前,之後,軸,複製])

截斷或一係列DataFrame之前和之後的一些索引值。

獨特的()

返回獨特的係列值對象。

unstack((水平))

Unstack一個省,

更新(其他)

修改係列的地方使用non-NA值通過係列。

value_counts([正常化,排序,提升,…))

返回包含項係列獨特的價值觀。

var([軸,ddof numeric_only])

均方差的回報。

在哪裏(氣孔導度[其他])

替換值的條件是錯誤的。

xs(關鍵[,])

橫截麵回歸的係列。

屬性

T

返回轉置,這是由定義自我。

獲取一個值,一雙行/列標簽。

返回一個列表的行軸標簽。

dtype

返回dtype底層數據的對象。

dtypes

返回dtype底層數據的對象。

返回true,如果當前對象是空的。

hasnans

如果有任何遺漏值返回True。

iat

獲取一個值為一對行/列整數位置。

iloc

純粹基於integer-location索引選擇的位置。

指數

該指數(軸標簽)係列的列。

is_monotonic

返回布爾值的對象是單調遞增的。

is_monotonic_decreasing

返回布爾值的對象是否單調下降。

is_monotonic_increasing

返回布爾值的對象是單調遞增的。

is_unique

返回布爾值的對象是獨一無二的

瘋狂的

訪問一組行和列的標簽(s)或一個布爾係列。

的名字

返回係列的名稱。

ndim

返回一個int數組維數代表的數量。

形狀

返回一個元組的底層數據的形狀。

大小

返回一個int代表該對象的元素數量。

返回一個Numpy DataFrame或係列的代表。