pyspark.pandas.Series¶
-
類
pyspark.pandas。
係列
( 數據=沒有一個,指數=沒有一個,dtype=沒有一個,的名字=沒有一個,複製=假,fastpath=假 ) ¶ -
pandas-on-Spark係列對應於熊貓係列邏輯。這將引發列內部。
- 變量
-
_internal——一個內部不變的框架來管理元數據。
_psdf——父母的pandas-on-Spark DataFrame
- 參數
-
- 數據 數組類、dict或標量值,熊貓係列
-
注意,如果包含存儲在數據係列數據是一個熊貓係列,其他參數不應使用。
- 指數 類數組或索引(1 d)
-
值必須是hashable和有相同的長度數據。非唯一索引值是允許的。將默認為RangeIndex (0, 1, 2,…, n)如果沒有提供。如果使用dict和指數序列,該指數將會覆蓋的鑰匙在關鍵字中找到。
- dtype numpy。dtype或沒有一個
-
如果沒有,dtype將推斷
- 複製 布爾,默認的錯誤
-
複製輸入數據
方法
腹肌
()返回一個係列/ DataFrame與每個元素的絕對數值。
添加
(其他)返回的係列和其他,element-wise(二元運算符+)。
add_prefix
(前綴)前綴標簽用繩子前綴。
add_suffix
(後綴)後綴標簽與字符串的後綴。
gg
(函數)總軸指定使用一個或多個操作。
總
(函數)總軸指定使用一個或多個操作。
對齊
(其他[加入,軸,複製))使兩個物體的軸與指定的連接方法。
所有
([軸,skipna])返回所有元素是否正確。
任何
((軸))返回任何元素是否為真。
附加
(to_append [ignore_index,…)連接兩個或更多的係列。
應用
(函數[,args))調用函數的值。
argmax
([軸,skipna])返回int係列最大的價值。
argmin
()返回int係列中最小值的位置。
argsort
()返回整數指數係列值排序。
asof
(在那裏)返回最後一行(s)沒有任何nan在哪裏。
astype
(dtype)把指定dtype pandas-on-Spark對象
dtype
。at_time
(時間(asof,軸))選擇在一天中的特定時間值(例如:)早上九時三十分。
autocorr
([時間])計算lag-N自相關。
回填
([軸,原地,限製])的同義詞DataFrame.fillna ()或Series.fillna ()與
方法= ' bfill '
。之間的
(、包容)(左,右)返回布爾係列相當於左< = < =。
between_time
(start_time end_time […])選擇在一天的特定時間之間的值(例如:9:00-9:30點)。
bfill
([軸,原地,限製])的同義詞DataFrame.fillna ()或Series.fillna ()與
方法= ' bfill '
。bool
()返回布爾值的單個元素在當前對象。
剪輯
([低,上部,原地])調整值在輸入閾值(s)。
combine_first
(其他)結合係列值,選擇調用係列的價值觀。
比較
(其他[、keep_shape keep_equal])與另一個係列,顯示差異。
複製
((深))複製這個對象的指標和數據。
相關係數
(其他[方法])計算相關其他係列中,除缺失值。
數
([軸,numeric_only])對每一列數non-NA細胞。
浸
(其他[min_periods])計算協方差與係列中,除缺失值。
cummax
([skipna])返回在DataFrame累積最大或係列軸。
孜然芹
([skipna])返回累積在DataFrame最低或係列軸。
cumprod
([skipna])返回在DataFrame累積產品或係列軸。
cumsum
([skipna])返回累積求和DataFrame或係列軸。
描述
((百分位數))產生描述性統計,總結集中趨勢,分散和形狀數據集的分布、排除
南
值。diff
([時間])第一個離散元素的差異。
div
(其他)返回漂浮係列和其他分工,element-wise(二元運算符/)。
分
(其他)返回漂浮係列和其他分工,element-wise(二元運算符/)。
divmod
(其他)返回整數除法和模係列和其他,element-wise(二元運算符divmod)。
點
(其他)計算的點積係列和其他的列。
下降
([標簽、索引列,水平,原地])返回刪除指定索引標簽。
drop_duplicates
([保持原地])返回刪除了重複的值。
droplevel
(高度)返回所請求係列指數水平(s)移除。
dropna
([軸,原地])返回一個新的係列缺失值刪除。
複製
([繼續])顯示重複的係列值。
情商
(其他)比較如果當前值等於另一個。
=
(其他)比較如果當前值等於另一個。
ewm
([com、跨度、半衰期、α…))提供指數加權窗口轉換。
擴大
([min_periods])提供擴展轉換。
爆炸
()連續變換類似的每個元素。
因式分解
([,na_sentinel])編碼對象為枚舉類型或類別變量。
ffill
([軸,原地,限製])的同義詞DataFrame.fillna ()或Series.fillna ()與
方法= ' ffill '
。fillna
([值,方法,軸,原地,限製))填補NA / NaN值。
過濾器
([項目,正則表達式,軸])行或列的子集dataframe根據標簽指定的索引。
第一個
(抵消)選擇第一個基於日期的時間序列數據偏移量。
檢索第一個有效的索引值。
floordiv
(其他)返回整數除法的係列和其他,element-wise(二元運算符/ /)。
通用電氣
(其他)比較當前值是否大於或等於另一個。
得到
(關鍵(違約))獲取項目從對象給定鍵(DataFrame列,板片等)。
get_dtype_counts
()返回數的獨特dtypes對象。
groupby
(由軸、as_index dropna])使用一係列列組DataFrame或係列。
gt
(其他)比較如果當前值大於另一個。
頭
([n])返回第一個n行。
噓
((箱))畫一個直方圖DataFrame的列。
idxmax
([skipna])返回的行標簽的最大價值。
idxmin
([skipna])返回的行標簽的最小值。
插入
((方法、限製…))填補NaN值使用插值法。
型號
(值)檢查是否值包含在係列或索引。
並網發電
()檢測現有(non-missing)值。
isnull
()檢測現有(non-missing)值。
項
()返回第一個元素的底層數據作為一個Python標量。
項目
()這是一個別名
iteritems
。懶洋洋地遍曆元組(指數、價值)。
鍵
()返回索引別名。
庫爾特
([軸,skipna numeric_only])返回不偏峰度使用費舍爾峰度的定義(峰度正常= = 0.0)。
峰度
([軸,skipna numeric_only])返回不偏峰度使用費舍爾峰度的定義(峰度正常= = 0.0)。
去年
(抵消)選擇最終的時間序列數據基於日期抵消。
回報指數去年non-NA /空值。
勒
(其他)比較如果當前值小於或等於另一個。
lt
(其他)比較如果當前值小於另一個。
瘋了
()返回值的平均絕對偏差。
地圖
(arg [na_action])映射的值根據輸入對應係列。
麵具
(氣孔導度[其他])更換條件為真值。
馬克斯
([軸,skipna numeric_only])返回值的最大。
的意思是
([軸,skipna numeric_only])返回值的均值。
中位數
([軸、skipna numeric_only、準確性))返回所請求的軸的值的中值。
最小值
([軸,skipna numeric_only])返回的最小值。
國防部
(其他)返回模係列等,element-wise(二元運算符%)。
模式
([dropna])返回數據集的模式(s)。
mul
(其他)返回乘法係列和其他,element-wise(二元運算符*)。
乘
(其他)返回乘法係列和其他,element-wise(二元運算符*)。
不
(其他)比較,如果當前值不等於另一個。
nlargest
([n])返回的最大n元素。
notna
()檢測現有(non-missing)值。
notnull
()檢測現有(non-missing)值。
nsmallest
([n])返回最小的n元素。
nunique
([dropna,大約,rsd])返回對象的獨特的元素數量。
墊
([軸,原地,限製])的同義詞DataFrame.fillna ()或Series.fillna ()與
方法= ' ffill '
。pct_change
([時間])當前和前一個元素之間的百分比變化。
管
(* args func * * kwargs)應用函數(自我,* args, * * kwargs)。
流行
(項)返回物品放係列。
戰俘
(其他)回報指數係列的係列和其他的力量,element-wise(二元運算符* *)。
刺激
([軸、skipna numeric_only min_count])返回值的乘積。
產品
([軸、skipna numeric_only min_count])返回值的乘積。
分位數
([q、準確性)返回值在給定的分位數。
列地址
(其他)返回逆轉係列和其他element-wise(二元運算符+)。
排名
([方法、提升numeric_only])計算數值數據(1到n)沿軸。
rdiv
(其他)返回反向浮動係列和其他分工,element-wise(二元運算符/)。
rdivmod
(其他)返回整數除法和模係列和其他,element-wise(二元運算符rdivmod)。
重建索引
([指數,fill_value])符合係列與可選填新索引邏輯,把NA /南在前麵的位置沒有價值指數。
reindex_like
(其他)像其他對象返回一個係列匹配指數。
重命名
((指數))修改索引標簽或係列的名字。
rename_axis
([映射器、索引、原地])設置軸為索引或列的名稱。
重複
(重複)一係列的重複元素。
取代
([to_replace,價值,regex])用價值代替to_replace中給定值。
重新取樣
(規則(關於),關閉,標簽,)重新取樣時間序列數據。
reset_index
([水平下降,名字,原地])生成一個新的DataFrame或係列索引重置。
rfloordiv
(其他)返回反整數除法的係列和其他,element-wise(二元運算符/ /)。
rmod
(其他)返回反向模係列等,element-wise(二元運算符%)。
rmul
(其他)返回反向乘法係列等,element-wise(二元運算符*)。
滾動
(窗口[min_periods])提供軋製轉換。
輪
((小數))圓的每個值在一係列給定數量的小數。
rpow
(其他)返回反向指數係列和其他的力量,element-wise(二元運算符* *)。
rsub
(其他)返回反向減法係列和其他,element-wise(二元運算符- - - - - -)。
rtruediv
(其他)返回反向浮動係列和其他分工,element-wise(二元運算符/)。
樣本
([n,壓裂、替換random_state,…))返回一個隨機樣本的物品從一個軸的對象。
掃描電鏡
([軸、skipna ddof numeric_only])返回所請求無偏平均數標準誤差在軸。
轉變
([時期,fill_value])轉變係列/索引所需數量的時期。
斜
([軸,skipna numeric_only])返回無偏斜規範化的n - 1。
sort_index
([軸水平、提升、…))類對象的標簽(沿著一個軸)
sort_values
([提升、原地…)類型的值。
擠壓
((軸))擠壓1維軸標量對象。
性病
([軸、skipna ddof numeric_only])返回樣本標準差。
子
(其他)返回減法係列和其他,element-wise(二元運算符- - - - - -)。
減去
(其他)返回減法係列和其他,element-wise(二元運算符- - - - - -)。
總和
([軸、skipna numeric_only min_count])返回值的總和。
swapaxes
(i, j[,複製)適當的交換和交換值軸軸。
swaplevel
((i, j,複製))交換水平MultiIndex i和j。
尾巴
([n])返回最後一個n行。
取
(指標)返回給定的元素位置指數沿著一個軸。
to_clipboard
([excel, 9])將對象複製到係統剪貼板。
to_csv
([路徑、sep na_rep、列標題,…))對象寫入一個逗號分隔值(csv)文件。
to_dataframe
([名字])轉換係列DataFrame。
to_dict
([到])轉換係列{標簽- >價值}dict類型或dict-like對象。
to_excel
(excel_writer [, na_rep sheet_name…))對象寫入一個Excel表。
to_frame
([名字])轉換係列DataFrame。
to_json
([路徑、壓縮、num_files…))將對象轉換為一個JSON字符串。
to_latex
([col_space buf、列,標題,…))呈現一個對象乳膠表格環境表。
to_list
()返回的列表值。
to_markdown
([buf模式])打印係列或DataFrame Markdown-friendly格式。
to_numpy
()一個NumPy ndarray DataFrame或係列的代表值。
返回一個熊貓係列。
to_string
([buf、na_rep float_format,…)呈現一個係列的字符串表示。
tolist
()返回的列表值。
變換
(func(軸))調用
函數
產生相同的類型自我用轉換值,具有相同的軸長度作為輸入。轉置
(* * kwargs * args)返回轉置,這是由定義自我。
truediv
(其他)返回漂浮係列和其他分工,element-wise(二元運算符/)。
截斷
([之前,之後,軸,複製])截斷或一係列DataFrame之前和之後的一些索引值。
獨特的
()返回獨特的係列值對象。
unstack
((水平))Unstack一個省,
更新
(其他)修改係列的地方使用non-NA值通過係列。
value_counts
([正常化,排序,提升,…))返回包含項係列獨特的價值觀。
var
([軸,ddof numeric_only])均方差的回報。
在哪裏
(氣孔導度[其他])替換值的條件是錯誤的。
xs
(關鍵[,])橫截麵回歸的係列。
屬性
返回轉置,這是由定義自我。
獲取一個值,一雙行/列標簽。
返回一個列表的行軸標簽。
返回dtype底層數據的對象。
返回dtype底層數據的對象。
返回true,如果當前對象是空的。
如果有任何遺漏值返回True。
獲取一個值為一對行/列整數位置。
純粹基於integer-location索引選擇的位置。
該指數(軸標簽)係列的列。
返回布爾值的對象是單調遞增的。
返回布爾值的對象是否單調下降。
返回布爾值的對象是單調遞增的。
返回布爾值的對象是獨一無二的
訪問一組行和列的標簽(s)或一個布爾係列。
返回係列的名稱。
返回一個int數組維數代表的數量。
返回一個元組的底層數據的形狀。
返回一個int代表該對象的元素數量。
返回一個Numpy DataFrame或係列的代表。