pyspark.pandas.Series¶

類 pyspark.pandas。 係列 ( 數據=沒有一個,指數=沒有一個,dtype=沒有一個,的名字=沒有一個,複製=假,fastpath=假 ) ¶

pandas-on-Spark係列對應於熊貓係列邏輯。這將引發列內部。

變量

_internal——一個內部不變的框架來管理元數據。
_psdf——父母的pandas-on-Spark DataFrame

參數

數據數組類、dict或標量值,熊貓係列: 注意,如果包含存儲在數據係列數據是一個熊貓係列,其他參數不應使用。
指數類數組或索引(1 d): 值必須是hashable和有相同的長度數據。非唯一索引值是允許的。將默認為RangeIndex (0, 1, 2,…, n)如果沒有提供。如果使用dict和指數序列,該指數將會覆蓋的鑰匙在關鍵字中找到。
dtype numpy。dtype或沒有一個: 如果沒有,dtype將推斷
複製布爾,默認的錯誤: 複製輸入數據

方法

`腹肌`()	返回一個係列/ DataFrame與每個元素的絕對數值。
`添加`(其他)	返回的係列和其他,element-wise(二元運算符+)。
`add_prefix`(前綴)	前綴標簽用繩子前綴。
`add_suffix`(後綴)	後綴標簽與字符串的後綴。
`gg`(函數)	總軸指定使用一個或多個操作。
`總`(函數)	總軸指定使用一個或多個操作。
`對齊`(其他[加入,軸,複製))	使兩個物體的軸與指定的連接方法。
`所有`([軸,skipna])	返回所有元素是否正確。
`任何`((軸))	返回任何元素是否為真。
`附加`(to_append [ignore_index,…)	連接兩個或更多的係列。
`應用`(函數[,args))	調用函數的值。
`argmax`([軸,skipna])	返回int係列最大的價值。
`argmin`()	返回int係列中最小值的位置。
`argsort`()	返回整數指數係列值排序。
`asof`(在那裏)	返回最後一行(s)沒有任何nan在哪裏。
`astype`(dtype)	把指定dtype pandas-on-Spark對象`dtype`。
`at_time`(時間(asof,軸))	選擇在一天中的特定時間值(例如:)早上九時三十分。
`autocorr`([時間])	計算lag-N自相關。
`回填`([軸,原地,限製])	的同義詞DataFrame.fillna ()或Series.fillna ()與`方法= ' bfill '`。
`之間的`(、包容)(左,右)	返回布爾係列相當於左< = < =。
`between_time`(start_time end_time […])	選擇在一天的特定時間之間的值(例如:9:00-9:30點)。
`bfill`([軸,原地,限製])	的同義詞DataFrame.fillna ()或Series.fillna ()與`方法= ' bfill '`。
`bool`()	返回布爾值的單個元素在當前對象。
`剪輯`([低,上部,原地])	調整值在輸入閾值(s)。
`combine_first`(其他)	結合係列值,選擇調用係列的價值觀。
`比較`(其他[、keep_shape keep_equal])	與另一個係列,顯示差異。
`複製`((深))	複製這個對象的指標和數據。
`相關係數`(其他[方法])	計算相關其他係列中,除缺失值。
`數`([軸,numeric_only])	對每一列數non-NA細胞。
`浸`(其他[min_periods])	計算協方差與係列中,除缺失值。
`cummax`([skipna])	返回在DataFrame累積最大或係列軸。
`孜然芹`([skipna])	返回累積在DataFrame最低或係列軸。
`cumprod`([skipna])	返回在DataFrame累積產品或係列軸。
`cumsum`([skipna])	返回累積求和DataFrame或係列軸。
`描述`((百分位數))	產生描述性統計,總結集中趨勢,分散和形狀數據集的分布、排除`南`值。
`diff`([時間])	第一個離散元素的差異。
`div`(其他)	返回漂浮係列和其他分工,element-wise(二元運算符/)。
`分`(其他)	返回漂浮係列和其他分工,element-wise(二元運算符/)。
`divmod`(其他)	返回整數除法和模係列和其他,element-wise(二元運算符divmod)。
`點`(其他)	計算的點積係列和其他的列。
`下降`([標簽、索引列,水平,原地])	返回刪除指定索引標簽。
`drop_duplicates`([保持原地])	返回刪除了重複的值。
`droplevel`(高度)	返回所請求係列指數水平(s)移除。
`dropna`([軸,原地])	返回一個新的係列缺失值刪除。
`複製`([繼續])	顯示重複的係列值。
`情商`(其他)	比較如果當前值等於另一個。
`=`(其他)	比較如果當前值等於另一個。
`ewm`([com、跨度、半衰期、α…))	提供指數加權窗口轉換。
`擴大`([min_periods])	提供擴展轉換。
`爆炸`()	連續變換類似的每個元素。
`因式分解`([,na_sentinel])	編碼對象為枚舉類型或類別變量。
`ffill`([軸,原地,限製])	的同義詞DataFrame.fillna ()或Series.fillna ()與`方法= ' ffill '`。
`fillna`([值,方法,軸,原地,限製))	填補NA / NaN值。
`過濾器`([項目,正則表達式,軸])	行或列的子集dataframe根據標簽指定的索引。
`第一個`(抵消)	選擇第一個基於日期的時間序列數據偏移量。
`first_valid_index`()	檢索第一個有效的索引值。
`floordiv`(其他)	返回整數除法的係列和其他,element-wise(二元運算符/ /)。
`通用電氣`(其他)	比較當前值是否大於或等於另一個。
`得到`(關鍵(違約))	獲取項目從對象給定鍵(DataFrame列,板片等)。
`get_dtype_counts`()	返回數的獨特dtypes對象。
`groupby`(由軸、as_index dropna])	使用一係列列組DataFrame或係列。
`gt`(其他)	比較如果當前值大於另一個。
`頭`([n])	返回第一個n行。
`噓`((箱))	畫一個直方圖DataFrame的列。
`idxmax`([skipna])	返回的行標簽的最大價值。
`idxmin`([skipna])	返回的行標簽的最小值。
`插入`((方法、限製…))	填補NaN值使用插值法。
`型號`(值)	檢查是否值包含在係列或索引。
`並網發電`()	檢測現有(non-missing)值。
`isnull`()	檢測現有(non-missing)值。
`項`()	返回第一個元素的底層數據作為一個Python標量。
`項目`()	這是一個別名`iteritems`。
`iteritems`()	懶洋洋地遍曆元組(指數、價值)。
`鍵`()	返回索引別名。
`庫爾特`([軸,skipna numeric_only])	返回不偏峰度使用費舍爾峰度的定義(峰度正常= = 0.0)。
`峰度`([軸,skipna numeric_only])	返回不偏峰度使用費舍爾峰度的定義(峰度正常= = 0.0)。
`去年`(抵消)	選擇最終的時間序列數據基於日期抵消。
`last_valid_index`()	回報指數去年non-NA /空值。
`勒`(其他)	比較如果當前值小於或等於另一個。
`lt`(其他)	比較如果當前值小於另一個。
`瘋了`()	返回值的平均絕對偏差。
`地圖`(arg [na_action])	映射的值根據輸入對應係列。
`麵具`(氣孔導度[其他])	更換條件為真值。
`馬克斯`([軸,skipna numeric_only])	返回值的最大。
`的意思是`([軸,skipna numeric_only])	返回值的均值。
`中位數`([軸、skipna numeric_only、準確性))	返回所請求的軸的值的中值。
`最小值`([軸,skipna numeric_only])	返回的最小值。
`國防部`(其他)	返回模係列等,element-wise(二元運算符%)。
`模式`([dropna])	返回數據集的模式(s)。
`mul`(其他)	返回乘法係列和其他,element-wise(二元運算符*)。
`乘`(其他)	返回乘法係列和其他,element-wise(二元運算符*)。
`不`(其他)	比較,如果當前值不等於另一個。
`nlargest`([n])	返回的最大n元素。
`notna`()	檢測現有(non-missing)值。
`notnull`()	檢測現有(non-missing)值。
`nsmallest`([n])	返回最小的n元素。
`nunique`([dropna,大約,rsd])	返回對象的獨特的元素數量。
`墊`([軸,原地,限製])	的同義詞DataFrame.fillna ()或Series.fillna ()與`方法= ' ffill '`。
`pct_change`([時間])	當前和前一個元素之間的百分比變化。
`管`(* args func * * kwargs)	應用函數(自我,* args, * * kwargs)。
`流行`(項)	返回物品放係列。
`戰俘`(其他)	回報指數係列的係列和其他的力量,element-wise(二元運算符* *)。
`刺激`([軸、skipna numeric_only min_count])	返回值的乘積。
`產品`([軸、skipna numeric_only min_count])	返回值的乘積。
`分位數`([q、準確性)	返回值在給定的分位數。
`列地址`(其他)	返回逆轉係列和其他element-wise(二元運算符+)。
`排名`([方法、提升numeric_only])	計算數值數據(1到n)沿軸。
`rdiv`(其他)	返回反向浮動係列和其他分工,element-wise(二元運算符/)。
`rdivmod`(其他)	返回整數除法和模係列和其他,element-wise(二元運算符rdivmod)。
`重建索引`([指數,fill_value])	符合係列與可選填新索引邏輯,把NA /南在前麵的位置沒有價值指數。
`reindex_like`(其他)	像其他對象返回一個係列匹配指數。
`重命名`((指數))	修改索引標簽或係列的名字。
`rename_axis`([映射器、索引、原地])	設置軸為索引或列的名稱。
`重複`(重複)	一係列的重複元素。
`取代`([to_replace,價值,regex])	用價值代替to_replace中給定值。
`重新取樣`(規則(關於),關閉,標簽,)	重新取樣時間序列數據。
`reset_index`([水平下降,名字,原地])	生成一個新的DataFrame或係列索引重置。
`rfloordiv`(其他)	返回反整數除法的係列和其他,element-wise(二元運算符/ /)。
`rmod`(其他)	返回反向模係列等,element-wise(二元運算符%)。
`rmul`(其他)	返回反向乘法係列等,element-wise(二元運算符*)。
`滾動`(窗口[min_periods])	提供軋製轉換。
`輪`((小數))	圓的每個值在一係列給定數量的小數。
`rpow`(其他)	返回反向指數係列和其他的力量,element-wise(二元運算符* *)。
`rsub`(其他)	返回反向減法係列和其他,element-wise(二元運算符- - - - - -)。
`rtruediv`(其他)	返回反向浮動係列和其他分工,element-wise(二元運算符/)。
`樣本`([n,壓裂、替換random_state,…))	返回一個隨機樣本的物品從一個軸的對象。
`掃描電鏡`([軸、skipna ddof numeric_only])	返回所請求無偏平均數標準誤差在軸。
`轉變`([時期,fill_value])	轉變係列/索引所需數量的時期。
`斜`([軸,skipna numeric_only])	返回無偏斜規範化的n - 1。
`sort_index`([軸水平、提升、…))	類對象的標簽(沿著一個軸)
`sort_values`([提升、原地…)	類型的值。
`擠壓`((軸))	擠壓1維軸標量對象。
`性病`([軸、skipna ddof numeric_only])	返回樣本標準差。
`子`(其他)	返回減法係列和其他,element-wise(二元運算符- - - - - -)。
`減去`(其他)	返回減法係列和其他,element-wise(二元運算符- - - - - -)。
`總和`([軸、skipna numeric_only min_count])	返回值的總和。
`swapaxes`(i, j[,複製)	適當的交換和交換值軸軸。
`swaplevel`((i, j,複製))	交換水平MultiIndex i和j。
`尾巴`([n])	返回最後一個n行。
`取`(指標)	返回給定的元素位置指數沿著一個軸。
`to_clipboard`([excel, 9])	將對象複製到係統剪貼板。
`to_csv`([路徑、sep na_rep、列標題,…))	對象寫入一個逗號分隔值(csv)文件。
`to_dataframe`([名字])	轉換係列DataFrame。
`to_dict`([到])	轉換係列{標簽- >價值}dict類型或dict-like對象。
`to_excel`(excel_writer [, na_rep sheet_name…))	對象寫入一個Excel表。
`to_frame`([名字])	轉換係列DataFrame。
`to_json`([路徑、壓縮、num_files…))	將對象轉換為一個JSON字符串。
`to_latex`([col_space buf、列,標題,…))	呈現一個對象乳膠表格環境表。
`to_list`()	返回的列表值。
`to_markdown`([buf模式])	打印係列或DataFrame Markdown-friendly格式。
`to_numpy`()	一個NumPy ndarray DataFrame或係列的代表值。
`to_pandas`()	返回一個熊貓係列。
`to_string`([buf、na_rep float_format,…)	呈現一個係列的字符串表示。
`tolist`()	返回的列表值。
`變換`(func(軸))	調用`函數`產生相同的類型自我用轉換值,具有相同的軸長度作為輸入。
`轉置`(* * kwargs * args)	返回轉置,這是由定義自我。
`truediv`(其他)	返回漂浮係列和其他分工,element-wise(二元運算符/)。
`截斷`([之前,之後,軸,複製])	截斷或一係列DataFrame之前和之後的一些索引值。
`獨特的`()	返回獨特的係列值對象。
`unstack`((水平))	Unstack一個省,
`更新`(其他)	修改係列的地方使用non-NA值通過係列。
`value_counts`([正常化,排序,提升,…))	返回包含項係列獨特的價值觀。
`var`([軸,ddof numeric_only])	均方差的回報。
`在哪裏`(氣孔導度[其他])	替換值的條件是錯誤的。
`xs`(關鍵[,])	橫截麵回歸的係列。

屬性

`T`	返回轉置,這是由定義自我。
`在`	獲取一個值,一雙行/列標簽。
`軸`	返回一個列表的行軸標簽。
`dtype`	返回dtype底層數據的對象。
`dtypes`	返回dtype底層數據的對象。
`空`	返回true,如果當前對象是空的。
`hasnans`	如果有任何遺漏值返回True。
`iat`	獲取一個值為一對行/列整數位置。
`iloc`	純粹基於integer-location索引選擇的位置。
`指數`	該指數(軸標簽)係列的列。
`is_monotonic`	返回布爾值的對象是單調遞增的。
`is_monotonic_decreasing`	返回布爾值的對象是否單調下降。
`is_monotonic_increasing`	返回布爾值的對象是單調遞增的。
`is_unique`	返回布爾值的對象是獨一無二的
`瘋狂的`	訪問一組行和列的標簽(s)或一個布爾係列。
`的名字`	返回係列的名稱。
`ndim`	返回一個int數組維數代表的數量。
`形狀`	返回一個元組的底層數據的形狀。
`大小`	返回一個int代表該對象的元素數量。
`值`	返回一個Numpy DataFrame或係列的代表。

以前的

係列

下一個

pyspark.pandas.Series.index