係列

構造函數

係列([數據、索引、dtype、名稱、複製…))

pandas-on-Spark係列對應於熊貓係列邏輯。

屬性

Series.index

該指數(軸標簽)係列的列。

Series.dtype

返回dtype底層數據的對象。

Series.dtypes

返回dtype底層數據的對象。

Series.ndim

返回一個int數組維數代表的數量。

Series.name

返回係列的名稱。

Series.shape

返回一個元組的底層數據的形狀。

Series.axes

返回一個列表的行軸標簽。

Series.size

返回一個int代表該對象的元素數量。

Series.empty

返回true,如果當前對象是空的。

Series.T

返回轉置,這是由定義自我。

Series.hasnans

如果有任何遺漏值返回True。

Series.values

返回一個Numpy DataFrame或係列的代表。

轉換

Series.astype(dtype)

把指定dtype pandas-on-Spark對象dtype

Series.copy((深))

複製這個對象的指標和數據。

Series.bool()

返回布爾值的單個元素在當前對象。

索引、迭代

Series.at

獲取一個值,一雙行/列標簽。

Series.iat

獲取一個值為一對行/列整數位置。

Series.loc

訪問一組行和列的標簽(s)或一個布爾係列。

Series.iloc

純粹基於integer-location索引選擇的位置。

Series.keys()

返回索引別名。

Series.pop(項)

返回物品放係列。

Series.items()

這是一個別名iteritems

Series.iteritems()

懶洋洋地遍曆元組(指數、價值)。

Series.item()

返回第一個元素的底層數據作為一個Python標量。

Series.xs(關鍵[,])

橫截麵回歸的係列。

Series.get(關鍵(違約))

獲取項目從對象給定鍵(DataFrame列,板片等)。

二元運算符函數

Series.add(其他)

返回的係列和其他,element-wise(二元運算符+)。

Series.div(其他)

返回漂浮係列和其他分工,element-wise(二元運算符/)。

Series.mul(其他)

返回乘法係列和其他,element-wise(二元運算符*)。

Series.radd(其他)

返回逆轉係列和其他element-wise(二元運算符+)。

Series.rdiv(其他)

返回反向浮動係列和其他分工,element-wise(二元運算符/)。

Series.rmul(其他)

返回反向乘法係列等,element-wise(二元運算符*)。

Series.rsub(其他)

返回反向減法係列和其他,element-wise(二元運算符- - - - - -)。

Series.rtruediv(其他)

返回反向浮動係列和其他分工,element-wise(二元運算符/)。

Series.sub(其他)

返回減法係列和其他,element-wise(二元運算符- - - - - -)。

Series.truediv(其他)

返回漂浮係列和其他分工,element-wise(二元運算符/)。

Series.pow(其他)

回報指數係列的係列和其他的力量,element-wise(二元運算符* *)。

Series.rpow(其他)

返回反向指數係列和其他的力量,element-wise(二元運算符* *)。

Series.mod(其他)

返回模係列等,element-wise(二元運算符%)。

Series.rmod(其他)

返回反向模係列等,element-wise(二元運算符%)。

Series.floordiv(其他)

返回整數除法的係列和其他,element-wise(二元運算符/ /)。

Series.rfloordiv(其他)

返回反整數除法的係列和其他,element-wise(二元運算符/ /)。

Series.divmod(其他)

返回整數除法和模係列和其他,element-wise(二元運算符divmod)。

Series.rdivmod(其他)

返回整數除法和模係列和其他,element-wise(二元運算符rdivmod)。

Series.combine_first(其他)

結合係列值,選擇調用係列的價值觀。

Series.lt(其他)

比較如果當前值小於另一個。

Series.gt(其他)

比較如果當前值大於另一個。

Series.le(其他)

比較如果當前值小於或等於另一個。

Series.ge(其他)

比較當前值是否大於或等於另一個。

Series.ne(其他)

比較,如果當前值不等於另一個。

Series.eq(其他)

比較如果當前值等於另一個。

Series.product([軸,skipna、numeric_only…))

返回值的乘積。

Series.dot(其他)

計算的點積係列和其他的列。

函數的應用程序,GroupBy &窗口

Series.apply(函數[,args))

調用函數的值。

Series.agg(函數)

總軸指定使用一個或多個操作。

Series.aggregate(函數)

總軸指定使用一個或多個操作。

Series.transform(func(軸))

調用函數產生相同的類型自我用轉換值,具有相同的軸長度作為輸入。

Series.map(arg [na_action])

映射的值根據輸入對應係列。

Series.groupby(由軸、as_index dropna])

使用一係列列組DataFrame或係列。

Series.rolling(窗口[min_periods])

提供軋製轉換。

Series.expanding([min_periods])

提供擴展轉換。

Series.pipe(* args func * * kwargs)

應用函數(自我,* args, * * kwargs)。

計算/描述性統計

Series.abs()

返回一個係列/ DataFrame與每個元素的絕對數值。

Series.all([軸,skipna])

返回所有元素是否正確。

Series.any((軸))

返回任何元素是否為真。

Series.autocorr([時間])

計算lag-N自相關。

Series.between(、包容)(左,右)

返回布爾係列相當於左< = < =。

Series.clip([低,上部,原地])

調整值在輸入閾值(s)。

Series.corr(其他[方法])

計算相關其他係列中,除缺失值。

Series.count([軸,numeric_only])

對每一列數non-NA細胞。

Series.cov(其他[min_periods])

計算協方差與係列中,除缺失值。

Series.cummax([skipna])

返回在DataFrame累積最大或係列軸。

Series.cummin([skipna])

返回累積在DataFrame最低或係列軸。

Series.cumsum([skipna])

返回累積求和DataFrame或係列軸。

Series.cumprod([skipna])

返回在DataFrame累積產品或係列軸。

Series.describe((百分位數))

產生描述性統計,總結集中趨勢,分散和形狀數據集的分布、排除值。

Series.filter([項目,正則表達式,軸])

行或列的子集dataframe根據標簽指定的索引。

Series.kurt([軸,skipna numeric_only])

返回不偏峰度使用費舍爾峰度的定義(峰度正常= = 0.0)。

Series.mad()

返回值的平均絕對偏差。

Series.max([軸,skipna numeric_only])

返回值的最大。

Series.mean([軸,skipna numeric_only])

返回值的均值。

Series.min([軸,skipna numeric_only])

返回的最小值。

Series.mode([dropna])

返回數據集的模式(s)。

Series.nlargest([n])

返回的最大n元素。

Series.nsmallest([n])

返回最小的n元素。

Series.pct_change([時間])

當前和前一個元素之間的百分比變化。

Series.prod([軸,skipna、numeric_only…))

返回值的乘積。

Series.nunique([dropna,大約,rsd])

返回對象的獨特的元素數量。

Series.is_unique

返回布爾值的對象是獨一無二的

Series.quantile([q、準確性)

返回值在給定的分位數。

Series.rank([方法、提升numeric_only])

計算數值數據(1到n)沿軸。

Series.sem([軸、skipna ddof numeric_only])

返回所請求無偏平均數標準誤差在軸。

Series.skew([軸,skipna numeric_only])

返回無偏斜規範化的n - 1。

Series.std([軸、skipna ddof numeric_only])

返回樣本標準差。

Series.sum([軸,skipna、numeric_only…))

返回值的總和。

Series.median([軸,skipna、numeric_only…))

返回所請求的軸的值的中值。

Series.var([軸,ddof numeric_only])

均方差的回報。

Series.kurtosis([軸,skipna numeric_only])

返回不偏峰度使用費舍爾峰度的定義(峰度正常= = 0.0)。

Series.unique()

返回獨特的係列值對象。

Series.value_counts([正常化,排序,…)

返回包含項係列獨特的價值觀。

Series.round((小數))

圓的每個值在一係列給定數量的小數。

Series.diff([時間])

第一個離散元素的差異。

Series.is_monotonic

返回布爾值的對象是單調遞增的。

Series.is_monotonic_increasing

返回布爾值的對象是單調遞增的。

Series.is_monotonic_decreasing

返回布爾值的對象是否單調下降。

重建索引/選擇/標簽操作

Series.align(其他[加入,軸,複製))

使兩個物體的軸與指定的連接方法。

Series.drop([標簽、索引列,水平,…))

返回刪除指定索引標簽。

Series.droplevel(高度)

返回所請求係列指數水平(s)移除。

Series.drop_duplicates([保持原地])

返回刪除了重複的值。

Series.duplicated([繼續])

顯示重複的係列值。

Series.equals(其他)

比較如果當前值等於另一個。

Series.add_prefix(前綴)

前綴標簽用繩子前綴

Series.add_suffix(後綴)

後綴標簽與字符串的後綴。

Series.first(抵消)

選擇第一個基於日期的時間序列數據偏移量。

Series.head([n])

返回第一個n行。

Series.idxmax([skipna])

返回的行標簽的最大價值。

Series.idxmin([skipna])

返回的行標簽的最小值。

Series.isin(值)

檢查是否包含在係列或索引。

Series.last(抵消)

選擇最終的時間序列數據基於日期抵消。

Series.rename((指數))

修改索引標簽或係列的名字。

Series.rename_axis([映射器、索引、原地])

設置軸為索引或列的名稱。

Series.reindex([指數,fill_value])

符合係列與可選填新索引邏輯,把NA /南在前麵的位置沒有價值指數。

Series.reindex_like(其他)

像其他對象返回一個係列匹配指數。

Series.reset_index([水平下降,名字,原地])

生成一個新的DataFrame或係列索引重置。

Series.sample([n,壓裂、替換…])

返回一個隨機樣本的物品從一個軸的對象。

Series.swaplevel((i, j,複製))

交換水平MultiIndex i和j。

Series.swapaxes(i, j[,複製)

適當的交換和交換值軸軸。

Series.take(指標)

返回給定的元素位置指數沿著一個軸。

Series.tail([n])

返回最後一個n行。

Series.where(氣孔導度[其他])

替換值的條件是錯誤的。

Series.mask(氣孔導度[其他])

更換條件為真值。

Series.truncate([之前,之後,軸,複製])

截斷或一係列DataFrame之前和之後的一些索引值。

缺失的數據處理

Series.backfill([軸,原地,限製])

的同義詞DataFrame.fillna ()Series.fillna ()方法= ' bfill '

Series.bfill([軸,原地,限製])

的同義詞DataFrame.fillna ()Series.fillna ()方法= ' bfill '

Series.isna()

檢測現有(non-missing)值。

Series.isnull()

檢測現有(non-missing)值。

Series.notna()

檢測現有(non-missing)值。

Series.notnull()

檢測現有(non-missing)值。

Series.pad([軸,原地,限製])

的同義詞DataFrame.fillna ()Series.fillna ()方法= ' ffill '

Series.dropna([軸,原地])

返回一個新的係列缺失值刪除。

Series.fillna([值,方法,軸,…))

填補NA / NaN值。

Series.interpolate((方法、限製…))

填補NaN值使用插值法。

重塑、排序置換

Series.argsort()

返回整數指數係列值排序。

Series.argmin()

返回int係列中最小值的位置。

Series.argmax([軸,skipna])

返回int係列最大的價值。

Series.sort_index([軸水平、提升、…))

類對象的標簽(沿著一個軸)

Series.sort_values([提升、原地…)

類型的值。

Series.unstack((水平))

Unstack一個省,

Series.explode()

連續變換類似的每個元素。

Series.repeat(重複)

一係列的重複元素。

Series.squeeze((軸))

擠壓1維軸標量對象。

Series.factorize([,na_sentinel])

編碼對象為枚舉類型或類別變量。

結合/加入/合並

Series.append(to_append [ignore_index,…)

連接兩個或更多的係列。

Series.compare(其他[、keep_shape keep_equal])

與另一個係列,顯示差異。

Series.replace([to_replace,價值,regex])

用價值代替to_replace中給定值。

Series.update(其他)

修改係列的地方使用non-NA值通過係列。

訪問器

熊貓火花提供dtype-specific方法在各種訪問器API。這些是單獨的名稱空間內係列隻適用於特定的數據類型。

數據類型

訪問器

Datetime

dt

字符串

str

分類

日期時間處理

Series.dt可用於訪問係列datetimelike和返回的值幾個屬性。這些可以像訪問Series.dt。<屬性>

Datetime屬性

Series.dt.date

返回一係列的python datetime。日期對象(即,日期時間戳的一部分沒有時區信息)。

Series.dt.year

今年的datetime。

Series.dt.month

12月1月的時間戳= 1 = 12。

Series.dt.day

datetime的日子。

Series.dt.hour

小時的datetime。

Series.dt.minute

分鍾的datetime。

Series.dt.second

秒的datetime。

Series.dt.microsecond

datetime的微秒。

Series.dt.week

本周序數。

Series.dt.weekofyear

本周序數。

Series.dt.dayofweek

星期的星期一= 0,周日= 6。

Series.dt.weekday

星期的星期一= 0,周日= 6。

Series.dt.dayofyear

順序的一天。

Series.dt.quarter

四分之一的日期。

Series.dt.is_month_start

指示是否日期是這個月的第一天。

Series.dt.is_month_end

指示是否日期是這個月的最後一天。

Series.dt.is_quarter_start

指標是否日期是四分之一的第一天。

Series.dt.is_quarter_end

指標是否日期是一個季度的最後一天。

Series.dt.is_year_start

指明的日期是每年的第一天。

Series.dt.is_year_end

指明的日期是今年的最後一天。

Series.dt.is_leap_year

布爾指標如果日期屬於一個閏年。

Series.dt.daysinmonth

月的天數。

Series.dt.days_in_month

月的天數。

Datetime方法

Series.dt.normalize()

轉換到午夜。

Series.dt.strftime(date_format)

使用指定date_format係列轉換為一個字符串。

Series.dt.round(* * kwargs頻率,* args)

對數據執行一輪操作指定的頻率。

Series.dt.floor(* * kwargs頻率,* args)

執行地麵操作的數據到指定的頻率。

Series.dt.ceil(* * kwargs頻率,* args)

對數據執行裝天花板操作指定的頻率。

Series.dt.month_name((地區))

返回月係列的名稱與指定的場所。

Series.dt.day_name((地區))

返回天係列的名稱與指定的場所。

字符串處理

Series.str可用於訪問係列作為字符串的值和應用幾種方法。這些可以像訪問Series.str。<函數/屬性>

Series.str.capitalize()

係列的字符串轉換為大寫。

Series.str.cat(9月,其他人na_rep,加入)()

不受支持的。

Series.str.center(寬度[fillchar])

填充左邊和右邊係列/索引的字符串和一個額外的字符。

Series.str.contains(帕特、案例、旗幟、na…))

測試模式或正則表達式包含在一個字符串的一個係列。

Series.str.count(帕特、旗幟)

計數係列的每個字符串的模式。

Series.str.decode(編碼、錯誤)

不受支持的。

Series.str.encode(編碼、錯誤)

不受支持的。

Series.str.endswith(模式[,na))

測試每個字符串元素匹配模式的終結。

Series.str.extract(帕特,旗幟,擴大)

不受支持的。

Series.str.extractall(帕特、旗幟)

不受支持的。

Series.str.find(子[,開始,結束])

返回最低指標係列中的每個字符串的子串之間的完全包含開始:結束。

Series.str.findall(帕特、旗幟)

發現出現的所有模式或正則表達式的係列。

Series.str.get(我)

從每個字符串或字符串列表中提取元素/係列的元組在指定的位置。

Series.str.get_dummies([9])

不受支持的。

Series.str.index(子[,開始,結束])

返回最低指標之間完全包含在每個字符串的子串(開始:結束)。

Series.str.isalnum()

檢查是否每個字符串中的所有字符是字母數字。

Series.str.isalpha()

檢查是否每個字符串中的所有字符是字母。

Series.str.isdigit()

檢查是否每個字符串中所有的人物都是數字。

Series.str.isspace()

檢查是否每個字符串中所有的人物都是空白。

Series.str.islower()

檢查是否每個字符串中所有的人物都是小寫的。

Series.str.isupper()

檢查是否每個字符串中所有的人物都是大寫。

Series.str.istitle()

檢查是否titlecase每個字符串中的所有字符。

Series.str.isnumeric()

檢查是否每個字符串中所有的人物都是數字。

Series.str.isdecimal()

檢查是否每個字符串中所有的人物都是小數。

Series.str.join(9月)

加入列表包含元素係列通過分隔符。

Series.str.len()

計算係列中的每個元素的長度。

Series.str.ljust(寬度[fillchar])

填充字符串的右邊和額外的字符係列。

Series.str.lower()

轉換係列/索引所有小寫的字符串。

Series.str.lstrip([to_strip])

刪除前導字符。

Series.str.match(帕特、案例、旗幟,na))

確定每個字符串匹配正則表達式。

Series.str.normalize(形式)

返回字符串的Unicode標準形式的係列。

Series.str.pad(寬度、側fillchar])

墊弦係列的寬度。

Series.str.partition([9月,擴大])

不受支持的。

Series.str.repeat(重複)

重複的係列中的每個字符串。

Series.str.replace(帕特,repl [n情況下,…))

替換模式/ regex係列的出現與其他字符串。

Series.str.rfind(子[,開始,結束])

回報最高的指數係列中的每個字符串的子串之間的完全包含開始:結束。

Series.str.rindex(子[,開始,結束])

回報最高的指標之間完全包含在每個字符串的子串(開始:結束)。

Series.str.rjust(寬度[fillchar])

填充左邊的字符串與額外的字符係列。

Series.str.rpartition([9月,擴大])

不受支持的。

Series.str.rsplit([帕特,n,擴大])

分割字符串在給定分離器/分隔符。

Series.str.rstrip([to_strip])

刪除字符。

Series.str.slice((啟動、停止、步驟)

片子字符串的每個元素係列。

Series.str.slice_replace((啟動、停止、repl))

片子字符串的每個元素係列。

Series.str.split([帕特,n,擴大])

分割字符串在給定分離器/分隔符。

Series.str.startswith(模式[,na))

測試每個字符串元素匹配模式的開始。

Series.str.strip([to_strip])

刪除前導和尾隨字符。

Series.str.swapcase()

轉換字符串swapcased係列/指數。

Series.str.title()

轉換字符串titlecase係列的。

Series.str.translate(表)

地圖通過給定的字符串中的所有字符映射表。

Series.str.upper()

轉換字符串的係列/索引所有大寫。

Series.str.wrap(* * kwargs寬度)

包裝係列的長字符串被格式化段落長度小於一個給定的寬度。

Series.str.zfill(寬度)

墊係列的字符串通過將“0”字符。

明確的訪問器

Categorical-dtype可根據特定的方法和屬性Series.cat訪問器。

Series.cat.categories

這個分類的類別。

Series.cat.ordered

類別是否有序的關係。

Series.cat.codes

返回一係列的規範以及索引。

Series.cat.rename_categories(new_categories)

重命名類別。

Series.cat.reorder_categories(new_categories)

重新排序類別new_categories中指定。

Series.cat.add_categories(new_categories […])

添加新類別。

Series.cat.remove_categories(刪除,原地)

刪除指定的類別。

Series.cat.remove_unused_categories([原地])

刪除未使用的類別。

Series.cat.set_categories(new_categories […])

將類別設置為指定的new_categories。

Series.cat.as_ordered([原地])

設置分類有序。

Series.cat.as_unordered([原地])

設置分類是無序的。

策劃

Series.plot既是一個可調用的方法和一個名稱空間屬性為特定形式的策劃方法Series.plot。<一>

Series.plot

的別名pyspark.pandas.plot.core.PandasOnSparkPlotAccessor

Series.plot.area((x, y))

畫一個堆放區域的。

Series.plot.bar((x, y))

豎線陰謀。

Series.plot.barh((x, y))

單杠的陰謀。

Series.plot.box(* * kwds)

做一個係列的箱線圖列。

Series.plot.density([bw_method,印第安納州])

使用高斯內核生成核密度估計的陰謀。

Series.plot.hist((箱))

畫一個直方圖DataFrame的列。

Series.plot.line((x, y))

情節DataFrame /係列。

Series.plot.pie(* * kwds)

生成餅圖。

Series.plot.kde([bw_method,印第安納州])

使用高斯內核生成核密度估計的陰謀。

Series.hist((箱))

畫一個直方圖DataFrame的列。

序列化/ IO /轉換

Series.to_pandas()

返回一個熊貓係列。

Series.to_numpy()

一個NumPy ndarray DataFrame或係列的代表值。

Series.to_list()

返回的列表值。

Series.to_string([buf na_rep,…)

呈現一個係列的字符串表示。

Series.to_dict([到])

轉換係列{標簽- >價值}dict類型或dict-like對象。

Series.to_clipboard([excel, 9])

將對象複製到係統剪貼板。

Series.to_latex([buf、列col_space,…)

呈現一個對象乳膠表格環境表。

Series.to_markdown([buf模式])

打印係列或DataFrame Markdown-friendly格式。

Series.to_json([路徑、壓縮、…)

將對象轉換為一個JSON字符串。

Series.to_csv([路徑、sep na_rep、列…))

對象寫入一個逗號分隔值(csv)文件。

Series.to_excel(excel_writer [sheet_name,…)

對象寫入一個Excel表。

Series.to_frame([名字])

轉換係列DataFrame。

Pandas-on-Spark特定

Series.pandas_on_spark提供pandas-on-Spark特定功能,隻存在於熊貓API火花。這些可以訪問Series.pandas_on_spark。<函數/屬性>

Series.pandas_on_spark.transform_batch(func…)

轉換數據的函數需要熊貓係列和輸出熊貓係列。