係列¶
構造函數¶
|
pandas-on-Spark係列對應於熊貓係列邏輯。 |
屬性¶
該指數(軸標簽)係列的列。 |
|
返回dtype底層數據的對象。 |
|
返回dtype底層數據的對象。 |
|
返回一個int數組維數代表的數量。 |
|
返回係列的名稱。 |
|
返回一個元組的底層數據的形狀。 |
|
返回一個列表的行軸標簽。 |
|
返回一個int代表該對象的元素數量。 |
|
返回true,如果當前對象是空的。 |
|
返回轉置,這是由定義自我。 |
|
如果有任何遺漏值返回True。 |
|
返回一個Numpy DataFrame或係列的代表。 |
轉換¶
|
把指定dtype pandas-on-Spark對象 |
|
複製這個對象的指標和數據。 |
返回布爾值的單個元素在當前對象。 |
索引、迭代¶
獲取一個值,一雙行/列標簽。 |
|
獲取一個值為一對行/列整數位置。 |
|
訪問一組行和列的標簽(s)或一個布爾係列。 |
|
純粹基於integer-location索引選擇的位置。 |
|
返回索引別名。 |
|
|
返回物品放係列。 |
這是一個別名 |
|
懶洋洋地遍曆元組(指數、價值)。 |
|
返回第一個元素的底層數據作為一個Python標量。 |
|
|
橫截麵回歸的係列。 |
|
獲取項目從對象給定鍵(DataFrame列,板片等)。 |
二元運算符函數¶
|
返回的係列和其他,element-wise(二元運算符+)。 |
|
返回漂浮係列和其他分工,element-wise(二元運算符/)。 |
|
返回乘法係列和其他,element-wise(二元運算符*)。 |
|
返回逆轉係列和其他element-wise(二元運算符+)。 |
|
返回反向浮動係列和其他分工,element-wise(二元運算符/)。 |
|
返回反向乘法係列等,element-wise(二元運算符*)。 |
|
返回反向減法係列和其他,element-wise(二元運算符- - - - - -)。 |
|
返回反向浮動係列和其他分工,element-wise(二元運算符/)。 |
|
返回減法係列和其他,element-wise(二元運算符- - - - - -)。 |
|
返回漂浮係列和其他分工,element-wise(二元運算符/)。 |
|
回報指數係列的係列和其他的力量,element-wise(二元運算符* *)。 |
|
返回反向指數係列和其他的力量,element-wise(二元運算符* *)。 |
|
返回模係列等,element-wise(二元運算符%)。 |
|
返回反向模係列等,element-wise(二元運算符%)。 |
|
返回整數除法的係列和其他,element-wise(二元運算符/ /)。 |
|
返回反整數除法的係列和其他,element-wise(二元運算符/ /)。 |
|
返回整數除法和模係列和其他,element-wise(二元運算符divmod)。 |
|
返回整數除法和模係列和其他,element-wise(二元運算符rdivmod)。 |
結合係列值,選擇調用係列的價值觀。 |
|
|
比較如果當前值小於另一個。 |
|
比較如果當前值大於另一個。 |
|
比較如果當前值小於或等於另一個。 |
|
比較當前值是否大於或等於另一個。 |
|
比較,如果當前值不等於另一個。 |
|
比較如果當前值等於另一個。 |
|
返回值的乘積。 |
|
計算的點積係列和其他的列。 |
函數的應用程序,GroupBy &窗口¶
|
調用函數的值。 |
|
總軸指定使用一個或多個操作。 |
|
總軸指定使用一個或多個操作。 |
|
調用 |
|
映射的值根據輸入對應係列。 |
|
使用一係列列組DataFrame或係列。 |
|
提供軋製轉換。 |
|
提供擴展轉換。 |
|
應用函數(自我,* args, * * kwargs)。 |
計算/描述性統計¶
返回一個係列/ DataFrame與每個元素的絕對數值。 |
|
|
返回所有元素是否正確。 |
|
返回任何元素是否為真。 |
|
計算lag-N自相關。 |
|
返回布爾係列相當於左< = < =。 |
|
調整值在輸入閾值(s)。 |
|
計算相關其他係列中,除缺失值。 |
|
對每一列數non-NA細胞。 |
|
計算協方差與係列中,除缺失值。 |
|
返回在DataFrame累積最大或係列軸。 |
|
返回累積在DataFrame最低或係列軸。 |
|
返回累積求和DataFrame或係列軸。 |
|
返回在DataFrame累積產品或係列軸。 |
|
產生描述性統計,總結集中趨勢,分散和形狀數據集的分布、排除 |
|
行或列的子集dataframe根據標簽指定的索引。 |
|
返回不偏峰度使用費舍爾峰度的定義(峰度正常= = 0.0)。 |
返回值的平均絕對偏差。 |
|
|
返回值的最大。 |
|
返回值的均值。 |
|
返回的最小值。 |
|
返回數據集的模式(s)。 |
|
返回的最大n元素。 |
|
返回最小的n元素。 |
|
當前和前一個元素之間的百分比變化。 |
|
返回值的乘積。 |
|
返回對象的獨特的元素數量。 |
返回布爾值的對象是獨一無二的 |
|
|
返回值在給定的分位數。 |
|
計算數值數據(1到n)沿軸。 |
|
返回所請求無偏平均數標準誤差在軸。 |
|
返回無偏斜規範化的n - 1。 |
|
返回樣本標準差。 |
|
返回值的總和。 |
|
返回所請求的軸的值的中值。 |
|
均方差的回報。 |
|
返回不偏峰度使用費舍爾峰度的定義(峰度正常= = 0.0)。 |
返回獨特的係列值對象。 |
|
|
返回包含項係列獨特的價值觀。 |
|
圓的每個值在一係列給定數量的小數。 |
|
第一個離散元素的差異。 |
返回布爾值的對象是單調遞增的。 |
|
返回布爾值的對象是單調遞增的。 |
|
返回布爾值的對象是否單調下降。 |
重建索引/選擇/標簽操作¶
|
使兩個物體的軸與指定的連接方法。 |
|
返回刪除指定索引標簽。 |
|
返回所請求係列指數水平(s)移除。 |
|
返回刪除了重複的值。 |
|
顯示重複的係列值。 |
|
比較如果當前值等於另一個。 |
前綴標簽用繩子前綴。 |
|
後綴標簽與字符串的後綴。 |
|
|
選擇第一個基於日期的時間序列數據偏移量。 |
|
返回第一個n行。 |
|
返回的行標簽的最大價值。 |
|
返回的行標簽的最小值。 |
|
檢查是否值包含在係列或索引。 |
|
選擇最終的時間序列數據基於日期抵消。 |
|
修改索引標簽或係列的名字。 |
|
設置軸為索引或列的名稱。 |
|
符合係列與可選填新索引邏輯,把NA /南在前麵的位置沒有價值指數。 |
像其他對象返回一個係列匹配指數。 |
|
|
生成一個新的DataFrame或係列索引重置。 |
|
返回一個隨機樣本的物品從一個軸的對象。 |
|
交換水平MultiIndex i和j。 |
|
適當的交換和交換值軸軸。 |
|
返回給定的元素位置指數沿著一個軸。 |
|
返回最後一個n行。 |
|
替換值的條件是錯誤的。 |
|
更換條件為真值。 |
|
截斷或一係列DataFrame之前和之後的一些索引值。 |
缺失的數據處理¶
|
的同義詞DataFrame.fillna ()或Series.fillna ()與 |
|
的同義詞DataFrame.fillna ()或Series.fillna ()與 |
檢測現有(non-missing)值。 |
|
檢測現有(non-missing)值。 |
|
檢測現有(non-missing)值。 |
|
檢測現有(non-missing)值。 |
|
|
的同義詞DataFrame.fillna ()或Series.fillna ()與 |
|
返回一個新的係列缺失值刪除。 |
|
填補NA / NaN值。 |
|
填補NaN值使用插值法。 |
重塑、排序置換¶
返回整數指數係列值排序。 |
|
返回int係列中最小值的位置。 |
|
|
返回int係列最大的價值。 |
|
類對象的標簽(沿著一個軸) |
|
類型的值。 |
|
Unstack一個省, |
連續變換類似的每個元素。 |
|
|
一係列的重複元素。 |
|
擠壓1維軸標量對象。 |
|
編碼對象為枚舉類型或類別變量。 |
結合/加入/合並¶
|
連接兩個或更多的係列。 |
|
與另一個係列,顯示差異。 |
|
用價值代替to_replace中給定值。 |
|
修改係列的地方使用non-NA值通過係列。 |
訪問器¶
熊貓火花提供dtype-specific方法在各種訪問器API。這些是單獨的名稱空間內係列
隻適用於特定的數據類型。
數據類型 |
訪問器 |
---|---|
Datetime |
|
字符串 |
|
分類 |
日期時間處理¶
Series.dt
可用於訪問係列datetimelike和返回的值幾個屬性。這些可以像訪問Series.dt。<屬性>
。
Datetime屬性¶
返回一係列的python datetime。日期對象(即,日期時間戳的一部分沒有時區信息)。 |
|
今年的datetime。 |
|
12月1月的時間戳= 1 = 12。 |
|
datetime的日子。 |
|
小時的datetime。 |
|
分鍾的datetime。 |
|
秒的datetime。 |
|
datetime的微秒。 |
|
本周序數。 |
|
本周序數。 |
|
星期的星期一= 0,周日= 6。 |
|
星期的星期一= 0,周日= 6。 |
|
順序的一天。 |
|
四分之一的日期。 |
|
指示是否日期是這個月的第一天。 |
|
指示是否日期是這個月的最後一天。 |
|
指標是否日期是四分之一的第一天。 |
|
指標是否日期是一個季度的最後一天。 |
|
指明的日期是每年的第一天。 |
|
指明的日期是今年的最後一天。 |
|
布爾指標如果日期屬於一個閏年。 |
|
月的天數。 |
|
月的天數。 |
Datetime方法¶
轉換到午夜。 |
|
|
使用指定date_format係列轉換為一個字符串。 |
|
對數據執行一輪操作指定的頻率。 |
|
執行地麵操作的數據到指定的頻率。 |
|
對數據執行裝天花板操作指定的頻率。 |
|
返回月係列的名稱與指定的場所。 |
|
返回天係列的名稱與指定的場所。 |
字符串處理¶
Series.str
可用於訪問係列作為字符串的值和應用幾種方法。這些可以像訪問Series.str。<函數/屬性>
。
係列的字符串轉換為大寫。 |
|
|
不受支持的。 |
|
填充左邊和右邊係列/索引的字符串和一個額外的字符。 |
|
測試模式或正則表達式包含在一個字符串的一個係列。 |
|
計數係列的每個字符串的模式。 |
|
不受支持的。 |
|
不受支持的。 |
|
測試每個字符串元素匹配模式的終結。 |
|
不受支持的。 |
|
不受支持的。 |
|
返回最低指標係列中的每個字符串的子串之間的完全包含開始:結束。 |
|
發現出現的所有模式或正則表達式的係列。 |
從每個字符串或字符串列表中提取元素/係列的元組在指定的位置。 |
|
不受支持的。 |
|
|
返回最低指標之間完全包含在每個字符串的子串(開始:結束)。 |
檢查是否每個字符串中的所有字符是字母數字。 |
|
檢查是否每個字符串中的所有字符是字母。 |
|
檢查是否每個字符串中所有的人物都是數字。 |
|
檢查是否每個字符串中所有的人物都是空白。 |
|
檢查是否每個字符串中所有的人物都是小寫的。 |
|
檢查是否每個字符串中所有的人物都是大寫。 |
|
檢查是否titlecase每個字符串中的所有字符。 |
|
檢查是否每個字符串中所有的人物都是數字。 |
|
檢查是否每個字符串中所有的人物都是小數。 |
|
|
加入列表包含元素係列通過分隔符。 |
計算係列中的每個元素的長度。 |
|
|
填充字符串的右邊和額外的字符係列。 |
轉換係列/索引所有小寫的字符串。 |
|
|
刪除前導字符。 |
|
確定每個字符串匹配正則表達式。 |
返回字符串的Unicode標準形式的係列。 |
|
|
墊弦係列的寬度。 |
|
不受支持的。 |
重複的係列中的每個字符串。 |
|
|
替換模式/ regex係列的出現與其他字符串。 |
|
回報最高的指數係列中的每個字符串的子串之間的完全包含開始:結束。 |
|
回報最高的指標之間完全包含在每個字符串的子串(開始:結束)。 |
|
填充左邊的字符串與額外的字符係列。 |
|
不受支持的。 |
|
分割字符串在給定分離器/分隔符。 |
|
刪除字符。 |
|
片子字符串的每個元素係列。 |
|
片子字符串的每個元素係列。 |
|
分割字符串在給定分離器/分隔符。 |
|
測試每個字符串元素匹配模式的開始。 |
|
刪除前導和尾隨字符。 |
轉換字符串swapcased係列/指數。 |
|
轉換字符串titlecase係列的。 |
|
地圖通過給定的字符串中的所有字符映射表。 |
|
轉換字符串的係列/索引所有大寫。 |
|
|
包裝係列的長字符串被格式化段落長度小於一個給定的寬度。 |
|
墊係列的字符串通過將“0”字符。 |
明確的訪問器¶
Categorical-dtype可根據特定的方法和屬性Series.cat
訪問器。
這個分類的類別。 |
|
類別是否有序的關係。 |
|
返回一係列的規範以及索引。 |
|
|
重命名類別。 |
|
重新排序類別new_categories中指定。 |
|
添加新類別。 |
|
刪除指定的類別。 |
刪除未使用的類別。 |
|
|
將類別設置為指定的new_categories。 |
|
設置分類有序。 |
|
設置分類是無序的。 |
策劃¶
Series.plot
既是一個可調用的方法和一個名稱空間屬性為特定形式的策劃方法Series.plot。<一>
。
的別名 |
|
|
畫一個堆放區域的。 |
|
豎線陰謀。 |
|
單杠的陰謀。 |
|
做一個係列的箱線圖列。 |
|
使用高斯內核生成核密度估計的陰謀。 |
|
畫一個直方圖DataFrame的列。 |
|
情節DataFrame /係列。 |
|
生成餅圖。 |
|
使用高斯內核生成核密度估計的陰謀。 |
|
畫一個直方圖DataFrame的列。 |
序列化/ IO /轉換¶
返回一個熊貓係列。 |
|
一個NumPy ndarray DataFrame或係列的代表值。 |
|
返回的列表值。 |
|
|
呈現一個係列的字符串表示。 |
|
轉換係列{標簽- >價值}dict類型或dict-like對象。 |
|
將對象複製到係統剪貼板。 |
|
呈現一個對象乳膠表格環境表。 |
|
打印係列或DataFrame Markdown-friendly格式。 |
|
將對象轉換為一個JSON字符串。 |
|
對象寫入一個逗號分隔值(csv)文件。 |
|
對象寫入一個Excel表。 |
|
轉換係列DataFrame。 |
Pandas-on-Spark特定¶
Series.pandas_on_spark
提供pandas-on-Spark特定功能,隻存在於熊貓API火花。這些可以訪問Series.pandas_on_spark。<函數/屬性>
。
轉換數據的函數需要熊貓係列和輸出熊貓係列。 |