DataFrame¶
構造函數¶
|
pandas-on-Spark DataFrame對應於熊貓DataFrame邏輯。 |
屬性和基礎數據¶
該指數DataFrame(行標簽)列。 |
|
DataFrame的列標簽。 |
|
返回true,如果當前DataFrame是空的。 |
返回dtypes DataFrame。 |
|
返回一個元組代表DataFrame的維度。 |
|
返回一個列表代表DataFrame的軸。 |
|
返回一個int數組維數代表的數量。 |
|
返回一個int代表該對象的元素數量。 |
|
|
返回的一個子集DataFrame dtypes基於列的列。 |
返回一個Numpy DataFrame或係列的代表。 |
轉換¶
|
複製這個對象的指標和數據。 |
檢測項目在當前Dataframe缺失值。 |
|
|
把指定dtype pandas-on-Spark對象 |
檢測項目在當前Dataframe缺失值。 |
|
檢測項目在當前Dataframe non-missing值。 |
|
檢測項目在當前Dataframe non-missing值。 |
|
|
的同義詞DataFrame.fillna ()或Series.fillna ()與 |
返回布爾值的單個元素在當前對象。 |
索引、迭代¶
獲取一個值,一雙行/列標簽。 |
|
獲取一個值為一對行/列整數位置。 |
|
|
返回第一個n行。 |
|
回報指數首次出現的最大要求軸。 |
|
回報指數首次出現的最低要求的軸。 |
訪問一組行和列的標簽(s)或一個布爾係列。 |
|
純粹基於integer-location索引選擇的位置。 |
|
這是一個別名 |
|
迭代器/(列名,係列)對。 |
|
遍曆DataFrame行(指數係列)對。 |
|
|
遍曆DataFrame namedtuples行。 |
返回列的別名。 |
|
返回項目,從框架。 |
|
|
返回最後一個n行。 |
|
返回從DataFrame截麵。 |
|
獲取項目從對象給定鍵(DataFrame列,板片等)。 |
|
替換值的條件是錯誤的。 |
|
更換條件為真值。 |
|
查詢的列DataFrame布爾表達式。 |
二元運算符函數¶
|
除了dataframe和其他,element-wise(二元運算符+)。 |
|
除了dataframe和其他,element-wise(二元運算符+)。 |
|
獲得浮動dataframe分工和其他element-wise(二元運算符/)。 |
|
獲得浮動dataframe分工和其他element-wise(二元運算符/)。 |
獲得浮動dataframe分工和其他element-wise(二元運算符/)。 |
|
獲得浮動dataframe分工和其他element-wise(二元運算符/)。 |
|
|
乘法dataframe和其他,element-wise(二元運算符*)。 |
|
乘法dataframe和其他,element-wise(二元運算符*)。 |
|
減法dataframe和其他,element-wise(二元運算符- - - - - -)。 |
|
減法dataframe和其他,element-wise(二元運算符- - - - - -)。 |
|
得到指數dataframe係列和其他的力量,element-wise(二元運算符* *)。 |
|
得到指數dataframe和其他的力量,element-wise(二元運算符* *)。 |
|
dataframe模等,element-wise(二元運算符%)。 |
|
dataframe模等,element-wise(二元運算符%)。 |
得到整數dataframe分工和其他,element-wise(二元運算符/ /)。 |
|
得到整數dataframe分工和其他,element-wise(二元運算符/ /)。 |
|
|
比較如果當前值小於另一個。 |
|
比較如果當前值大於另一個。 |
|
比較如果當前值小於或等於另一個。 |
|
比較當前值是否大於或等於另一個。 |
|
比較,如果當前值不等於另一個。 |
|
比較如果當前值等於另一個。 |
|
計算DataFrame和其他之間的矩陣乘法。 |
更新null元素值在同一位置其他。 |
函數的應用程序,GroupBy &窗口¶
|
應用一個函數DataFrame沿著一個軸。 |
一個函數應用於Dataframe elementwise。 |
|
|
應用函數(自我,* args, * * kwargs)。 |
|
總軸指定使用一個或多個操作。 |
總軸指定使用一個或多個操作。 |
|
|
使用一係列列組DataFrame或係列。 |
|
提供軋製轉換。 |
|
提供擴展轉換。 |
|
調用 |
計算/描述性統計¶
返回一個係列/ DataFrame與每個元素的絕對數值。 |
|
|
返回所有元素是否正確。 |
|
返回任何元素是否為真。 |
|
調整值在輸入閾值(s)。 |
|
計算兩兩相關的列,不包括NA / null值。 |
|
計算兩兩相關。 |
|
對每一列數non-NA細胞。 |
|
協方差計算兩兩列,不包括NA / null值。 |
|
產生描述性統計,總結集中趨勢,分散和形狀數據集的分布、排除 |
|
返回不偏峰度使用費舍爾峰度的定義(峰度正常= = 0.0)。 |
|
返回不偏峰度使用費舍爾峰度的定義(峰度正常= = 0.0)。 |
|
返回值的平均絕對偏差。 |
|
返回值的最大。 |
|
返回值的均值。 |
|
返回的最小值。 |
|
返回所請求的軸的值的中值。 |
|
當前和前一個元素之間的百分比變化。 |
|
返回值的乘積。 |
|
返回值的乘積。 |
|
返回值在給定的分位數。 |
|
返回對象的獨特的元素數量。 |
|
返回所請求無偏平均數標準誤差在軸。 |
|
返回無偏斜規範化的n - 1。 |
|
返回值的總和。 |
|
返回樣本標準差。 |
|
均方差的回報。 |
|
返回累積在DataFrame最低或係列軸。 |
|
返回在DataFrame累積最大或係列軸。 |
|
返回累積求和DataFrame或係列軸。 |
|
返回在DataFrame累積產品或係列軸。 |
|
圓一個DataFrame數量可變的位小數。 |
|
第一個離散元素的差異。 |
|
評估一個字符串描述DataFrame列的操作。 |
重建索引/選擇/標簽操作¶
前綴標簽用繩子前綴。 |
|
後綴標簽用繩子後綴。 |
|
|
使兩個物體的軸與指定的連接方法。 |
|
選擇在一天中的特定時間值(例如:)早上九時三十分。 |
|
選擇在一天的特定時間之間的值(例如:9:00-9:30點)。 |
|
從列指定的標簽。 |
|
返回所請求DataFrame與索引/列級(s)移除。 |
|
返回DataFrame刪除重複的行,選擇隻考慮某些列。 |
|
返回布爾係列表示重複的行,選擇隻考慮某些列。 |
|
比較如果當前值等於另一個。 |
|
行或列的子集dataframe根據標簽指定的索引。 |
|
選擇第一個基於日期的時間序列數據偏移量。 |
|
返回第一個n行。 |
|
選擇最終的時間序列數據基於日期抵消。 |
|
改變軸標簽。 |
|
設置軸為索引或列的名稱。 |
|
重置指數水平。 |
|
設置DataFrame指數(行標簽)使用一個或多個現有的列。 |
|
適當的交換和交換值軸軸。 |
|
交換水平i和j在特定MultiIndex軸。 |
|
返回給定的元素位置指數沿著一個軸。 |
DataFrame中的每個元素是否包含在價值觀。 |
|
|
返回一個隨機樣本的物品從一個軸的對象。 |
|
截斷或一係列DataFrame之前和之後的一些索引值。 |
缺失的數據處理¶
|
的同義詞DataFrame.fillna ()或Series.fillna ()與 |
|
刪除缺失值。 |
|
填補NA / NaN值。 |
|
返回一個新的DataFrame值替換為另一個值。 |
|
的同義詞DataFrame.fillna ()或Series.fillna ()與 |
|
的同義詞DataFrame.fillna ()或Series.fillna ()與 |
|
填補NaN值使用插值法。 |
重塑、排序置換¶
|
創建一個spreadsheet-style DataFrame數據透視表。 |
|
返回重塑DataFrame由給定的索引/列值。 |
|
類對象的標簽(沿著一個軸) |
|
通過值沿軸。 |
|
返回第一個n行命令列在降序排列。 |
|
返回第一個n行命令列以升序排序。 |
堆棧(s)規定的級別從列索引。 |
|
主(一定層次)索引標簽。 |
|
|
透視的DataFrame寬格式長格式,選擇離開標識符變量集。 |
|
行變換的每個元素類似,複製索引值。 |
|
擠壓1維軸標量對象。 |
轉置索引和列。 |
|
轉置索引和列。 |
|
|
符合DataFrame與可選填新索引邏輯,把NA /南在前麵的位置沒有價值指數。 |
|
像其他對象返回一個DataFrame與匹配指數。 |
|
計算數值數據(1到n)沿軸。 |
結合/加入/合並¶
|
行其他附加到調用者,返回一個新對象。 |
|
DataFrame分配新列。 |
|
合並DataFrame對象數據庫樣式加入。 |
|
另一個DataFrame的連接列。 |
|
從另一個DataFrame使用non-NA值修改到位。 |
|
在指定位置插入列DataFrame。 |
序列化/ IO /轉換¶
|
結構化或記錄ndarray DataFrame進行轉換。 |
|
打印一個簡明的總結DataFrame。 |
|
寫DataFrame火花表。 |
|
寫DataFrame三角洲湖表。 |
|
寫DataFrame拚花文件或目錄。 |
|
寫DataFrame火花數據源。 |
|
對象寫入一個逗號分隔值(csv)文件。 |
返回一個熊貓DataFrame。 |
|
|
呈現一個DataFrame作為HTML表。 |
一個NumPy ndarray DataFrame或係列的代表值。 |
|
|
引發相關功能。 |
|
呈現一個友好的控製台DataFrame表格輸出。 |
|
將對象轉換為一個JSON字符串。 |
|
DataFrame轉換為一本字典。 |
|
對象寫入一個Excel表。 |
|
將對象複製到係統剪貼板。 |
|
打印係列或DataFrame Markdown-friendly格式。 |
|
DataFrame轉換為NumPy記錄數組中。 |
|
呈現一個對象乳膠表格環境表。 |
屬性返回一個斯泰勒對象包含的方法構建一個風格DataFrame HTML表示。 |
策劃¶
DataFrame.plot
既是一個可調用的方法和一個名稱空間屬性為特定形式的策劃方法DataFrame.plot。<一>
。
的別名 |
|
|
畫一個堆放區域的。 |
|
單杠的陰謀。 |
|
豎線陰謀。 |
|
畫一個直方圖DataFrame的列。 |
|
做一個係列的箱線圖列。 |
|
情節DataFrame /係列。 |
|
生成餅圖。 |
|
創建一個散點圖不同大小和顏色標記點。 |
|
使用高斯內核生成核密度估計的陰謀。 |
|
畫一個直方圖DataFrame的列。 |
|
做一個係列的箱線圖列。 |
|
使用高斯內核生成核密度估計的陰謀。 |
Pandas-on-Spark特定¶
DataFrame.pandas_on_spark
提供pandas-on-Spark特定功能,隻存在於熊貓API火花。這些可以訪問DataFrame.pandas_on_spark。<函數/屬性>
。
應用一個函數需要熊貓熊貓DataFrame DataFrame和輸出。 |
|
變換塊的功能需要熊貓熊貓DataFrame DataFrame和輸出。 |