pyspark.pandas.DataFrame.iterrows¶
-
DataFrame。
iterrows
( )→迭代器(元組(聯盟(任何元組[,…]],pandas.core.series.Series]]¶ -
遍曆DataFrame行(指數係列)對。
- 收益率
-
- 指數 標簽或標簽的元組
-
的索引行。一個元組MultiIndex。
- 數據 pandas.Series
-
作為一個係列的數據行。
- 它 發電機
-
一台發電機,遍曆行框架的。
筆記
因為
iterrows
返回一個係列對於每一行,它不整個行保留dtypes DataFrames (dtypes保存在列)。例如,> > >df=ps。DataFrame([[1,1.5]],列=(“int”,“浮”])> > >行=下一個(df。iterrows())(1]> > >行int 1.0浮動1.5名稱:0,dtype: float64> > >打印(行(“int”]。dtype)float64> > >打印(df(“int”]。dtype)int64
保存dtypes同時遍曆行,最好是使用
itertuples ()
它返回namedtuples價值觀和一般的速度比嗎iterrows
。你應該沒有修改你是遍曆。這是不能保證在任何情況下工作。根據不同的數據類型,迭代器返回一個副本,而不是一個視圖,和寫作,它將沒有效果。