pyspark.pandas.DataFrame.iterrows

DataFrame。 iterrows ( )→迭代器(元組(聯盟(任何元組[,…]],pandas.core.series.Series]]

遍曆DataFrame行(指數係列)對。

收益率
指數 標簽或標簽的元組

的索引行。一個元組MultiIndex

數據 pandas.Series

作為一個係列的數據行。

發電機

一台發電機,遍曆行框架的。

筆記

  1. 因為iterrows返回一個係列對於每一行,它整個行保留dtypes DataFrames (dtypes保存在列)。例如,

    > > >df=psDataFrame([[1,1.5]],=(“int”,“浮”])> > >=下一個(dfiterrows())(1]> > >int 1.0浮動1.5名稱:0,dtype: float64> > >打印((“int”]dtype)float64> > >打印(df(“int”]dtype)int64

    保存dtypes同時遍曆行,最好是使用itertuples ()它返回namedtuples價值觀和一般的速度比嗎iterrows

  2. 你應該沒有修改你是遍曆。這是不能保證在任何情況下工作。根據不同的數據類型,迭代器返回一個副本,而不是一個視圖,和寫作,它將沒有效果。