pyspark.pandas.DataFrame.to_records¶
-
DataFrame。
to_records
( 指數:bool=真正的,column_dtypes:聯盟(str, numpy。dtype pandas.core.dtypes.base。ExtensionDtype, Dict[聯盟[任何元組[,…]],聯盟(str, numpy。dtype pandas.core.dtypes.base。ExtensionDtype]],沒有)=沒有一個,index_dtypes:聯盟(str, numpy。dtype pandas.core.dtypes.base。ExtensionDtype, Dict[聯盟[任何元組[,…]],聯盟(str, numpy。dtype pandas.core.dtypes.base。ExtensionDtype]],沒有)=沒有一個 )→numpy.recarray¶ -
DataFrame轉換為NumPy記錄數組中。
指數將作為第一個字段如果請求記錄的數組。
請注意
這種方法應該隻用於如果結果NumPy ndarray預計將小,因為所有數據加載到司機的記憶。
- 參數
-
- 指數 bool,默認的真
-
包括指數結果記錄數組,存儲在索引的字段或使用索引標簽,如果設置。
- column_dtypes str、類型、dict類型,默認沒有
-
如果一個字符串或類型、數據類型存儲所有列。如果一本字典,一個映射的列名稱和指數(0)到特定的數據類型。
- index_dtypes str、類型、dict類型,默認沒有
-
如果一個字符串或類型、數據類型存儲所有索引的水平。如果一個字典,指標名稱和指標的映射(0)到特定的數據類型。這種映射隻有應用指數= True。
- 返回
-
- numpy.recarray
-
NumPy ndarray DataFrame標簽的字段和DataFrame的每一行條目。
另請參閱
-
DataFrame.from_records
-
結構化或記錄ndarray DataFrame進行轉換。
-
numpy.recarray
-
一個ndarray,允許使用屬性字段訪問,類似於電子表格輸入列。
例子
> > >df=ps。DataFrame({“一個”:(1,2),“B”:(0.5,0.75)},…指數=(“一個”,“b”])> > >df一個B1 0.50b 2 0.75
> > >df。to_records()rec.array ([(' a ', 1, 0.5), (0.75 b 2)),dtype =[(“指數”、“O”)(“一個”、“< i8”), (' B ', ' < f8 '))
該指數可以排除在記錄數組:
> > >df。to_records(指數=假)rec.array ([(0.5), (0.75)],dtype =[('一',' < i8 '), (' B ', ' < f8 '))
規範的dtype列在熊貓0.24.0是新的。可以指定數據類型的列:
> > >df。to_records(column_dtypes={“一個”:“int32”})rec.array ([(' a ', 1, 0.5), (0.75 b 2)),dtype =[(“指數”、“O”)(“一個”、“<預告”),(' B ', ' < f8 '))
規範的dtype指數在熊貓0.24.0是新的。指定的數據類型也可以指數:
> > >df。to_records(index_dtypes=“< S2”)rec.array ([a (b 1 0.5), b (b、2 0.75)),dtype =[(“指數”,“S2”)(“一個”、“< i8”), (' B ', ' < f8 '))