pyspark.pandas.DataFrame.to_records

DataFrame。 to_records ( 指數:bool=真正的,column_dtypes:聯盟(str, numpy。dtype pandas.core.dtypes.base。ExtensionDtype, Dict[聯盟[任何元組[,…]],聯盟(str, numpy。dtype pandas.core.dtypes.base。ExtensionDtype]],沒有)=沒有一個,index_dtypes:聯盟(str, numpy。dtype pandas.core.dtypes.base。ExtensionDtype, Dict[聯盟[任何元組[,…]],聯盟(str, numpy。dtype pandas.core.dtypes.base。ExtensionDtype]],沒有)=沒有一個 )→numpy.recarray

DataFrame轉換為NumPy記錄數組中。

指數將作為第一個字段如果請求記錄的數組。

請注意

這種方法應該隻用於如果結果NumPy ndarray預計將小,因為所有數據加載到司機的記憶。

參數
指數 bool,默認的真

包括指數結果記錄數組,存儲在索引的字段或使用索引標簽,如果設置。

column_dtypes str、類型、dict類型,默認沒有

如果一個字符串或類型、數據類型存儲所有列。如果一本字典,一個映射的列名稱和指數(0)到特定的數據類型。

index_dtypes str、類型、dict類型,默認沒有

如果一個字符串或類型、數據類型存儲所有索引的水平。如果一個字典,指標名稱和指標的映射(0)到特定的數據類型。這種映射隻有應用指數= True

返回
numpy.recarray

NumPy ndarray DataFrame標簽的字段和DataFrame的每一行條目。

另請參閱

DataFrame.from_records

結構化或記錄ndarray DataFrame進行轉換。

numpy.recarray

一個ndarray,允許使用屬性字段訪問,類似於電子表格輸入列。

例子

> > >df=psDataFrame({“一個”:(1,2),“B”:(0.5,0.75)},指數=(“一個”,“b”])> > >df一個B1 0.50b 2 0.75
> > >dfto_records()rec.array ([(' a ', 1, 0.5), (0.75 b 2)),dtype =[(“指數”、“O”)(“一個”、“< i8”), (' B ', ' < f8 '))

該指數可以排除在記錄數組:

> > >dfto_records(指數=)rec.array ([(0.5), (0.75)],dtype =[('一',' < i8 '), (' B ', ' < f8 '))

規範的dtype列在熊貓0.24.0是新的。可以指定數據類型的列:

> > >dfto_records(column_dtypes={“一個”:“int32”})rec.array ([(' a ', 1, 0.5), (0.75 b 2)),dtype =[(“指數”、“O”)(“一個”、“<預告”),(' B ', ' < f8 '))

規範的dtype指數在熊貓0.24.0是新的。指定的數據類型也可以指數:

> > >dfto_records(index_dtypes=“< S2”)rec.array ([a (b 1 0.5), b (b、2 0.75)),dtype =[(“指數”,“S2”)(“一個”、“< i8”), (' B ', ' < f8 '))