pyspark.pandas.DataFrame.to_records¶

DataFrame。 to_records ( 指數:bool=真正的,column_dtypes:聯盟(str, numpy。dtype pandas.core.dtypes.base。ExtensionDtype, Dict[聯盟[任何元組[,…]],聯盟(str, numpy。dtype pandas.core.dtypes.base。ExtensionDtype]],沒有)=沒有一個,index_dtypes:聯盟(str, numpy。dtype pandas.core.dtypes.base。ExtensionDtype, Dict[聯盟[任何元組[,…]],聯盟(str, numpy。dtype pandas.core.dtypes.base。ExtensionDtype]],沒有)=沒有一個 )→numpy.recarray¶

DataFrame轉換為NumPy記錄數組中。

指數將作為第一個字段如果請求記錄的數組。

請注意

這種方法應該隻用於如果結果NumPy ndarray預計將小,因為所有數據加載到司機的記憶。

參數

指數 bool,默認的真: 包括指數結果記錄數組,存儲在索引的字段或使用索引標簽,如果設置。
column_dtypes str、類型、dict類型,默認沒有: 如果一個字符串或類型、數據類型存儲所有列。如果一本字典,一個映射的列名稱和指數(0)到特定的數據類型。
index_dtypes str、類型、dict類型,默認沒有: 如果一個字符串或類型、數據類型存儲所有索引的水平。如果一個字典,指標名稱和指標的映射(0)到特定的數據類型。這種映射隻有應用指數= True。

返回

numpy.recarray: NumPy ndarray DataFrame標簽的字段和DataFrame的每一行條目。

另請參閱

DataFrame.from_records: 結構化或記錄ndarray DataFrame進行轉換。
numpy.recarray: 一個ndarray,允許使用屬性字段訪問,類似於電子表格輸入列。

例子

           > > >df=ps。DataFrame({“一個”:(1,2),“B”:(0.5,0.75)},…指數=(“一個”,“b”])> > >df一個B1 0.50b 2 0.75
          

           > > >df。to_records()rec.array ([(' a ', 1, 0.5), (0.75 b 2)),dtype =[(“指數”、“O”)(“一個”、“< i8”), (' B ', ' < f8 '))
          

該指數可以排除在記錄數組:

           > > >df。to_records(指數=假)rec.array ([(0.5), (0.75)],dtype =[('一',' < i8 '), (' B ', ' < f8 '))
          

規範的dtype列在熊貓0.24.0是新的。可以指定數據類型的列:

           > > >df。to_records(column_dtypes={“一個”:“int32”})rec.array ([(' a ', 1, 0.5), (0.75 b 2)),dtype =[(“指數”、“O”)(“一個”、“<預告”),(' B ', ' < f8 '))
          

規範的dtype指數在熊貓0.24.0是新的。指定的數據類型也可以指數:

           > > >df。to_records(index_dtypes=“< S2”)rec.array ([a (b 1 0.5), b (b、2 0.75)),dtype =[(“指數”,“S2”)(“一個”、“< i8”), (' B ', ' < f8 '))
          

以前的

pyspark.pandas.DataFrame.to_markdown

下一個

pyspark.pandas.DataFrame.to_latex