pyspark.pandas.to_numeric

pyspark.pandas。 to_numeric ( 參數,錯誤=“提高” )

將參數轉換為數字類型。

參數
參數 標量、列表、元組、一維數組或係列

論點要轉換。

錯誤 {“提高”、“強迫”},默認“提高”
  • 如果“強迫”,無效的解析將NaN。

  • 如果“提高”,無效的解析將引發一個異常。

  • 如果“忽略”,那麼將返回輸入無效的解析。

請注意

“忽略”然而,當不工作參數是pandas-on-Spark係列。

返回
受潮濕腐爛 數字如果解析成功。

另請參閱

DataFrame.astype

鑄造參數指定的dtype。

to_datetime

將參數轉換為日期時間。

to_timedelta

將參數轉換為timedelta。

numpy.ndarray.astype

numpy數組指定的類型。

例子

> > >ps=ps係列([“1.0”,' 2 ',“3”])> > >ps0 1.01 22 3dtype:對象
> > >psto_numeric(ps)0 1.01 2.02 -3.0dtype: float32

如果係列包含無效值浮動,就丟給np.nan錯誤設置為“強迫”。

> > >ps=ps係列([“蘋果”,“1.0”,' 2 ',“3”])> > >ps0蘋果1 1.02 - 23個3dtype:對象
> > >psto_numeric(ps,錯誤=“強迫”)0南1 1.02 2.03 -3.0dtype: float32

也支持列表、元組、np。數組,或者是一個標量

> > >psto_numeric([“1.0”,' 2 ',“3”])數組([1。2。,-3.])
> > >psto_numeric((“1.0”,' 2 ',“3”))數組([1。2。,-3.])
> > >psto_numeric(np數組([“1.0”,' 2 ',“3”)))數組([1。2。,-3.])
> > >psto_numeric(“1.0”)1.0