LogisticRegressionSummary

pyspark.ml.classification。 LogisticRegressionSummary ( java_obj:可選(JavaObject]=沒有一個 )

對於一個給定的模型抽象為邏輯回歸結果。

方法

fMeasureByLabel([測試])

為每個標簽返回f-measure(類別)。

weightedFMeasure([測試])

加權平均f-measure回報。

屬性

精度

返回的準確性。

falsePositiveRateByLabel

返回假陽性率為每個標簽(類別)。

featuresCol

字段“預測”,讓每個實例的特征向量。

labelCol

在“預測”,讓每個實例的真正的標簽。

標簽

返回標簽按升序的順序。

precisionByLabel

回報精度為每個標簽(類別)。

predictionCol

在“預測”,給了每個類的預測。

預測

Dataframe模型的輸出變換方法。

probabilityCol

在“預測”,給每個類作為一個向量的概率。

recallByLabel

為每個標簽返回召回(類別)。

truePositiveRateByLabel

返回true積極率為每個標簽(類別)。

weightCol

在“預測”,讓每個實例作為一個向量的重量。

weightedFalsePositiveRate

返回加權假陽性率。

weightedPrecision

返回加權平均精度。

weightedRecall

返回加權平均召回。

weightedTruePositiveRate

返回加權真陽性率。

方法的文檔

fMeasureByLabel ( β:浮動=1.0 )→列表(浮動]

為每個標簽返回f-measure(類別)。

weightedFMeasure ( β:浮動=1.0 )→浮動

加權平均f-measure回報。

屬性的文檔

精度

返回的準確性。(等於總數正確分類實例總數的實例)。

falsePositiveRateByLabel

返回假陽性率為每個標簽(類別)。

featuresCol

字段“預測”,讓每個實例的特征向量。

labelCol

在“預測”,讓每個實例的真正的標簽。

標簽

返回標簽按升序的順序。這個訂單與訂單用於度量在標簽指定為數組,例如,truePositiveRateByLabel。

筆記

在大多數情況下,它將值{0.0,1.0,…,numClasses-1},然而,如果訓練集是失蹤的一個標簽,那麼所有數組的標簽(例如,從truePositiveRateByLabel)將長度numClasses-1 numClasses相反的預期。

precisionByLabel

回報精度為每個標簽(類別)。

predictionCol

在“預測”,給了每個類的預測。

預測

Dataframe模型的輸出變換方法。

probabilityCol

在“預測”,給每個類作為一個向量的概率。

recallByLabel

為每個標簽返回召回(類別)。

truePositiveRateByLabel

返回true積極率為每個標簽(類別)。

weightCol

在“預測”,讓每個實例作為一個向量的重量。

weightedFalsePositiveRate

返回加權假陽性率。

weightedPrecision

返回加權平均精度。

weightedRecall

返回加權平均召回。(等於精度、召回和f-measure)

weightedTruePositiveRate

返回加權真陽性率。(等於精度、召回和f-measure)