RankingMetrics

pyspark.mllib.evaluation。 RankingMetrics ( predictionAndLabels:聯盟(pyspark.rdd.RDD(元組(列表(T],列表(T]]],pyspark.rdd.RDD(元組(列表(T],列表(T],列表(浮動]]]] )

排名算法的評估者。

參數
predictionAndLabels pyspark.RDD

(預測排名,地麵真理的抽樣集)或雙人(預測排名,地麵實況,相關性地麵實況集)的價值。3.4.0以來,它支持ndcg評價與價值相關性。

例子

> > >predictionAndLabels=sc並行化([([1,6,2,7,8,3,9,10,4,5),(1,2,3,4,5]),([4,1,5,6,2,7,3,8,9,10),(1,2,3]),([1,2,3,4,5),[]))> > >指標=RankingMetrics(predictionAndLabels)> > >指標precisionAt(1)0.33……> > >指標precisionAt(5)0.26……> > >指標precisionAt(15)0.17……> > >指標meanAveragePrecision0.35……> > >指標meanAveragePrecisionAt(1)0.3333333333333333……> > >指標meanAveragePrecisionAt(2)0.25……> > >指標ndcgAt(3)0.33……> > >指標ndcgAt(10)0.48……> > >指標recallAt(1)0.06……> > >指標recallAt(5)0.35……> > >指標recallAt(15)0.66……

方法

調用(名字,*一個)

調用的方法java_model

meanAveragePrecisionAt(k)

返回意味著平均精度(地圖)起初k排名的所有查詢。

ndcgAt(k)

計算所有查詢的平均NDCG價值,截斷在排名位置k。

precisionAt(k)

計算所有查詢的平均精度,截斷在排名位置k。

recallAt(k)

計算的平均召回所有的查詢,截斷在排名位置k。

屬性

meanAveragePrecision

返回意味著平均精度(地圖)的所有查詢。

方法的文檔

調用 ( 的名字:str,*一個:任何 )→任何

調用的方法java_model

meanAveragePrecisionAt ( k:int )→浮動

返回意味著平均精度(地圖)起初k排名的所有查詢。如果查詢空地麵實況,平均精度為零和一個日誌生成警告。

ndcgAt ( k:int )→浮動

計算所有查詢的平均NDCG價值,截斷在排名位置k。折扣累積獲得的位置計算k:和,我= 1,,^ ^ k(2 ^{“我”th條目的相關性}^ - 1)/日誌(i + 1),和NDCG獲得地麵常規心電圖值除以真理。在當前實現中,相關性值是二進製。如果查詢空地麵實況,0將被用作NDCG連同日誌警告。

precisionAt ( k:int )→浮動

計算所有查詢的平均精度,截斷在排名位置k。

如果為一個查詢,排序算法返回n (n < k)結果,精度值將被計算為#(相關檢索項)/ k。這個公式也適用於地麵真值集的大小小於k。

如果查詢空地麵實況,0將被用作精密結合日誌警告。

recallAt ( k:int )→浮動

計算的平均召回所有的查詢,截斷在排名位置k。

如果為一個查詢,返回n結果排名算法,召回值將被計算為#(相關檢索項)/ #(地麵實況集)。這個公式也適用於地麵真值集的大小小於k。

如果查詢空地麵實況,0將被用作回憶一起日誌警告。

屬性的文檔

meanAveragePrecision

返回意味著平均精度(地圖)的所有查詢。如果查詢空地麵實況,平均精度為零和一個日誌生成警告。