肌萎縮性側索硬化症

pyspark.mllib.recommendation。 肌萎縮性側索硬化症

交替最小二乘矩陣分解

方法

火車(評分,排名(迭代、lambda_…))

火車一個矩陣分解模型給定用戶評級的抽樣產品的一個子集。

trainImplicit(評分,排名[、迭代…])

火車一個矩陣分解模型給出一個抽樣的內隱偏好的用戶對產品的一個子集。

方法的文檔

classmethod 火車 ( 評級:聯盟(pyspark.rdd.RDD(pyspark.mllib.recommendation.Rating],pyspark.rdd.RDD(元組(int,int,浮動]]],排名:int,迭代:int=5,lambda_:浮動=0.01,:int=- 1,非負:bool=,種子:可選(int]=沒有一個 )pyspark.mllib.recommendation.MatrixFactorizationModel

火車一個矩陣分解模型給定用戶評級的抽樣產品的一個子集。評級矩陣近似作為給定的兩個低等級的乘積矩陣秩(特性)的數量。迭代解出這些特性,ALS運行可配置程度的並行性。

參數
評級 pyspark.RDD

抽樣的評級或(userID, productID,評級)元組。

排名 int

使用數量的特性(也稱為潛在因素的數量)。

迭代 int,可選

ALS的迭代次數。(默認值:5)

lambda_ 浮動,可選

正則化參數。(默認值:0.01)

int,可選

數量的塊用於並行化計算。1的值將使用一個自動配置塊的數量。(默認值:1)

非負 bool,可選

真正能解決的價值與nonnegativity約束最小二乘。(默認值:False)

種子 bool,可選

隨機種子初始矩陣分解模型。的值都將使用係統時間作為種子。(默認值:無)

classmethod trainImplicit ( 評級:聯盟(pyspark.rdd.RDD(pyspark.mllib.recommendation.Rating],pyspark.rdd.RDD(元組(int,int,浮動]]],排名:int,迭代:int=5,lambda_:浮動=0.01,:int=- 1,α:浮動=0.01,非負:bool=,種子:可選(int]=沒有一個 )pyspark.mllib.recommendation.MatrixFactorizationModel

火車一個矩陣分解模型給出一個抽樣的內隱偏好的用戶對產品的一個子集。評級矩陣近似作為給定的兩個低等級的乘積矩陣秩(特性)的數量。迭代解出這些特性,ALS運行可配置程度的並行性。

參數
評級 pyspark.RDD

抽樣的評級或(userID, productID,評級)元組。

排名 int

使用數量的特性(也稱為潛在因素的數量)。

迭代 int,可選

ALS的迭代次數。(默認值:5)

lambda_ 浮動,可選

正則化參數。(默認值:0.01)

int,可選

數量的塊用於並行化計算。1的值將使用一個自動配置塊的數量。(默認值:1)

α 浮動,可選

一個常數計算中使用的信心。(默認值:0.01)

非負 bool,可選

真正能解決的價值與nonnegativity約束最小二乘。(默認值:False)

種子 int,可選

隨機種子初始矩陣分解模型。的值都將使用係統時間作為種子。(默認值:無)