取消
顯示的結果
而不是尋找
你的意思是:

模糊文本匹配的火花

manugarri
新的貢獻者二世

我有一個客戶提供數據列表,一個公司名稱的列表。

我必須將這些名稱與公司名稱的內部數據庫。客戶端列表可以裝入內存(大約10 k元素),但內部對hdfs數據集,我們使用火花accesing它。

我怎麼能去匹配客戶名單?我想做一個矩陣(RowMatrix) N x D元素,N端元素的數量和D是內部客戶名單的長度)和計算相似性對明智的。

我怎麼可以這樣在火花?任何幫助將非常歡迎。

10個回答10

聲音的
新的貢獻者二世

您可以使用Zingg:火花基於開源工具https://github.com/zinggAI/zingg

Baidu
map