06-16-202105:49我
最好的NLP api使用火花提供更好的性能
06-17-202159點
目前最受歡迎的和全麵的圖書館,據我所知,為Spark-native分布式NLP,從約翰·斯諾spark-nlp實驗室。https://nlp.johnsnowlabs.com/它是開源的(但與商業支持選項)和有很多的功能。
你也可以用寬大的,nltk和其他non-Spark NLP庫與火花,通過編寫熊貓udf,利用這些庫,然後將它們應用到數據與火花。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。