Sparklyr之間提供了一個接口是一個開源包R和Apache火花。您現在可以利用R火花的能力在現代環境中,由於火花與分布式數據交互的能力幾乎沒有延遲。Sparklyr是一種有效的工具在交互式環境中與大型數據集。這樣你可以受益於熟悉的工具在火花R為了分析數據。,給你最好的兩個世界。
通過Sparklyr可以使用火花作為dplyr後端,一個受歡迎的數據操作方案。Sparklyr提供了一係列功能,允許我們訪問火花的工具轉換/預處理數據,最重要的是,它還提供了接口火花的分布式機器學習算法等等。Sparklyr也是可擴展的。R包取決於Sparklyr調用API可以創建完整的火花。這樣的一個擴展是H2O Rsparkling, R包兼容H2O的機器學習算法。