如果你想學習一門新語言開發數據工程/科學和/或機器學習代碼在一般情況下,選擇是你R或Python基於語法之間你會發現更直觀(記住,基於公共數據,你會發現,Python是更受歡迎,因為R最初是由統計人員統計學家)。
火花時分析大量的數據:在一個較低的水平,引發執行Scala代碼,這意味著兩個Python / R api隻是簡單意味著與火花通信引擎(即催化劑優化器)編寫高度優化的Scala代碼基於你想實現什麼,小/特定於語言的開銷可以忽略不計。如果你用於高層解釋型語言,而不必擔心發生的事情在一個較低的水平,然後Python或R的路要走。雖然我個人喜歡Python API,我鼓勵你學習Scala對多線程的基本知識,因為如果你有很多現有的基於sql的工作負載和代碼,您可以以最小的Scala知識多線程執行這些查詢優化性能和資源使用。
最後,當涉及到使用磚,沒有真正的贏家,語言的價值和美麗的平台之間的交往能力是所有和得到最好的,代碼效率最大化(例如利用Scala多線程的SQL查詢)。Beplay体育安卓版本
希望這有助於
如果你想學習一門新語言開發數據工程/科學和/或機器學習代碼在一般情況下,選擇是你R或Python基於語法之間你會發現更直觀(記住,基於公共數據,你會發現,Python是更受歡迎,因為R最初是由統計人員統計學家)。
火花時分析大量的數據:在一個較低的水平,引發執行Scala代碼,這意味著兩個Python / R api隻是簡單意味著與火花通信引擎(即催化劑優化器)編寫高度優化的Scala代碼基於你想實現什麼,小/特定於語言的開銷可以忽略不計。如果你用於高層解釋型語言,而不必擔心發生的事情在一個較低的水平,然後Python或R的路要走。雖然我個人喜歡Python API,我鼓勵你學習Scala對多線程的基本知識,因為如果你有很多現有的基於sql的工作負載和代碼,您可以以最小的Scala知識多線程執行這些查詢優化性能和資源使用。
最後,當涉及到使用磚,沒有真正的贏家,語言的價值和美麗的平台之間的交往能力是所有和得到最好的,代碼效率最大化(例如利用Scala多線程的SQL查詢)。Beplay体育安卓版本
希望這有助於