取消
顯示的結果
而不是尋找
你的意思是:

再執行時間從火花Dataframe編寫到SQL server表

Sha_1890
新的貢獻者三世

我有8 gb的XML數據加載到不同的dataframes,有兩個dataframes 24款和82年十萬的數據寫入一個SQL server 2表2小時和5小時的時間來寫這本書。

我用下麵的集群配置

集群

和python代碼

df.write.format (jdbc)。選項(“url”, jdbcUrl) .partitionBy (C_Code) .mode .option(“追加”)(“數據表”,“staging.tablename”)。jdbcUsername選項(“用戶”)。選項(“密碼”,jdbcPassword) .save ()

請建議我通過其他方式降低執行時間。

0回答0
歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map