取消
顯示的結果
而不是尋找
你的意思是:

規範的數據自動裝卸機

Rishitha
新的貢獻者二世

我有s3數據和我使用自動裝卸機加載數據。我的json文檔字段數組的結構。

當我不指定任何模式甚至整個數據存儲為字符串數組的結構隻是一個blob弦很難的過程pyspark dataframe。

當我做指定模式自動加載,整個表是空的。

有人麵臨任何類似的問題嗎?

1接受解決方案

接受的解決方案

artsheiko
重視貢獻二世
重視貢獻二世

讓我們試試以下:

cloudfile_options = {" cloudFiles。”:“json格式”、“cloudFiles。schemaLocation”:“< path_to_schema_checkpoints_location >”、“cloudFiles。在ferColumnTypes":"true" } spark.readStream.format("cloudFiles").options(**cloudfile_options).load("")

在原帖子查看解決方案

2回答2

artsheiko
重視貢獻二世
重視貢獻二世

讓我們試試以下:

cloudfile_options = {" cloudFiles。”:“json格式”、“cloudFiles。schemaLocation”:“< path_to_schema_checkpoints_location >”、“cloudFiles。在ferColumnTypes":"true" } spark.readStream.format("cloudFiles").options(**cloudfile_options).load("")

Vidula_Khanna
主持人
主持人

嗨@Rishitha Reddy

希望一切進行得很順利。

隻是想檢查如果你能解決你的問題。如果是的,你會很高興的答案標記為最好,其他成員可以找到解決方案更快嗎?如果不是,請告訴我們,我們可以幫助你。

幹杯!

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map