使用自動裝卸機,我每天閱讀分區的數據。數據都有一個特定的模式,但如果沒有值一列不出現在json。為一個特定的列在一個特定的表我得到一個錯誤:
不能長類型轉換為雙類型合並。
如果我指定的負載模式dlt函數,為什麼會把這個?如果我讀整個分區使用df.read.json(路徑)效果很好,如果我讀它使用df.read.format (cloudfiles) .load(路徑)失敗,由於合並問題。
整個列有0和1的整數和小數1.23456。我想發生的事情是我有一些井返回一個文件的分區完全整數數字。仍然難住了為什麼它可能推斷模式是否要指定模式。即使是推斷模式,應該讀第一個1000文件或50 gb的數據,不會有很多隻有長類型。