DD Sharma於2022年12月1日更新

獲取最後修改時間的所有文件在自動加載器和批處理作業

您正在使用Auto Loader (AWS | Azure | GCP)運行流作業,並希望從存儲帳戶獲得每個文件的最後修改時間。獲取由Auto Loader使用的文件的路徑文章描述了如何獲取由Auto Loader使用的所有文件的文件名和路徑。在本文中,我們將在此基礎上……

1分鍾閱讀時間
DD Sharma於2022年5月24日更新

從雪花中讀取數據不正確

你有一個作業正在使用Apache Spark從雪花表中讀取數據,但在Dataframe中顯示的時間數據是不正確的。如果直接在雪花上運行相同的查詢,將返回正確的時間數據。產生原因時區設置不正確。Databricks集群的時區值與Snowf…

0分鍾讀取時間
DD Sharma於2022年10月7日更新

零保留的真空會導致數據丟失

問題向Delta表中添加數據,但數據毫無警告地消失了。沒有明顯的錯誤消息。產生原因當spark. databicks .delta. retentiondurationcheck .enabled設置為false並且VACUUM配置為保留0小時時,會發生這種情況。%sql VACUUM RETAIN 0 HOURS OR %sql VACUUM delta. ' 1分鍾閱讀時間

DD Sharma於2022年5月10日更新

無法將字符串強製轉換為varchar

你試圖將一個字符串類型的列轉換為varchar,但它不工作。提示在Databricks Runtime 8.0及以上版本中支持varchar數據類型(AWS | Azure | GCP)。創建一個簡單的Delta表,其中一列為類型string。創建或替換表delta_table1 (' col1 ' string)使用SHOW TABLE在新創建的ta…

0分鍾讀取時間
加載更多