嗨@Gnanasoundari Soundarajan
根據你提供的詳細信息,您每天都不覆蓋所有的分區使用append模式,這意味著你可能會寫在第一天的數據。2天,你想訪問這些分區值和運行一個操作。您可以檢索數據寫在第一天遵循以下步驟:
# #創建一個臨時表上曆史觀火花。sql (s”desc < table_name >”) .filter(“操作”= = =美元(“追加”)).orderBy(“時間戳”.desc美元).createOrReplaceTempView (“< tempViewName >”) # #創建一個sql創建數據庫表的視圖%如果不存在測試;創建表如果不存在table_name_1使用三角洲作為select * < tempViewName >;# #從上麵創建的表%選擇有關列顯示sql (sql(“”選擇job.runId runId, operationParameters。batchId batchId operationMetrics。numRemovedFiles numRemovedFiles operationMetrics。numRemovedBytes numRemovedBytes operationMetrics。numAddedFiles numAddedFiles operationMetrics。從table_name_1 numAddedBytes numAddedBytes, * " " "))
由此,你可以得到什麼版本添加日誌中由於哪個操作(優化、追加等)
% python #查詢三角洲表版本使用versionAsOf (df =火花。讀.format(“δ”).option (“versionAsOf”、“5238”) .load(路徑“/ / /我的/表”))#查詢三角洲表版本使用@參數(df =火花。讀.format(“δ”).load(“/道路/ /我/ table@v5238”)) % sql——查詢metastore-defined三角洲表版本從my_table選擇COUNT(*)在5238年從my_table@v5238——選擇COUNT(*)查詢三角洲表由版本文件路徑從delta.選擇COUNT(*)“/道路/ /我/ table@v5238”
現在你有這個版本對應的數據。你可以創建一個視圖上執行一個操作的,或者你可以把它作為描述在上麵的代碼片段。
希望這是有幫助的
嗨@Gnanasoundari Soundarajan
根據你提供的詳細信息,您每天都不覆蓋所有的分區使用append模式,這意味著你可能會寫在第一天的數據。2天,你想訪問這些分區值和運行一個操作。您可以檢索數據寫在第一天遵循以下步驟:
# #創建一個臨時表上曆史觀火花。sql (s”desc < table_name >”) .filter(“操作”= = =美元(“追加”)).orderBy(“時間戳”.desc美元).createOrReplaceTempView (“< tempViewName >”) # #創建一個sql創建數據庫表的視圖%如果不存在測試;創建表如果不存在table_name_1使用三角洲作為select * < tempViewName >;# #從上麵創建的表%選擇有關列顯示sql (sql(“”選擇job.runId runId, operationParameters。batchId batchId operationMetrics。numRemovedFiles numRemovedFiles operationMetrics。numRemovedBytes numRemovedBytes operationMetrics。numAddedFiles numAddedFiles operationMetrics。從table_name_1 numAddedBytes numAddedBytes, * " " "))
由此,你可以得到什麼版本添加日誌中由於哪個操作(優化、追加等)
% python #查詢三角洲表版本使用versionAsOf (df =火花。讀.format(“δ”).option (“versionAsOf”、“5238”) .load(路徑“/ / /我的/表”))#查詢三角洲表版本使用@參數(df =火花。讀.format(“δ”).load(“/道路/ /我/ table@v5238”)) % sql——查詢metastore-defined三角洲表版本從my_table選擇COUNT(*)在5238年從my_table@v5238——選擇COUNT(*)查詢三角洲表由版本文件路徑從delta.選擇COUNT(*)“/道路/ /我/ table@v5238”
現在你有這個版本對應的數據。你可以創建一個視圖上執行一個操作的,或者你可以把它作為描述在上麵的代碼片段。
希望這是有幫助的