取消
顯示的結果
而不是尋找
你的意思是:

加上鑲花文件的創建日期DataFrame

wyzer
因素二世

目前我加載多個拚花文件代碼:

df = spark.read.parquet (“/ mnt / dev /銅/憑證/ * / *”)

(代金券文件夾,裏麵有一個文件夾按日期。包含一個鑲花的每一個文件)

我如何添加一個列到這個DataFrame,包含每個拚花文件的創建日期嗎?

謝謝

1接受解決方案

接受的解決方案

MichailKaramano
貢獻者

你好,

您可以使用文件元數據列:https://docs.www.eheci.com/ingestion/file-metadata-column.html

這樣你可以訪問file_path,file_name,file_sizefile_modification_time數據文件的相應dataframe行。不需要手動做!

我發現它有用:slightly_smiling_face:

在原帖子查看解決方案

2回答2

MichailKaramano
貢獻者

你好,

您可以使用文件元數據列:https://docs.www.eheci.com/ingestion/file-metadata-column.html

這樣你可以訪問file_path,file_name,file_sizefile_modification_time數據文件的相應dataframe行。不需要手動做!

我發現它有用:slightly_smiling_face:

wyzer
因素二世

由於@Michail Karamanos

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map