你好,我有一個blob存儲與相同的後綴folder_report_name_01_2023_01_02 multile解壓縮文件夾- > file_name_2023_01_02.xlsx
但我想所有這些數據加載使用熊貓或pyspark和δ表中插入。
我想使用小部件但我不想手動輸入所有的名字,存在一種改變這個文件夾和文件名自動嗎?
你好,
我強烈推薦檢查這個文檔https://spark.apache.org/docs/latest/api/python/user_guide/pandas_on_spark/index.html你可以使用熊貓api火花。它將有一個很大的好處,當你比較標準的熊貓,隻有司機上運行。在本文檔中,您可以找到一些例子使用熊貓如何讀取數據。
你好,
我強烈推薦檢查這個文檔https://spark.apache.org/docs/latest/api/python/user_guide/pandas_on_spark/index.html你可以使用熊貓api火花。它將有一個很大的好處,當你比較標準的熊貓,隻有司機上運行。在本文檔中,您可以找到一些例子使用熊貓如何讀取數據。