取消
顯示的結果
而不是尋找
你的意思是:

如何閱讀PDF文件從Azure Datalake blob存儲數據磚嗎

PunithRaj
新的因素

我有一個情況我需要閱讀pdf文件從“Azure Datalake blob存儲數據磚”,連接是通過廣告訪問的地方。

生成SAS令牌已被限製在我們的環境中由於安全問題。

下麵的腳本可以讀出pdf文件的文件夾的名稱。

pdf_path = " abfss:datalakename.dfs.core.windows.net/ <容器文件夾路徑>”

pdf_df = spark.read.format (binaryFile) .load (pdf_path) .cache ()

顯示器(pdf_df)

然而,以上步驟後發現困難通過formrecognizer函數的pdf文件。

所以,如果有人試圖實現閱讀PDF文件從Azure Datalake到磚,請幫我的腳本或方法。

提前感謝!

最好的問候,

Punith拉吉

1回複1

Aviral-Bhardwaj
尊敬的貢獻者三世

嘿,@Punith raj,

不確定Azure但在AWS服務有一個稱為AWS辦理請盡量一次探索

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map