10-18-202106:49我
數據從源複製到外部ADLS進一步被磚,那麼這個按摩數據放在出站文件。特殊字符?(問號在黑鑽石)是在某些領域在出站文件可能破壞現有代碼並不確定。
10-18-2021上午08:38
這就需要編碼。你可以試著在讀取文件編碼輸出。
.option(“編碼”、“UTF-16LE”)
請參考下圖:
https://docs.microsoft.com/en-us/azure/databricks/kb/data-sources/json-unicode
https://community.www.eheci.com/s/question/0D53f00001HKHnfCAH/issues-with-utf16-files-and-unicode-c..。
在原帖子查看解決方案
10-18-202107:03我
嗨@Jazmine中時被複製的數據類型是什麼?數據有Unicode字符或符號像c,…?
10-18-2021上午07:28
嗨Prabakar,
感謝promt響應。
這是一個文本文件與客戶數據。
我沒有見過這樣的字符數據但在文本輸入字段,這種類型的數據可以輸入端。
10-18-202107:44我
是的,文本可以包含這些字符。
10-18-2021上午07:51
所以這個問題的原因是那些Unicode字符。我認為應該有一個修複。我將檢查並回到這裏。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。