@Lakshmi Jayaraman:
有可能相關的問題是閱讀時使用的編碼三角洲表使用的Python腳本。一個解決方案是閱讀時顯式地指定的編碼表。
你可以試著讀表使用Python中的三角洲包和指定的編碼如下:
從三角洲。表導入DeltaTable DeltaTable = DeltaTable。forPath(火花,“/道路/ /表”)df = deltaTable.toDF() #顯式地指定編碼在df顯示列坳。列:打印(col.encode (utf - 8))
這應該以utf - 8格式顯示列名。然後您可以使用這些列DataFrame引用的列的名稱。
如果這不起作用,你可以嚐試閱讀三角洲表在Python中使用火花SQL腳本如下:
df = spark.read.format(“δ”).load(“/道路/ /表”)#顯式地指定編碼在df顯示列坳。列:打印(col.encode (utf - 8))
這也應該以utf - 8格式顯示列名。
如果這兩個解決方案,這個問題有可能與三角洲湖的版本使用的Python腳本。確保您使用的是版本兼容的三角洲湖三角洲表屬性設置。您可以檢查使用的版本的三角洲湖磚通過運行下麵的命令:
% sh貓/磚/火花/ python / lib / python3.7 /網站/δ/版本
確保您的Python腳本中使用的版本的三角洲湖匹配版本用於磚。