取消
顯示的結果
而不是尋找
你的意思是:

如何正確地從表加載Unicode (utf - 8)字符通過JDBC連接使用辛巴火花司機嗎

全
新的貢獻者三世

你好所有的,我想把表數據從磚表包含外文字符的utf - 8使用JDBC連接到ETL工具。我用的是最新的辛巴火花JDBC驅動程序可以從磚的網站。

問題是,當數據過來所有的外語和特殊字符轉換為垃圾字符。我在尋找任何配置設置使用unicodeutf - 8與JDBC url或配置設置,但找不到任何東西。辛巴的ODBC版本驅動確實有一個屬性“UseUnicodeSqlCharacterTypes”,如果啟用了ODBC連接器為字符串並返回SQL_WVARCHAR VARCHAR列,並返回SQL_WCHAR CHAR列。

似乎沒有什麼我能做的JDBC驅動程序。有一些其他的JDBC驅動程序或其他方法我可以試著把正確編碼在JDBC unicode數據?任何幫助將不勝感激。謝謝。

9回複9

全
新的貢獻者三世

是的這個工具可以讀取鋪文件但在這種情況下它不會是最優的,可以由多個版本的鑲花組織在date_time_stamp子文件夾。更新表使用最新版本,所以我隻需要參考我的ETL程序相同的表。否則我將不得不通過編程計算出最新版本的拚花。它可以做但不是首選。特別是如果我想要更新/改變δ表,我要做的JDBC連接。

werners1
尊敬的貢獻者三世

好的我明白了。

也許你可以通過字符編碼在連接中創建的火花,

就像在這裏嗎?這個例子是甲骨文,但也可能與辛巴司機。

全
新的貢獻者三世

是的我看到同樣的文章,試著添加這些屬性作為jdbc url屬性但它不工作。我認為每個司機都有自己的url屬性的實現,您可以使用,他們隻是沒有可用的辛巴司機但Oracle司機的職位。

匿名
不適用

你可以嚐試設置

UseUnicodeSqlCharacterTypes = 1

司機,也確保文件。編碼設置為utf - 8的jvm,看看這個問題還存在嗎?

全
新的貢獻者三世

用戶你好,

我發現解決這個問題,這部分與你建議。

最初我也試著UseUnicodeSqlCharacterTypes = 1,但不產生影響。

最終我意識到這個問題是與JAVA係統屬性還建議。

我不得不更新2屬性:

文件。編碼(像你建議)

sun.jnu.encoding

一旦我設置這兩個utf - 8,一切都很好。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map