取消
顯示的結果
而不是尋找
你的意思是:

如何正確地讀取數據庫文件(.db)火花JDBC更新後在Python中嗎?

jomt
新的貢獻者三世

我有一組數據庫文件(.db),我需要讀到Python筆記本在磚。我設法做這相當簡單直到7月當介紹了JDBC SQLite庫的更新。

到目前為止我讀過的文件的問題(修改)代碼:

df = spark.read。格式(“jdbc”).options(url =“< url >”,

數據表= “<表>” ,
司機= “org.sqlite.JDBC” ) .load ()的
然而,更新數據後,正在讀是完全錯誤的(如數字列與非負數字,突然間包含一些負數的實際價值不同於文件)。
有更好的方法來讀取.db文件在新的SQLite JDBC 3.42.0.0升級?
1接受解決方案

接受的解決方案

jomt
新的貢獻者三世

當表中的數據非常大(幾十億)或非常低(例如1 e15汽油),SQLite JDBC可能難以導入正確的值。為了解決這一問題,可以使用一個好主意customSchema選項來定義模式中使用高的小數範圍(或許多小數當數字很低)。

df = spark.read。格式(“jdbc”).options(url =“< url >”,

數據表= “<表>” ,
司機= “org.sqlite.JDBC”,
customSchema = “< col1 >小數(38歲,0),< col2 >小數(38歲,0),< col3 >小數(38歲,0)”
) .load ()的

在原帖子查看解決方案

1回複1

jomt
新的貢獻者三世

當表中的數據非常大(幾十億)或非常低(例如1 e15汽油),SQLite JDBC可能難以導入正確的值。為了解決這一問題,可以使用一個好主意customSchema選項來定義模式中使用高的小數範圍(或許多小數當數字很低)。

df = spark.read。格式(“jdbc”).options(url =“< url >”,

數據表= “<表>” ,
司機= “org.sqlite.JDBC”,
customSchema = “< col1 >小數(38歲,0),< col2 >小數(38歲,0),< col3 >小數(38歲,0)”
) .load ()的

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map