pyspark.pandas.read_sql

pyspark.pandas。 read_sql ( sql:str,反對:str,index_col:聯盟(str,列表(str),沒有一個)=沒有一個,:聯盟(str,列表(str),沒有一個)=沒有一個,* *選項:任何 )→pyspark.pandas.frame.DataFrame

讀取SQL查詢或DataFrame數據庫表。

這個函數是一個方便的包裝read_sql_tableread_sql_query(向後兼容性)。將委托給特定的函數根據提供的輸入。將被路由到一個SQL查詢read_sql_query,而將被路由到一個數據庫表的名字read_sql_table。注意,委托功能可能有更具體的筆記對他們的功能沒有列在這裏。

請注意

一些數據庫可能衝擊引發的問題:火花- 27596

參數
sql 字符串

要執行的SQL查詢或表名。

反對 str

一個JDBC URI可以提供為str。

請注意

必須JDBC URI URI URI而不是Python的數據庫。

index_col 字符串或字符串列表,可選的,默認值:沒有

列設置為指數(s) (MultiIndex)。

列表,默認值:沒有

選擇SQL表的列名列表(閱讀時隻使用一個表)。

選項 dict

所有其他選項直接傳遞到火花的JDBC數據源。

返回
DataFrame

另請參閱

read_sql_table

讀成DataFrame SQL數據庫表。

read_sql_query

讀DataFrame SQL查詢。

例子

> > >psread_sql(“table_name”,“jdbc: postgresql: db_name”)> > >psread_sql(“SELECT * FROM table_name”,“jdbc: postgresql: db_name”)