pyspark.pandas.read_sql¶
-
pyspark.pandas。
read_sql
( sql:str,反對:str,index_col:聯盟(str,列表(str),沒有一個)=沒有一個,列:聯盟(str,列表(str),沒有一個)=沒有一個,* *選項:任何 )→pyspark.pandas.frame.DataFrame¶ -
讀取SQL查詢或DataFrame數據庫表。
這個函數是一個方便的包裝
read_sql_table
和read_sql_query
(向後兼容性)。將委托給特定的函數根據提供的輸入。將被路由到一個SQL查詢read_sql_query
,而將被路由到一個數據庫表的名字read_sql_table
。注意,委托功能可能有更具體的筆記對他們的功能沒有列在這裏。請注意
一些數據庫可能衝擊引發的問題:火花- 27596
- 參數
-
- sql 字符串
-
要執行的SQL查詢或表名。
- 反對 str
-
一個JDBC URI可以提供為str。
請注意
必須JDBC URI URI URI而不是Python的數據庫。
- index_col 字符串或字符串列表,可選的,默認值:沒有
-
列設置為指數(s) (MultiIndex)。
- 列 列表,默認值:沒有
-
選擇SQL表的列名列表(閱讀時隻使用一個表)。
- 選項 dict
-
所有其他選項直接傳遞到火花的JDBC數據源。
- 返回
-
- DataFrame
另請參閱
-
read_sql_table
-
讀成DataFrame SQL數據庫表。
-
read_sql_query
-
讀DataFrame SQL查詢。
例子
> > >ps。read_sql(“table_name”,“jdbc: postgresql: db_name”)> > >ps。read_sql(“SELECT * FROM table_name”,“jdbc: postgresql: db_name”)