pyspark.pandas.read_sql¶

pyspark.pandas。 read_sql ( sql:str,反對:str,index_col:聯盟(str,列表(str),沒有一個)=沒有一個,列:聯盟(str,列表(str),沒有一個)=沒有一個,* *選項:任何 )→pyspark.pandas.frame.DataFrame¶

讀取SQL查詢或DataFrame數據庫表。

這個函數是一個方便的包裝read_sql_table和read_sql_query(向後兼容性)。將委托給特定的函數根據提供的輸入。將被路由到一個SQL查詢read_sql_query,而將被路由到一個數據庫表的名字read_sql_table。注意,委托功能可能有更具體的筆記對他們的功能沒有列在這裏。

請注意

一些數據庫可能衝擊引發的問題:火花- 27596

參數

sql 字符串: 要執行的SQL查詢或表名。
反對 str: 一個JDBC URI可以提供為str。

請注意

必須JDBC URI URI URI而不是Python的數據庫。
index_col 字符串或字符串列表,可選的,默認值:沒有: 列設置為指數(s) (MultiIndex)。
列列表,默認值:沒有: 選擇SQL表的列名列表(閱讀時隻使用一個表)。
選項 dict: 所有其他選項直接傳遞到火花的JDBC數據源。

返回

DataFrame

另請參閱

read_sql_table: 讀成DataFrame SQL數據庫表。
read_sql_query: 讀DataFrame SQL查詢。

例子

           > > >ps。read_sql(“table_name”,“jdbc: postgresql: db_name”)> > >ps。read_sql(“SELECT * FROM table_name”,“jdbc: postgresql: db_name”)
          

以前的

pyspark.pandas.read_sql_query

下一個

通用函數