連接到Tableau
當您使用Databricks作為數據源時表,您可以提供強大的交互式分析,通過擴展到海量數據集,將您的數據科學家和數據工程師的貢獻帶給業務分析師。
本文的特色場景桌麵.本文後麵將酌情提供適用於其他Tableau版本的信息。看到表產品.另請參閱資源表也磚這兩款遊戲都在Tableau網站上。
需求
場景桌麵2019.3或以上。要使用Unity Catalog和Tableau管理的數據,必須使用Tableau Desktop 2021.4和Simba ODBC驅動程序2.6.19或以上版本.
Databricks ODBC驅動程序2.6.15或以上。
一個磚個人訪問令牌(推薦),或Databricks用戶名(通常是你的電子郵件地址)和密碼。
如果您的Databricks工作區是,則可能禁用用戶名和密碼身份驗證啟用單點登錄(SSO).如果是,請使用Databricks個人訪問令牌。
請注意
作為安全最佳實踐,當使用自動化工具、係統、腳本和應用程序進行身份驗證時,Databricks建議您使用屬於的訪問令牌服務主體而不是工作區用戶。要為服務主體創建訪問令牌,請參見管理服務主體的訪問令牌.
重要的
在使用OAuth驗證Tableau之前,Databricks帳戶必須滿足以下要求:
您的Databricks帳戶必須在Databricks平台E2版本Beplay体育安卓版本.所有新的Databricks帳戶和大多數現有帳戶現在都是E2。如果您不確定您擁有哪種帳戶類型,請與Databricks代表聯係。
隻有注冊了Tableau內部身份提供者(IdP)的用戶才能使用OAuth進行身份驗證。
使用夥伴連接連接到Tableau Desktop
你可以使用Databricks合作夥伴連接將集群或SQL倉庫與Tableau Desktop連接起來,隻需單擊幾下即可。
確保Databricks帳戶、工作區和已登錄用戶都符合需求為夥伴連接。
在側欄中,單擊合作夥伴聯係.
單擊表瓷磚。
在與合作夥伴聯係對話框中,為計算,選擇要連接的Databricks計算資源的名稱。如果您選擇的角色是數據科學與工程或Databricks機器學習,選擇集群或SQL倉庫。如果您選擇的角色是磚的SQL,選擇一個SQL倉庫。
選擇下載連接文件.
打開下載的連接文件,啟動Tableau Desktop。
在Tableau Desktop中,輸入您的身份驗證憑證,然後單擊登錄:
成功連接Tableau Desktop後,可以在此停止。本文中的其餘信息涵蓋了關於Tableau的其他信息,例如手動連接Tableau Desktop、在Linux上設置Tableau Server、如何使用Tableau Online以及使用Tableau的最佳實踐和故障排除。
手動連接到Tableau Desktop
按照下麵的說明使用Tableau Desktop連接到集群或SQL倉庫。
請注意
為了更快地連接Tableau Desktop,使用夥伴連接.
得到了服務器主機名和HTTP路徑.
啟動Tableau Desktop。
點擊文件>新建.
在數據選項卡上,單擊連接數據.
在連接器列表中,單擊磚.
進入服務器主機名而且HTTP路徑.
為身份驗證,選擇您的身份驗證方法並輸入您的身份驗證憑據。
如果您的工作空間啟用了Unity目錄,請另外設置默認目錄。在先進的選項卡,連接屬性,添加
目錄= < catalog_name >
.要更改默認目錄,請使用最初的SQL選項卡上,輸入使用目錄< catalog_name >
.點擊登錄:
成功連接Tableau Desktop後,可以在此停止。本文中的其餘信息涵蓋了關於Tableau的其他信息,例如在Linux上設置Tableau Server,如何使用Tableau Online,以及Tableau的最佳實踐和故障排除。
Linux上的Tableau服務器
編輯/etc/odbcinst.ini
包括以下內容:
[Simba Spark ODBC Driver 64-bit] Description=Simba Spark ODBC Driver (64-bit) Driver=/opt/ Simba / Spark /lib/64/libsparkodbc_sb64.so
請注意
Linux上的Tableau Server推薦64位處理架構。
在Tableau Online上發布並刷新工作簿
本文展示如何將工作簿從Tableau Desktop發布到表在線並在數據源更改時保持更新。你需要一個工作簿在Tableau Desktop和一個表在線帳戶。
從Tableau Desktop中提取工作簿的數據:在Tableau Desktop中,顯示要發布的工作簿,單擊數據>
<數據源名稱>
>提取數據.在提取數據對話框,單擊提取.
瀏覽到本地機器上要保存提取的數據的位置,然後單擊保存.
將工作簿的數據源發布到Tableau Online:在Tableau Desktop中單擊服務器>發布數據源>
<數據源名稱>
.如果Tableau服務器登錄對話框,單擊表在線鏈接,並按照屏幕上的指示登錄到Tableau Online。
在在線發布數據源到Tableau對話框,旁邊未啟用刷新,按編輯鏈接。
在顯示的彈出框中,為身份驗證,改變未啟用刷新來允許刷新訪問.
單擊此飛出之外的任何地方以隱藏它。
選擇更新工作簿以使用已發布的數據源.
點擊發布.數據源顯示在Tableau Online中。
在《Tableau Online》中發布完成對話框,單擊時間表,並按屏幕指示操作。
在線發布工作簿到Tableau:在Tableau桌麵中,顯示要發布的工作簿,單擊服務器>發布工作簿.
在在線發布工作簿到Tableau對話框,單擊發布.工作簿顯示在Tableau Online中。
Tableau Online根據您設置的時間表檢查對數據源的更改,並在檢測到更改時更新已發布的工作簿。
欲了解更多信息,請參閱Tableau網站上的以下內容:
最佳實踐和故障排除
優化Tableau查詢的兩個基本操作是:
減少在單個圖表或儀表板中查詢和可視化的記錄數量。
減少Tableau在單個圖表或儀表板中發送的查詢數量。
決定先嚐試哪個取決於您的儀表盤。如果在同一個儀表板中有許多針對單個用戶的不同圖表,則可能是Tableau向Databricks發送了太多查詢。如果您隻有幾個圖表,但加載它們需要很長時間,那麼Databricks返回的記錄可能太多,無法有效加載。
Tableau性能記錄可在Tableau Desktop和Tableau Server上使用,可以通過識別運行特定工作流或儀表板時導致延遲的進程來幫助您了解性能瓶頸在哪裏。
啟用性能記錄以調試任何Tableau問題
例如,如果查詢執行是問題所在,那麼您就知道它與數據引擎進程或正在查詢的數據源有關。如果可視化布局執行緩慢,您就知道這是VizQL。
如果性能記錄顯示在執行查詢時出現延遲,則可能是Databricks返回結果或ODBC/Connector覆蓋層將數據處理為用於VizQL的SQL花費了太多時間。出現這種情況時,您應該分析要返回的內容,並嚐試更改分析模式,使每個組、段或文章都有一個儀表板,而不是試圖將所有內容都塞進一個儀表板並依賴於Quick Filters。
如果糟糕的性能是由排序或可視化布局引起的,那麼問題可能在於儀表板試圖返回的標記數量。數據庫可以快速返回一百萬條記錄,但Tableau可能無法計算布局並對結果進行排序。如果這是一個問題,則聚合查詢並鑽取到較低的級別。您也可以嚐試更大的機器,因為Tableau隻受運行它的機器上的物理資源的限製。
有關性能記錄器的深入教程,請參見創建績效記錄.
Tableau服務器與Tableau桌麵的性能對比
一般來說,在Tableau Desktop上運行的工作流在Tableau Server上並不會更快。不能在Tableau Desktop上執行的儀表板也不能在Tableau Server上執行。記住這一點很重要。
事實上,在Desktop上運行是一種更好的故障排除技術,因為在進行故障排除時,Tableau Server有更多的進程需要考慮。如果某些東西在Tableau Desktop中可以工作,但在Tableau Server中不能,那麼你可以安全地將問題縮小到Tableau Server中沒有在Tableau Desktop中的進程。
配置
默認情況下,來自連接URL的參數將覆蓋Simba ODBC DSN中的參數。有兩種方法可以從Tableau定製ODBC配置:
.tds
單個數據源的文件:請按照保存數據源要導出
.tds
用於數據源的文件。找到屬性行
odbc-connect-string-extras = "
在.tds
文件和設置參數。例如,to enableAutoReconnect
而且UseNativeQuery
,您可以將線路改為odbc-connect-string-extras = ' AutoReconnect = 1, UseNativeQuery = 1”
.重新加載
.tds
文件,重新連接連接。
計算資源被優化為使用更少的堆內存來收集大型結果,因此它可以比Simba ODBC的默認值為每個獲取塊提供更多的行。附加
RowsFetchedPerBlock = 100000”
的值odbc-connect-string-extras
財產。.tdc
所有數據源的文件:如果你從未創建過
.tdc
文件,您可以添加TableauTdcExample.tdc到文件夾文檔/我的表庫/數據源
.將該文件添加到所有開發人員的Tableau Desktop安裝中,以便在共享儀表板時它也能工作。
優化圖表(工作表)
有許多戰術圖表優化可以幫助您提高Tableau工作表的性能。
對於不經常更改且不打算與之交互的過濾器,請使用上下文過濾器,這將加快執行時間。另一個好的經驗法則是使用如果/其他
語句而不是情況下/當
語句。
Tableau可以將過濾器下推到數據源中,這可以大大加快查詢速度。看到使用一個參數跨多個數據源過濾而且跨多個數據源過濾數據有關數據源的更多信息,請下推篩選器。
如果可以的話,最好避免表計算,因為它們需要掃描整個數據集。有關表計算的詳細信息,請參見用表計算轉換值.
優化儀表板
下麵是一些技巧和故障排除練習,您可以應用這些技巧來提高Tableau儀表板的性能。
連接到Databricks的Tableau儀表板的一個常見問題來源是在各個儀表板上使用了快速過濾器,這些儀表板服務於許多不同的用戶、功能或部分。您可以將全局快速過濾器附加到儀表板上的所有圖表。這是一個很棒的功能,但也會很快引發問題。有五個圖表的儀表板上的一個全局快速過濾器會導致向Databricks發送至少10個查詢。隨著過濾器的增加,這可能會導致更大的數字,並可能導致大量的性能問題,因為Spark並不能處理在同一時刻開始的許多並發查詢。當您使用的Databricks集群或SQL倉庫不夠大,無法處理大量查詢時,問題就更大了。
作為第一步,我們建議您使用Tableau性能記錄來排除可能導致問題的原因。
如果表現不佳是由排序或可視化布局,問題可能是儀表盤試圖返回的標記數量。數據庫可以快速返回一百萬條記錄,但Tableau可能無法計算布局並對結果進行排序。如果這是一個問題,則聚合查詢並鑽取到較低的級別。您也可以嚐試更大的機器,因為Tableau隻受運行它的機器上的物理資源的限製。
有關在Tableau中下鑽的信息,請參見深入研究細節.
一般來說,看到許多顆粒標記通常是一種糟糕的分析模式,因為它不能提供洞察力。從更高級別的聚合向下鑽取更有意義,並減少了需要處理和可視化的記錄數量。
使用動作來優化儀表板
為了獲得與“海洋沸騰”儀表板相同的分析和信息,可以使用Tableau從組到段再到文章進行鑽取行動.動作允許您單擊一個標記(例如地圖上的一個狀態),並將其發送到另一個儀表板,該儀表板根據您單擊的狀態進行篩選。這減少了在一個儀表板上使用許多過濾器的需要,並減少了需要生成的記錄數量,因為您可以將操作設置為在獲得要篩選的謂詞之前不生成記錄。
有關更多信息,請參見行動而且6個技巧讓你的儀表板更高效.
緩存
緩存數據是提高工作表或儀表板性能的好方法。
Tableau中的緩存
Tableau在返回數據之前有四層緩存,無論該數據是在活動連接中還是在提取中:
瓷磚:如果有人正在加載完全相同的儀表板,而沒有任何變化,那麼Tableau將嚐試為圖表重用相同的磁貼。這類似於穀歌地圖瓷磚。
模型:有數學計算用於生成可視化的事件,瓷磚不能使用。Tableau Server嚐試使用相同的模型。
摘要:同時存儲查詢的聚合結果。這是第三個“防禦”層麵。如果一個查詢在之前的查詢中返回Sum(Sales), Count(orders), Sum(Cost),而未來的查詢隻需要Sum(Sales),那麼Tableau將獲取該結果並使用它。
本地緩存:如果查詢與另一個查詢完全相同,Tableau使用相同的結果。這是緩存的最後一層。如果失敗,Tableau將轉向數據。
緩存的頻率
Tableau有管理設置,用於緩存或多或少。如果服務器設置為少刷新, Tableau將數據保存在緩存中長達12小時。如果設置為更頻繁地刷新, Tableau會返回每次刷新頁麵時的數據。
beplay体育app下载地址重複使用同一儀表板的客戶(例如,“周一早上的管道報告”)應該在服務器上設置為“較少刷新”,以便儀表板都使用相同的緩存。
緩存變暖
在Tableau中,您可以通過在查看儀表板之前為儀表板發送訂閱來預熱緩存。這是因為為了為訂閱電子郵件生成圖像,需要渲染儀表板。看到使用訂閱加熱Tableau服務器緩存.
在數據庫裏緩存
您可以在用戶使用Tableau儀表板之前緩存流行的表或重要的表,以減少Databricks將結果返回到Tableau的時間。
你可以在早上運行腳本選擇緩存
對於帶有三角洲緩存在為緩存優化的虛擬機上。
您甚至可以緩存Databricks從驅動程序獲得的特定查詢。
故障排除
Tableau Desktop:提示錯誤“The drivers…are not proper installed”
問題:當您嚐試連接Tableau Desktop到Databricks時,Tableau在連接對話框中顯示錯誤消息,並鏈接到驅動程序下載頁麵,在那裏您可以找到驅動程序鏈接和安裝說明。
導致:您安裝的Tableau Desktop沒有運行受支持的驅動程序。
決議:下載Databricks ODBC驅動2.6.15或以上版本。
另請參閱:錯誤“驅動程序…沒有正確安裝”在Tableau網站上。