跳轉到主要內容
公司博客上

在磚建造下一代可視化工具

分享這篇文章

磚的SQL現在一般用於AWS和Azure。


這篇文章是我們的博客係列的一部分我們的前端工作。你可以看到前一個“簡化數據+人工智能,一行一次打印稿。

經過多年的工作數據可視化工具,我最近加入了磚的創始成員可視化團隊,致力於開發高性能磚產品的可視化分析功能。在這篇文章中,我分享我為什麼超級興奮在磚建造新一代的可視化工具。

使命對齊:簡化數據和人工智能

我加入了磚,因為我的激情與公司的使命來簡化數據和人工智能。

背景,我在攻讀博士學位威斯康辛大學交互式數據實驗室研究新的可視化工具,使數據更容易(如實驗室並通過創建D3.js)。博士學位後,我加入了蘋果的AI /毫升組作為第一可視化研究科學家和與機器智能可視化團隊為機器學習在蘋果構建更好的可視化工具。多年來,我與許多開源項目,旨在簡化數據可視化和人工智能,包括Vega-Lite,“航行者”號,Tensorflow圖形可視化

Vega-Lite允許用戶輕鬆地構建交互式可視化的簡潔和直觀的JSON API。


類似於Apache火花™如何幫助人們運行分布式計算隻有幾行Python或SQL, Vega-Lite幫助用戶構建交互式圖表寫十行代碼(而不是數百D3.js)。Vega-Lite JSON格式還支持的開源社區建設等其他語言的包裝器api在Python牽牛星。因此,人們可以輕鬆地創建交互式圖表在這些語言。

“航行者”號是一個圖形界麵,利用圖表對數據探索的建議。
“航行者”號是一個圖形界麵,利用圖表對數據探索的建議。

除了簡化代碼可視化,我還建立了一個數據可視化的工具,無需編寫代碼。的“航行者”號係統利用圖的建議來幫助人們迅速探索圖形用戶界麵(GUI)中的數據。作為一個研究項目,“航行者”號收到很多牽引等與JupyterLab集成。然而,建立一個生產GUI工具和集成與數據科學環境需要大量資源超出一個小研究團隊。因此,我一直想要一個機會采取這些研究的一些想法。

所以當我聽說磚是組建一個團隊來開發新的可視化工具上的強大Lakehouse平Beplay体育安卓版本台我欣然接受這個機會。

磚:獨特的可視化工具建築商的機會

磚為構建新一代的可視化工具提供了一個獨特的機會,原因有很多:

首先,磚是數據尺度生活的地方。最難的問題之一可視化工具需要克服獲得采用的是集成的數據源。在5000年全球組織使用磚Lakehouse平台數據工程,機器學習和分析。Beplay体育安卓版本每一天,平台流程eb的數據在數Beplay体育安卓版本以百萬計的機器。我們可以構建工具,影響數據分析師、數據工程師,和數據科學家在這個平台上,數據是現成的。Beplay体育安卓版本

其次,公司擁有強大的開源文化。磚被原始的作者共同創立Apache火花,此後許多領先的開源項目包括建造三角洲湖MLflow。在磚,我們有機會影響客戶建立產品和開源社區做出貢獻。beplay体育app下载地址

第三,未來的可視化工具應該被集成到數據,分析和機器學習工作流程,所以人們可以很容易地利用可視化的力量。作為一個統一的平台,所有這Beplay体育安卓版本些工作流,磚是完美的地方建造這些集成。

最後但並非最不重要,因為可視化為磚是一種相對較新的領域,我們有靈活創新一種新的可視化工具不受幾十年的遺產。

磚Lakehouse平台提供了一個統一的環境數據,Beplay体育安卓版本分析和機器學習的工作。
磚Lakehouse平台提供了一個統一的環境數據,Beplay体育安卓版本分析和機器學習的工作。可視化可以不可分割的一部分,這些不同的活動。

可視化工具作為一個統一的平台不可或缺的一部分Beplay体育安卓版本

有許多令人興奮的挑戰和優勢構建可視化工具作為一個集成的統一平台的一部分數據,分析和人工智能。Beplay体育安卓版本這裏有一些亮點。

橋接代碼和圖形用戶界麵

我們考慮不同組的數據工人,包括程序員和程序員,激動人心的挑戰之一是設計工具,可以受益於兩個圖形和最好的編程接口。具體來說,現有的可視化GUI工具為非程序員提供易用性和可訪問性,但通常構建成單片獨立的工具,因此不像筆記本集成與數據科學編碼環境。另一方麵,繪圖api使用自然在筆記本和與其他工程的集成工具,如版本控製和持續集成。然而,他們缺乏同樣的易用性和GUI工具提供的交互性。

我們認為未來的可視化工具將GUI組件的集成與編碼環境和生態係統的數據。加入磚之前,我和我的同事探討這個想法在我們的法師項目發表了一篇論文在尤伊斯特的20。我也很興奮磚最近收購了8080實驗室的創造者Bamboolib,一個流行的Python庫,介紹了可擴展的gui來啟用low-code分析Jupyter筆記本。我們有一個很好的機會,以更好地編碼和圖形界麵之間的橋梁磚Lakehouse平台。Beplay体育安卓版本

Bamboolib介紹了可擴展的gui,可以導出代碼Jupyter筆記本。

為不同的數據活動一致的體驗

通過可視化工具集成到一個統一的數據平台,用戶可以利用相同的一組特性,得到一致的經驗不同的活動。Beplay体育安卓版本我們正在從集成可視化功能磚的SQL整個Lakehouse平台。Beplay体育安卓版本

這種集成,用戶可能使用我們的工具在ETL概要和清潔他們的數據。他們可能會使用相同的工具分析或建模。他們還可以重用相同的圖表分析報告和儀表板,或使用類似的工具創建新的圖表。我們增強我們的特性,我們的工作可以受益所有這些用例。

我們還可以利用其他工具平台來改善用戶體驗的可視化工具。Beplay体育安卓版本例如,當用戶執行數據目錄數據建模,可視化工具可以利用生成的元數據(如數據類型或列)之間的關係,為我們的用戶提供更好的違約和提出建議。

可伸縮的可視化工具

隨著數據量的快速增長,關鍵是未來可視化工具還必須規模。磚可以說是最好的地方大規模構建可視化工具,因為公司是著名的可伸縮性的平台。Beplay体育安卓版本我們有機會利用磚的強大的係統平台。Beplay体育安卓版本例如,我們正在建設一個新的可視化聚合功能在磚SQL可以聚合數據在瀏覽器或後端,根據數據大小。更重要的是,我們還可以與我們的世界級的後台工程師協作和影響力的設計平台,更好地支持新的用例,如臨時數據分析和流可視化。Beplay体育安卓版本

您可以幫助我們構建的未來數據的經驗!

我超級興奮我們建築磚。我們從一個小但才華橫溢的團隊,與世界一流的工程師、設計師和產品經理設計領先的數據分析和可視化工具。然而,我們是剛剛開始。仍然有很多令人興奮的事情建立在磚,你能幫助我們改變人們如何處理數據。

加入我們的團隊!

免費試著磚

相關的帖子

看到所有公司博客上的帖子
Baidu
map