時間序列數據分析與磚和KX的金融服務
這是一個客人合著的文章。我們感謝康納Gervin,工程主管合夥人KX,因為他的貢獻。
KX最近宣布了一項夥伴關係與磚從而能夠覆蓋所有的用例高速時序數據分析。今天我們要解釋兩個平台之間的集成選項可用流和批處理時間序列數據和為什麼這為金融服務公司提供顯著的好處。Beplay体育安卓版本
時間序列數據中很多地方使用金融服務,我們相信新的用例可以使新領域技術和數據。市場有很多的工具來獲取、管理和處理時間序列數據。鑒於金融服務用例的性質,不僅需要利用最好的品種數據處理的工具,而是繼續創新。這是背後的主要力量磚和KX之間的夥伴關係。通過這個項目我們可以將低延遲的kdb +和流媒體功能問語言可伸縮的數據和人工智能磚提供平台。Beplay体育安卓版本金融服務公司可以解鎖,加快創新利用時間序列數據的雲而不是讓它鎖定和孤立kdb +的本地實例。
在一個簡單的lakehouse平台,磚提供一流的Beplay体育安卓版本ETL和數據科學功能,現在可以KX用戶執行特別的分析和協同構建複雜的機器學習模型。beplay娱乐ios這種集成帶來KX數據以前遙不可及,在邊緣或on-prem,現在土地到雲與磚毫升和AI用例以簡單的方式。除了一個新的用例在KX數據的世界裏,KX向世界介紹了磚的低延遲流分析連續情報和數據驅動的決策可以實時執行。在本帖裏,我們將概述幾今天選擇的用戶想把磚和KX的用例和部署配置。
選擇:kdb + blob存儲拚花或δ
在KX的見解,kdb +司機直接寫入數據到本地blob和每個雲存儲服務提供商(例如S3, ADLS Gen2, gc)。磚提供了一種自動裝卸機機製很容易識別的新數據的雲存儲服務和隨後的數據加載到數據磚過程。磚可以寫出數據到本地blob和存儲服務鋪或三角洲湖新見解,分析或機器學習對象可以被加載到kdb +環境。
有很多批等金融這種集成服務用例建模、優化和機器學習的數據,導致更好的風險計算,定價模型、填充率數據,監視甚至整個投資組合的建議。飼料的能力計算和值回KX,允許低延遲流和服務用例,kdb +加速業務目標。
選擇:KdbSpark火花數據源
KdbSpark火花數據源直接在有空嗎GitHub。它最初由休·Hyndman,認為kdb +冠軍,兩年前。這個接口提供了直接的能力之間發送和接收數據和查詢數據磚和kdb +兩個相同的實例以及通過網絡連接。KdbSpark能夠直接連接數據磚kdb +執行特別的查詢或服務器端函數參數和支持額外的速度增強,如謂詞下推。許多有益的一個例子為業務將訪問kdb +在數據源的能力從而使寬客和數據建模師利用磚筆記本為探索性數據分析的新策略和見解直接與q和kdb +。
選擇:KX磚集群的見解
KX和磚都有合作建立一個集裝箱的KX雲版版本可以分布在磚和運行集群。利用磚,kdb +規模可以很容易地在雲的簡單的界麵和機製火花。通過擴展kdb +,許多工作負載可以並行運行在本地存儲的數據在kdb +對象存儲在所有雲提供者。這允許kdb +腳本和模型橫向規模在短暫的雲計算,例如蒙特卡羅模擬,回歸,和其他各種模型在一個更快,更容易,更便宜的方式,同時增加吞吐量和大大減少時間可行的見解。
選擇:聯邦查詢通過ODBC / JDBC / REST API
有更多的。KX的見解提供了一種機製來聯合查詢通過單個接口跨多個數據源,提供的能力分解kdb +和磚之間一個查詢,以便每個各自係統存儲數據可以查詢、彙總和分析。分析師,專注於BI工作負載或關聯與基本數據時間序列,是首選單窗格玻璃訪問層各種實時和曆史數據來源。
選擇:磚api
KX已經開發了一係列接口,使訪問數據磚RESTful api在kdb + / q。磚的暴露特征都可以在一個可編程的方式,包括磚工作區api, SQL端點和MLflow。MLflow api現在非常興奮因為kdb +和q可以支持的能力來連接兩個版本的開源和管理MLflow,並使MLflow管理建模和通過kdb +機器學習生命周期。
選擇:全部kdb + Python運行時(PyQ)
的一部分融合kdb +接口集合,PyQ將kdb的Python編程語言+數據庫允許開發者Python和q代碼在一個應用程序無縫集成。當使用Python運行時在一個火花會話,PyQ帶來完整的交互式kdb +環境權在Python過程隻需通過pip安裝。磚和kdb +一起通過Python是一種集成的理想執行或移植數據科學和機器學習模型到磚訓練有素,在雲上執行。
總之,有很多方式,磚和KX集成。合作的雙方雄厚的技術技能,磚和KX交付best-of-industry特性相互合作的客戶。beplay体育app下载地址請聯係各自的接觸在組織看到更多的磚和KX技術集成和民主化的時間序列數據建立新的用例和業務價值。
在磚或聽到KX說話金融服務業論壇在解鎖新的見解與ML實時金融數據。