Splice Machine是Apache Spark上的一個ANSI-SQL關係數據庫管理係統(RDBMS)。它已被證明具有pb級的低延遲事務處理(OLTP)和分析處理(OLAP)。它使用Spark進行所有分析計算,並利用HBase實現持久性。
這次演講重點介紹了一個新的原生Spark數據源——它可以在Spark數據幀和Splice Machine表之間實現無縫數據移動,而無需序列化和反序列化。這個Spark數據源使機器學習庫(如MLlib)本機用於Splice RDBMS。Splice Machine現在已經將MLflow集成到其數據平台中,創建了一個以RDBMS為核心的靈活的數據Beplay体育安卓版本科學工作台。Splice Machine的事務處理功能與大量與dataframe兼容的庫和MLflow功能集成在一起,管理著從數據到洞察到行動的完整實時工作流。
在本次演示中,我們將演示Splice Machine的數據科學工作台,以及它如何利用Spark和MLflow在集成平台上創建強大的全周期機器學習功能,從事務更新到數據爭論、實驗和部署,然後再返回。Beplay体育安卓版本
Gene是Splice Machine公司的產品管理副總裁。加入Splice Machine之前,Gene負責Clio Music、SeeSaw Networks、Blue Martini Software、Fogbreak Software和TeaLeaf Technology的產品開發;擔任仁科集團工程副總裁。吉恩是紅辣椒高級規劃係統的原始架構師。在加入紅辣椒之前,他曾為美國宇航局工作,在那裏他是載人飛行太空獎的獲得者和太空法案獎的共同獲得者。Gene擁有斯坦福大學的音樂學士學位和化學工程學士學位,以及多倫多大學的計算機科學碩士學位