Databricks Runtime 6.3 for Genomics(不支持)

Databricks於2020年1月發布了這張圖片。

Databricks Runtime for Genomics (Databricks Runtime Genomics)是一種變體Databricks Runtime 6.3(不支持)針對基因組和生物醫學數據進行了優化。它是Databricks基因組學統一分析平台的一個組成部分。Beplay体育安卓版本

有關更多信息,包括創建Databricks用於基因組學集群的運行時的說明,請參見基因組學導遊.有關開發基因組學應用程序的更多信息,請參見基因組學導遊

新功能

Databricks Runtime 6.3 for Genomics是建立在Databricks Runtime 6.3之上的。有關Databricks Runtime 6.3中的新功能的信息,請參見Databricks Runtime 6.3(不支持)發行說明。

來自達美航空的聯合基因分型管道

聯合基因分型在Databricks Runtime 6.3 for Genomics中,現在可以將DNASeq管道編寫的Delta表作為輸入。該功能允許您同時使用這兩個管道,而無需將結果導出到gvcf。

讀取vcf時自動解析注釋

版本發光包括在Databricks Runtime 6.3 for Genomics自動解析CSQ而且讀取vcf時的INFO字段。INFO_CSQ而且INFO_ANN結果dataframe中的字段現在具有簡化查詢的結構化模式。

改進

改進的多等位基因變異分裂器

Glow和Databricks Runtime for Genomics中的多等位基因變異分配器現在可以處理更複雜類型的多等位基因位點。新的行為反映了vt分解命令行工具。此外,您現在可以通過調用glow.transform(“split_multiallelics”……

更快的線性和邏輯回歸函數

logistic_regression_gwasDatabricks Runtime 6.3 for Genomics的函數比6.2版本快60%左右。linear_regression_gwas大約快50%。