Databricks運行時6.2 for Genomics(不支持)

Databricks於2019年12月發布了這張圖片。

Databricks Runtime for Genomics (Databricks Runtime Genomics)是一種變體Databricks Runtime 6.2(不支持)針對基因組和生物醫學數據進行了優化。它是Databricks基因組學統一分析平台的一個組成部分。Beplay体育安卓版本

有關更多信息,包括創建Databricks用於基因組學集群的運行時的說明,請參見基因組學導遊.有關開發基因組學應用程序的更多信息,請參見基因組學導遊

新功能

Databricks Runtime 6.2 for Genomics是建立在Databricks Runtime 6.2之上的。有關Databricks Runtime 6.2中的新功能的信息,請參見Databricks Runtime 6.2(不支持)發行說明。

弗斯logistic回歸

版本發光包含在Databricks運行時6.2 for Genomics提供了一個弗斯logistic回歸檢驗

用戶定義的樣品質量控製指標

您可以在數據框架中為每個樣本聚合多個基因型aggregate_by_index.此函數允許您計算內置QC函數中包含的每個樣品質量控製(QC)指標。

改進

管道變壓器性能

的開銷管變壓器已經減少了大約一半。這種加速意味著您可以使用Databricks Runtime for Genomics來並行化命令行工具,而不會犧牲每核效率。

聯合基因分型的魯棒性

聯合基因分型Databricks Runtime 6.2 for Genomics提供的更有效地處理包含數千個條目的樣本清單。此外,管道現在通過插入顯式的no-calls優雅地處理缺失的gVCF塊。

簡化與LOFTEE的集成

Databricks Runtime for Genomics中包含的VEP注釋管道提供了與LOFTEE

冰雹0.26.0

Databricks運行時6.2基因組包括冰雹0.26.0。

Samtools 1.9

Samtools 1.9現在已安裝。