Databricks運行時7.4 for Genomics(不支持)

Databricks於2020年11月發布了這張圖片。

Databricks運行時7.4 for Genomics是一個版本Databricks Runtime 7.4(不支持)針對基因組和生物醫學數據進行了優化。它是Databricks基因組學統一分析平台的一個組成部分。Beplay体育安卓版本

重要的

此文檔已退役,可能無法更新。本內容中提及的產品、服務或技術已不再受支持。

Databricks Genomics運行時已棄用。有關開放源碼的對等物,請參見repos Forgenomics-pipelines而且發光.作為運行時一部分的生物信息學庫已經作為Docker容器發布,它可以從ProjectGlow Dockerhub頁麵。

有關Databricks Runtime棄用策略和計劃的詳細信息,請參見支持Databricks運行時發布和支持計劃

有關更多信息,包括創建Databricks用於基因組學集群的運行時的說明,請參見基因組學導遊.有關開發基因組學應用程序的更多信息,請參見基因組學導遊

新功能

Databricks Runtime 7.4 for Genomics是建立在Databricks Runtime 7.4之上的。有關Databricks Runtime 7.4中的新功能的信息,請參見Databricks Runtime 7.4(不支持)發行說明。

二元特征的GloWGR

GloWGR現在可以為二元性狀擬合全基因組回歸模型。

Logistic回歸函數接受偏移量參數

logistic_regression_gwas函數現在接受一個抵消參數。該參數等價於具有固定係數的特征1.似然比檢驗和費斯懲罰似然比檢驗都尊重這個參數。GloWGR的輸出應該作為參數傳遞抵消

冰雹的支持

Databricks Runtime 7.4 for Genomics是7中的第一個版本。X行對包的支持冰雹

改進

GloWGR方便函數

RidgeRegression而且LogisticRegression在GloWGR現在提供一個transform_loco函數來產生一個染色體脫落(LOCO)的預測。另外,GloWGR現在包含一個reshape_for_gwas函數將GloWGR的預測重塑為一種協會測試在Glow中可以接受。

GloWGR可用性改進

定量和二進製特征的GloWGR現在在驗證失敗的情況下提供更好的性能和更清晰的錯誤消息。

更快的VCF讀取器

Databricks Runtime 7.4 for Genomics包含一個實驗性的快速VCF閱讀器。您可以通過設置Spark配置來激活新的閱讀器io.projectglow.vcf.fastReaderEnabled真正的在筆記本或集群配置中。

以下部分列出了Databricks Runtime 7.4 for Genomics中包含的不同於Databricks Runtime 7.4的庫。

升級庫

  • 冰雹:0.2.40至0.2.58

包裝庫

圖書館

版本

亞當

0.32.0

GATK

4.1.4.1

冰雹

0.2.58

Hadoop-bam

7.9.2

samtools

1.9

VEP

96