Databricks Runtime 7.3 LTS for Genomics(不支持)

數據ricks在2020年9月發布了這張圖片。2020年10月,它被宣布為長期支持(LTS)。

Databricks Runtime 7.3 LTS for Genomics是一個版本Databricks Runtime 7.3 LTS優化處理基因組和生物醫學數據。它是Databricks基因組學統一分析平台的組成部分。Beplay体育安卓版本

重要的

此文檔已退役,可能不會更新。本內容中提及的產品、服務或技術不再受支持。

Databricks Genomics運行時已棄用。有關開放源碼的等價物,請參見reposgenomics-pipelines而且發光.作為運行時的一部分的生物信息學庫已經作為Docker容器發布,它可以從ProjectGlow Dockerhub頁麵。

有關Databricks Runtime棄用策略和時間表的更多信息,請參見支持Databricks運行時版本和支持計劃

有關更多信息,包括為Genomics集群創建Databricks Runtime的說明,請參見基因組學導遊.有關開發基因組學應用程序的更多信息,請參見基因組學導遊

有關從Databricks Runtime 6遷移的幫助。x到Databricks Runtime 7.3 LTS,請參見數據庫運行時7。X遷移指南

新功能

Databricks Runtime 7.3 LTS for Genomics是在Databricks Runtime 7.3 LTS的基礎上構建的。有關Databricks Runtime 7.3 LTS中新增內容的信息,請參見Databricks Runtime 7.3 LTS發行說明。

支持讀取未壓縮或zstd壓縮基因型的BGEN文件

Glow現在支持讀取BGEN文件包含未壓縮或使用zstandard壓縮的SNP塊概率數據ZSTD_compress ()函數,除了現有的支持讀取使用zlib壓縮的數據壓縮()函數。

改進

可變升降性能

執行變體liftOver與輝光現在高達12倍快。

更快的大文件上傳到ABFS

寫入大文件(如VCF, BGEN和BAM)到Azure Blob文件係統現在速度快了兩倍。

DNASeq管道在自動伸縮簇上的性能

DNASeq管道現在更適合嗎自動定量集群

缺省情況下,管道輸出bgzipped vcf

所有基因組學管道現在默認使用bgzip壓縮輸出vcf。默認情況下,輸出vcf以前是未壓縮的。要對此進行配置,請更改vcfCompressionCodec的管道選項bgzf

重構

TNSeq管道重命名為MutSeq

腫瘤/正常管道已經從TNSeq改名為MutSeq。

以下部分列出了Databricks Runtime 7.3 LTS for Genomics中包含的與Databricks Runtime 7.3中包含的不同的庫。

包裝庫

圖書館

版本

亞當

0.32.0

GATK

4.1.4.1

Hadoop-bam

7.9.2

samtools

1.9

VEP

96