基因組學的Databricks Runtime(已棄用)
Databricks Runtime for Genomics (Databricks Runtime Genomics)是Databricks Runtime的一個版本,優化了基因組和生物醫學數據的工作。它是基因組學Databricks統一分析平台的一個組成部分。Beplay体育安卓版本有關開發基因組學應用程序的更多信息,請參見基因組學導遊.
請注意
已棄用針對基因組學的Databricks Runtime。Databricks不再為基因組學構建新的Databricks Runtime版本,並將於2022年9月24日移除對基因組學Databricks Runtime的支持,屆時基因組學的Databricks Runtime 7.3 LTS支持將結束。在這一點上,基因組學的Databricks運行時將不再可供選擇,當你創建一個集群。有關Databricks Runtime棄用策略和計劃的更多信息,請參見支持Databricks運行時版本和支持時間表.作為運行時一部分的生物信息庫已經以Docker容器的形式發布,你可以在ProjectGlow Dockerhub頁麵。
基因組學的Databricks Runtime裏有什麼?
優化版的databrick - regeneron開源庫發光與所有的功能以及:
Spark SQL支持讀取和寫入變量數據
通用工作流元素的功能
通用查詢模式的優化
與Apache Spark並行的交鑰匙管道:
流行的開源庫,優化了性能和可靠性:
亞當
GATK
Hadoop-bam
流行的命令行工具:
samtools
參考數據(grch37或38,已知SNP位點)
看到基因組學的Databricks運行時發布說明以獲取所包含庫和版本的完整列表。
需求
您的Databricks工作區必須有Databricks Runtime for Genomics啟用.
使用Genomics的Databricks Runtime創建集群
當你創建一個集群,選擇基因組版本的Databricks運行時版本下拉列表。