冰雹
冰雹圖書館是一個建立在Apache火花分析大型基因組數據集。
重要的
創建一個集群
安裝通過碼頭工人和冰雹磚容器服務。
容器設置一個冰雹環境,看到ProjectGlow Dockerhub頁麵。使用projectglow / databricks-hail: < hail-version >
,用一個可用的替代標記冰雹的版本。
創建一個工作集群與冰雹
設置的磚CLI。
創建一個集群使用冰雹集裝箱碼頭工人設置標簽所需的
< hail-version >
。下麵給出了一個示例的工作定義,請編輯notebook_path磚運行時
< databricks-runtime-version >
和< hail-version >
。
磚工作創建——json文件hail-create-job.json
hail-create-job.json
:
{“名稱”:“hail-job”,“notebook_task”:{“notebook_path”:“/用戶/ < user@organization.com > /冰雹/ docs / hail-tutorial”},“new_cluster”:{“spark_version”:“< databricks-runtime-version > .x-scala2.12”,“aws_attributes”:{“可用性”:“現貨”,“first_on_demand”:1},“node_type_id”:“r5d.4xlarge”,“num_workers”:32,“docker_image”:{“url”:“projectglow / databricks-hail: < hail-version >”}}}