符合HIPAA的部署

Databricks支持符合HIPAA的部署來處理PHI數據,隻要您在處理PHI之前與DataBrickS已與DataBrickS製定了相互簽名的訂單表和業務合夥協議(BAA)。按照本文中的步驟以符合HIPAA的方式來設置您的部署。

與AWS簽署業務夥伴協議(BAA)

聯係您的客戶經理或發送電子郵件至銷售量@數據映com並與Databricks和AWS簽署業務夥伴協議(BAA),以保持遵守HIPAA法規。HIPAA要求該協議允許您在Databricks中處理PHI。

創建並驗證符合HIPAA的群集

這些步驟描述了如何創建符合HIPAA的群集來處理PHI數據。

步驟1:創建一個集群

遵循說明創建一個集群。作為配置步驟的一部分,您必須選擇一個Databricks運行時

警告

用於機器學習的Databricks運行時包括使用的高性能分布式機器學習包MPI(消息傳遞接口)和其他低級通信協議。由於這些協議不本質地支持電線上的加密,因此這些ML軟件包可能會在整個網絡上發送未加密的敏感數據。如果您的工作流不取決於它們,這些軟件包不會通過電線更改數據加密。

有什麼風險?

這些ML軟件包在網絡上發送的消息通常是ML模型參數或有關培訓數據的摘要統計信息。因此,通常不期望將敏感數據(例如受保護的健康信息)發送到未加密的電線上。但是,這些軟件包的某些配置或使用(例如特定的模型設計)可能會導致在包含此類信息的網絡中發送消息。

哪些軟件包受到影響?

步驟2:用EBS卷配置群集

提供一個EBS卷,因為Databricks EBS量已加密,而默認本地存儲則沒有。

提供EBS量

步驟3:驗證啟用加密

  1. 在工作區中創建筆記本電腦,然後將筆記本附加到上一步中創建的群集。

  2. 在筆記本中運行以下命令:

    Scala火花conf得到((“ spark.ssl.enabled”

    如果返回的值是正確的,則您已成功創建了一個帶有加密打開的群集。如果沒有,請聯係幫助@數據映com

重要的

Spark-Submit不支持符合HIPAA的簇。