符合HIPAA的部署
Databricks支持符合HIPAA的部署來處理PHI數據,隻要您在處理PHI之前與DataBrickS已與DataBrickS製定了相互簽名的訂單表和業務合夥協議(BAA)。按照本文中的步驟以符合HIPAA的方式來設置您的部署。
與AWS簽署業務夥伴協議(BAA)
聯係您的客戶經理或發送電子郵件至銷售量@數據映。com並與Databricks和AWS簽署業務夥伴協議(BAA),以保持遵守HIPAA法規。HIPAA要求該協議允許您在Databricks中處理PHI。
創建並驗證符合HIPAA的群集
這些步驟描述了如何創建符合HIPAA的群集來處理PHI數據。
步驟1:創建一個集群
遵循說明創建一個集群。作為配置步驟的一部分,您必須選擇一個Databricks運行時。
警告
用於機器學習的Databricks運行時包括使用的高性能分布式機器學習包MPI(消息傳遞接口)和其他低級通信協議。由於這些協議不本質地支持電線上的加密,因此這些ML軟件包可能會在整個網絡上發送未加密的敏感數據。如果您的工作流不取決於它們,這些軟件包不會通過電線更改數據加密。
有什麼風險?
這些ML軟件包在網絡上發送的消息通常是ML模型參數或有關培訓數據的摘要統計信息。因此,通常不期望將敏感數據(例如受保護的健康信息)發送到未加密的電線上。但是,這些軟件包的某些配置或使用(例如特定的模型設計)可能會導致在包含此類信息的網絡中發送消息。
哪些軟件包受到影響?
Horovod,horovodestimator,以及Horovodrunner
分散式TensorFlow
步驟3:驗證啟用加密
在工作區中創建筆記本電腦,然後將筆記本附加到上一步中創建的群集。
在筆記本中運行以下命令:
%Scala火花。conf。得到((“ spark.ssl.enabled”)
如果返回的值是正確的,則您已成功創建了一個帶有加密打開的群集。如果沒有,請聯係幫助@數據映。com。
重要的
Spark-Submit
不支持符合HIPAA的簇。