創建並驗證一個群集以進行舊版HIPAA支持
重要的
本文適用於傳統HIPAA合規性功能。有關E2平台上HIPAA合規性功能的概述,請參見文章Beplay体育安卓版本HIPAA合規性功能。
如果您的工作空間使用舊版HIPAA支持,請使用以下說明來創建和驗證HIPAA合規性功能的群集以處理PHI數據。
創建一個集群
遵循說明創建一個集群。作為配置步驟的一部分,您必須選擇一個Databricks運行時。
警告
用於機器學習的Databricks運行時包括使用的高性能分布式機器學習包MPI(消息傳遞接口)和其他低級通信協議。由於這些協議不本質地支持電線上的加密,因此這些ML軟件包可能會在整個網絡上發送未加密的敏感數據。如果您的工作流不取決於它們,這些軟件包不會通過電線更改數據加密。
這些ML軟件包在網絡上發送的消息通常是ML模型參數或有關培訓數據的摘要統計信息。因此,通常不期望將敏感數據(例如受保護的健康信息)發送到未加密的電線上。但是,這些軟件包的某些配置或使用(例如特定的模型設計)可能會導致在包含此類信息的網絡中發送消息。
以下軟件包受到影響:
Horovod,horovodestimator,以及Horovodrunner
分散式TensorFlow
使用EBS卷配置群集(Legacy HIPAA支持)
提供一個EBS卷,因為Databricks EBS量已加密,而默認本地存儲則沒有。
驗證啟用加密。
在工作區中創建筆記本電腦,然後將筆記本附加到上一步中創建的群集。
在筆記本中運行以下命令:
%Scala火花。conf。得到((“ spark.ssl.enabled”)
如果返回的值是正確的,則您已成功創建了一個帶有加密打開的群集。如果沒有,請聯係幫助@數據映。com。
重要的
Spark-Submit
不支持符合HIPAA的簇。