快速的方式開始探索性數據分析是使用EDA筆記本創建時使用磚AutoML。然後您可以使用生成的筆記本,或者作為建模的起點。你需要一個與磚集群運行時10.0毫升以上。
EDA的筆記本:
當模型開始運行時,它將autogenerate和EDA文件基於樣本數據。因為你是使用火花3.2。x在這個運行時,與熊貓考拉庫合並,獲得更好的可伸縮性。這個筆記本使用pandas-profiling庫,所以你可以編輯庫的選擇進行額外的分析。除了分析,得到功能交互相關性,缺失值。即使你打算使用不同的建模在生產運行時,這是一個方便快捷的EDA。