探索性數據分析磚:工具和技術

本文描述了探索性數據分析工具和技術對磚(EDA)。

EDA是什麼和為什麼它是有用的嗎?

探索性數據分析(EDA)包括探索數據集的方法總結他們的主要特征和識別任何問題數據。使用統計方法和可視化,可以了解一個數據集來確定它的準備分析和通知什麼技術申請數據準備。EDA也可以影響你選擇申請培訓ML算法模型。

磚的EDA工具是什麼?

磚有內置的處理數據分析和可視化工具。

磚運行時和磚的運行時毫升提供預構建的環境已經流行的數據探索庫安裝。你可以看到的內置庫列表發布說明

此外,下麵的文章展示的例子在磚可視化工具:

使用磚,可以結合SQL和Python來查看數據。在磚Python的筆記本,表結果從一個SQL語言細胞自動作為Python DataFrame可用。有關詳細信息,請參見探索Python中的SQL細胞結果筆記本

EDA在磚SQL

磚SQL也有數據的可視化和探索的工具。這裏有一些有用的文章: