探索性數據分析磚:工具和技術

本文描述了探索性數據分析工具和技術對磚(EDA)。

EDA是什麼和為什麼它是有用的嗎?

探索性數據分析(EDA)包括探索數據集的方法總結他們的主要特征和識別任何問題數據。使用統計方法和可視化,可以了解一個數據集來確定它的準備分析和通知什麼技術申請數據準備。EDA也可以影響你選擇申請培訓ML算法模型。

磚的EDA工具是什麼?

磚有內置的分析和可視化工具在磚磚SQL和運行時。說明列表的類型的可視化數據磚,明白了可視化類型磚

EDA在磚SQL

這裏有一些有用的文章數據磚SQL的數據可視化和探索工具:

EDA在磚運行時

磚運行時提供了一個預構建的環境已經流行的數據探索庫安裝。你可以看到的內置庫列表發布說明

此外,下麵的文章展示的例子在磚運行時的可視化工具:

在一個磚Python的筆記本,你可以結合SQL和Python來查看數據。當您運行代碼在一個SQL語言細胞在Python筆記本,表結果自動作為一個Python DataFrame。有關詳細信息,請參見探索Python中的SQL細胞結果筆記本