㈠ 數據挖掘方向,Python中還需要學習哪些內容
就題論題,還包括:
1. Python 資料庫連接庫,例如MySQL 連接庫的應用,這決定你的數據從哪裡來。這裡面涉及到sql語法和資料庫基本知識,是你在學習的時候必須一起學會的。
2. Python 做基本數據計算和預處理的庫,包括numpy ,scipy,pandas 這三個用得最多。
3. 數據分析和挖掘庫,主要是sklearn,Statsmodels。前者是最廣泛的機器學習庫,後者是側重於統計分析的庫。(要知道統計分析大多時候和數據挖掘都錯不能分開使用)
4. 圖形展示庫。matpotlib,這是用的最多的了。
說完題主本身 要求,樓上幾位說的對,你還需要一些關於數據挖掘演算法的基本知識和認知,否則即使你調用相關庫得到結果,很可能你都不知道怎麼解讀,如何優化,甚至在什麼場景下還如何選擇演算法等。因此基本知識你得了解。主要包括:
1.統計學相關,看看深入淺出數據分析和漫畫統計學吧,雖然是入門的書籍,但很容易懂。
2.數據挖掘相關,看看數據挖掘導論吧,這是講演算法本身得書。
剩下的就是去實踐了。有項目就多參與下項目,看看真正的數據挖掘項目是怎麼開展的,流程怎樣等。沒有項目可以去參加一些數據挖掘或機器學習方面的大賽,也是增加經驗得好方法。