『壹』 關於數據挖掘,比較經典的演算法書籍(詳細介紹演算法原理的)
還是最經典的那本
《數據挖掘:概念與技術》 韓加偉的
『貳』 求數據挖掘原理與演算法(第3版)教師用書 毛國君 編著的課後答案
答案家論壇不是有這個答案嗎,你在裡面搜下關鍵字看看
『叄』 數據挖掘原理與實踐 pdf急
書名=數據挖掘原理與實踐
作者=蔣盛益,李霞,鄭琪編著
頁碼=271
ISBN=978-7-121-14050-1
出版社=北京:電子工業出版社 , 2011.08
附件已經上傳
『肆』 什麼是數據挖掘數據挖掘怎麼做啊
數據挖掘(Data Mining)是指通過大量數據集進行分類的自動化過程,以通過數據分析來識別趨勢和模式,建立關系來解決業務問題。換句話說,數據挖掘是從大量的、不完全的、有雜訊的、模糊的、隨機的數據中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。
原則上講,數據挖掘可以應用於任何類型的信息存儲庫及瞬態數據(如數據流),如資料庫、數據倉庫、數據集市、事務資料庫、空間資料庫(如地圖等)、工程設計數據(如建築設計等)、多媒體數據(文本、圖像、視頻、音頻)、網路、數據流、時間序列資料庫等。也正因如此,數據挖掘存在以下特點:
(1)數據集大且不完整
數據挖掘所需要的數據集是很大的,只有數據集越大,得到的規律才能越貼近於正確的實際的規律,結果也才越准確。除此以外,數據往往都是不完整的。
(2)不準確性
數據挖掘存在不準確性,主要是由雜訊數據造成的。比如在商業中用戶可能會提供假數據;在工廠環境中,正常的數據往往會收到電磁或者是輻射干擾,而出現超出正常值的情況。這些不正常的絕對不可能出現的數據,就叫做雜訊,它們會導致數據挖掘存在不準確性。
(3)模糊的和隨機的
數據挖掘是模糊的和隨機的。這里的模糊可以和不準確性相關聯。由於數據不準確導致只能在大體上對數據進行一個整體的觀察,或者由於涉及到隱私信息無法獲知到具體的一些內容,這個時候如果想要做相關的分析操作,就只能在大體上做一些分析,無法精確進行判斷。
而數據的隨機性有兩個解釋,一個是獲取的數據隨機;我們無法得知用戶填寫的到底是什麼內容。第二個是分析結果隨機。數據交給機器進行判斷和學習,那麼一切的操作都屬於是灰箱操作。
『伍』 數據挖掘方法都有哪些
1、神經元網路辦法
神經元網路由於本身優良的健壯性、自組織自適應性、並行計算、遍及貯存和高寬比容錯機制等特色特別適合處理數據發掘的難題,因而近些年愈來愈遭受大家的關心。
2、遺傳演算法
遺傳演算法是一種依據微生物自然選擇學說與基因遺傳原理的恣意優化演算法,是一種仿生技能全局性提升辦法。遺傳演算法具有的暗含並行性、便於和其他實體模型交融等特性促使它在數據發掘中被多方面運用。
3、決策樹演算法辦法
決策樹演算法是一種常見於預測模型的優化演算法,它依據將很多數據信息有目地歸類,從這當中尋找一些有使用價值的,潛在性的信息。它的要害優勢是敘說簡易,歸類速度更快,十分適宜規模性的數據處理辦法。
4、遮蓋正例抵觸典例辦法
它是使用遮蓋悉數正例、抵觸悉數典例的觀念來找尋規范。最先在正例結合中隨意選擇一個種子,到典例結合中逐一較為。與欄位名賦值組成的選擇子相溶則舍棄,反過來則保存。按此觀念循環系統悉數正例種子,將獲得正例的規范(選擇子的合取式)。
5、數據剖析辦法
在資料庫查詢欄位名項中心存有二種相關:函數關系和相關剖析,對他們的剖析可選用應用統計學辦法,即使用統計學原理對資料庫查詢中的信息展開剖析。可展開常見統計剖析、多元回歸剖析、相關性剖析、差異剖析等。
6、含糊集辦法
即使用含糊不清結合基礎理論對具體難題展開含糊不清評定、含糊不清管理決策、含糊不清系統識別和含糊聚類剖析。系統軟體的多元性越高,抽象性越強,一般含糊不清結合基礎理論是用從屬度來描繪含糊不清事情的亦此亦彼性的。
『陸』 大數據挖掘的演算法有哪些
大數據挖掘的演算法:
1.樸素貝葉斯,超級簡單,就像做一些數數的工作。如果條件獨立假設成立的話,NB將比鑒別模型收斂的更快,所以你只需要少量的訓練數據。即使條件獨立假設不成立,NB在實際中仍然表現出驚人的好。
2. Logistic回歸,LR有很多方法來對模型正則化。比起NB的條件獨立性假設,LR不需要考慮樣本是否是相關的。與決策樹與支持向量機不同,NB有很好的概率解釋,且很容易利用新的訓練數據來更新模型。如果你想要一些概率信息或者希望將來有更多數據時能方便的更新改進模型,LR是值得使用的。
3.決策樹,DT容易理解與解釋。DT是非參數的,所以你不需要擔心野點(或離群點)和數據是否線性可分的問題,DT的主要缺點是容易過擬合,這也正是隨機森林等集成學習演算法被提出來的原因。
4.支持向量機,很高的分類正確率,對過擬合有很好的理論保證,選取合適的核函數,面對特徵線性不可分的問題也可以表現得很好。SVM在維數通常很高的文本分類中非常的流行。
如果想要或許更多更詳細的訊息,建議您去參加CDA數據分析課程。大數據分析師現在有專業的國際認證證書了,CDA,即「CDA 數據分析師」,是在數字經濟大背景和人工智慧時代趨勢下,面向全行業的專業權威國際資格認證, 旨在提升全民數字技能,助力企業數字化轉型,推動行業數字化發展。 「CDA 數據分析師」具體指在互聯網、金融、零售、咨詢、電信、醫療、旅遊等行業專門從事數據的採集、清洗、處理、分析並能製作業務報告、 提供決策的新型數據分析人才。點擊預約免費試聽課。
『柒』 數據挖掘怎麼最快入門書籍或培訓都可以。
你可以找一本書,對數據挖掘背景和應用介紹比較細,具體方法使用和實例分析。
1、數據挖掘原理 漢德(David Hand), 曼尼拉(Heikki Mannila), 史密斯(Padhraic Smyth)著
2、數據挖掘技術:市場營銷、銷售與客戶關系管理領域應用:for marketing, sales, and customer relationship ma (美) Michael J. A. Berry, Gordon S. Linoff著
我喜歡讀外國寫的書,這是我剛借的書,我認為很好。你可以做個參考。還有可以看看數據挖掘論文,網上有很多。
『捌』 會數據挖掘技術的請進!
樓主需要的是數據挖掘從入門到精通,這得專門培訓一段時間,據我了解(我不編程)起碼得啃好幾本演算法的書,才能編出有效率的程序。。。
看來你是想編數據挖掘的演算法了,去看(加)韓家煒的《數據挖掘概念與技術(原書第2版)》吧。聽別人建議:數學好的話,再去看看《數據挖掘原理》by David Hand,Heikki Mannila,Padhraic Smyth,和某本實驗機器學習的書,DM理論水平應該有一定基礎。
當然了,如果只是混個學分就無所謂了,就算你編的程序跑1萬條數據就歇菜了都沒關系。
暈菜,下次提問把目的,背景說清楚了。
建議你的系統架構把客戶訂單管理與數據挖掘分開,訂單管理系統這個不難,你應該會,數據挖掘可以利用現有的軟體做,(例如樓上的哥們所說的SAS,SPSS clementine(推薦這個),甚至EXCEL2007)把訂單管理系統中的數據導入數據挖掘軟體中進行建模分析,至於分析什麼,看你的愛好了,結合收款情況可以做信用管理,結合促銷活動可以做營銷相應分析,實在想簡單點,做個聚類或者分類搞客戶細分,等等,想混學分的話模型就用神經網路吧,這個黑箱你愛怎麼解釋就怎麼解釋。
題外話,其實,很多時候用不上數據挖掘,統計分析就夠了。統計分析做得不到位就搞數據挖掘純屬得瑟