Ⅰ 機器學習實戰的作品目錄
目錄第一部分分類第1章機器學習基礎21.1 何謂機器學習31.1.1 感測器和海量數據41.1.2 機器學習非常重要51.2 關鍵術語51.3 機器學習的主要任務71.4 如何選擇合適的演算法81.5 開發機器學習應用程序的步驟91.6 Python語言的優勢101.6.1 可執行偽代碼101.6.2 Python比較流行101.6.3 Python語言的特色111.6.4 Python語言的缺點111.7 NumPy函數庫基礎121.8 本章小結13第2章k-近鄰演算法 152.1 k-近鄰演算法概述152.1.1 准備:使用Python導入數據172.1.2 從文本文件中解析數據192.1.3 如何測試分類器202.2 示例:使用k-近鄰演算法改進約會網站的配對效果202.2.1 准備數據:從文本文件中解析數據212.2.2 分析數據:使用Matplotlib創建散點圖232.2.3 准備數據:歸一化數值252.2.4 測試演算法:作為完整程序驗證分類器262.2.5 使用演算法:構建完整可用系統272.3 示例:手寫識別系統282.3.1 准備數據:將圖像轉換為測試向量292.3.2 測試演算法:使用k-近鄰演算法識別手寫數字302.4 本章小結31第3章決策樹 323.1 決策樹的構造333.1.1 信息增益353.1.2 劃分數據集373.1.3 遞歸構建決策樹393.2 在Python中使用Matplotlib註解繪制樹形圖423.2.1 Matplotlib註解433.2.2 構造註解樹443.3 測試和存儲分類器483.3.1 測試演算法:使用決策樹執行分類493.3.2 使用演算法:決策樹的存儲503.4 示例:使用決策樹預測隱形眼鏡類型503.5 本章小結52第4章基於概率論的分類方法:樸素貝葉斯 534.1 基於貝葉斯決策理論的分類方法534.2 條件概率554.3 使用條件概率來分類564.4 使用樸素貝葉斯進行文檔分類574.5 使用Python進行文本分類584.5.1 准備數據:從文本中構建詞向量584.5.2 訓練演算法:從詞向量計算概率604.5.3 測試演算法:根據現實情況修改分類器624.5.4 准備數據:文檔詞袋模型644.6 示例:使用樸素貝葉斯過濾垃圾郵件644.6.1 准備數據:切分文本654.6.2 測試演算法:使用樸素貝葉斯進行交叉驗證664.7 示例:使用樸素貝葉斯分類器從個人廣告中獲取區域傾向684.7.1 收集數據:導入RSS源684.7.2 分析數據:顯示地域相關的用詞714.8 本章小結72第5章Logistic回歸 735.1 基於Logistic回歸和Sigmoid函數的分類745.2 基於最優化方法的最佳回歸系數確定755.2.1 梯度上升法755.2.2 訓練演算法:使用梯度上升找到最佳參數775.2.3 分析數據:畫出決策邊界795.2.4 訓練演算法:隨機梯度上升805.3 示例:從疝氣病症預測病馬的死亡率855.3.1 准備數據:處理數據中的缺失值855.3.2 測試演算法:用Logistic回歸進行分類865.4 本章小結88第6章支持向量機896.1 基於最大間隔分隔數據896.2 尋找最大間隔916.2.1 分類器求解的優化問題926.2.2 SVM應用的一般框架936.3 SMO高效優化演算法946.3.1 Platt的SMO演算法946.3.2 應用簡化版SMO演算法處理小規模數據集946.4 利用完整Platt SMO演算法加速優化996.5 在復雜數據上應用核函數1056.5.1 利用核函數將數據映射到高維空間1066.5.2 徑向基核函數1066.5.3 在測試中使用核函數1086.6 示例:手寫識別問題回顧1116.7 本章小結113第7章利用AdaBoost元演算法提高分類性能 1157.1 基於數據集多重抽樣的分類器1157.1.1 bagging:基於數據隨機重抽樣的分類器構建方法1167.1.2 boosting1167.2 訓練演算法:基於錯誤提升分類器的性能1177.3 基於單層決策樹構建弱分類器1187.4 完整AdaBoost演算法的實現1227.5 測試演算法:基於AdaBoost的分類1247.6 示例:在一個難數據集上應用AdaBoost1257.7 非均衡分類問題1277.7.1 其他分類性能度量指標:正確率、召回率及ROC曲線1287.7.2 基於代價函數的分類器決策控制1317.7.3 處理非均衡問題的數據抽樣方法1327.8 本章小結132第二部分利用回歸預測數值型數據第8章預測數值型數據:回歸 1368.1 用線性回歸找到最佳擬合直線1368.2 局部加權線性回歸1418.3 示例:預測鮑魚的年齡1458.4 縮減系數來「理解」數據1468.4.1 嶺回歸1468.4.2 lasso1488.4.3 前向逐步回歸1498.5 權衡偏差與方差1528.6 示例:預測樂高玩具套裝的價格1538.6.1 收集數據:使用Google購物的API1538.6.2 訓練演算法:建立模型1558.7 本章小結158第9章樹回歸1599.1 復雜數據的局部性建模1599.2 連續和離散型特徵的樹的構建1609.3 將CART演算法用於回歸1639.3.1 構建樹1639.3.2 運行代碼1659.4 樹剪枝1679.4.1 預剪枝1679.4.2 後剪枝1689.5 模型樹1709.6 示例:樹回歸與標准回歸的比較1739.7 使用Python的Tkinter庫創建GUI1769.7.1 用Tkinter創建GUI1779.7.2 集成Matplotlib和Tkinter1799.8 本章小結182第三部分無監督學習第10章利用K-均值聚類演算法對未標注數據分組18410.1 K-均值聚類演算法18510.2 使用後處理來提高聚類性能18910.3 二分K-均值演算法19010.4 示例:對地圖上的點進行聚類19310.4.1 Yahoo! PlaceFinder API19410.4.2 對地理坐標進行聚類19610.5 本章小結198第11章使用Apriori演算法進行關聯分析20011.1 關聯分析20111.2 Apriori原理20211.3 使用Apriori演算法來發現頻繁集20411.3.1 生成候選項集20411.3.2 組織完整的Apriori演算法20711.4 從頻繁項集中挖掘關聯規則20911.5 示例:發現國會投票中的模式21211.5.1 收集數據:構建美國國會投票記錄的事務數據集21311.5.2 測試演算法:基於美國國會投票記錄挖掘關聯規則21911.6 示例:發現毒蘑菇的相似特徵22011.7 本章小結221第12章使用FP-growth演算法來高效發現頻繁項集22312.1 FP樹:用於編碼數據集的有效方式22412.2 構建FP樹22512.2.1 創建FP樹的數據結構22612.2.2 構建FP樹22712.3 從一棵FP樹中挖掘頻繁項集23112.3.1 抽取條件模式基23112.3.2 創建條件FP樹23212.4 示例:在Twitter源中發現一些共現詞23512.5 示例:從新聞網站點擊流中挖掘23812.6 本章小結239第四部分其他工具第13章利用PCA來簡化數據24213.1 降維技術24213.2 PCA24313.2.1 移動坐標軸24313.2.2 在NumPy中實現PCA24613.3 示例:利用PCA對半導體製造數據降維24813.4 本章小結251第14章利用SVD簡化數據25214.1 SVD的應用25214.1.1 隱性語義索引25314.1.2 推薦系統25314.2 矩陣分解25414.3 利用Python實現SVD25514.4 基於協同過濾的推薦引擎25714.4.1 相似度計算25714.4.2 基於物品的相似度還是基於用戶的相似度?26014.4.3 推薦引擎的評價26014.5 示例:餐館菜餚推薦引擎26014.5.1 推薦未嘗過的菜餚26114.5.2 利用SVD提高推薦的效果26314.5.3 構建推薦引擎面臨的挑戰26514.6 基於SVD的圖像壓縮26614.7 本章小結268第15章大數據與MapRece27015.1 MapRece:分布式計算的框架27115.2 Hadoop流27315.2.1 分布式計算均值和方差的mapper27315.2.2 分布式計算均值和方差的recer27415.3 在Amazon網路服務上運行Hadoop程序27515.3.1 AWS上的可用服務27615.3.2 開啟Amazon網路服務之旅27615.3.3 在EMR上運行Hadoop作業27815.4 MapRece上的機器學習28215.5 在Python中使用mrjob來自動化MapRece28315.5.1 mrjob與EMR的無縫集成28315.5.2 mrjob的一個MapRece腳本剖析28415.6 示例:分布式SVM的Pegasos演算法28615.6.1 Pegasos演算法28715.6.2 訓練演算法:用mrjob實現MapRece版本的SVM28815.7 你真的需要MapRece嗎?29215.8 本章小結292附錄A Python入門294附錄B 線性代數303附錄C 概率論復習309附錄D 資源312索引313版權聲明316
Ⅱ 《機器學習實戰》pdf下載在線閱讀,求百度網盤雲資源
《機器學習實戰》(Peter Harrington)電子書網盤下載免費在線閱讀
資源鏈接:
鏈接:https://pan..com/s/1-WjldGdKT5Hza8IXzI2uXg
書名:機器學習實戰
作者:Peter Harrington
譯者:李銳
豆瓣評分:8.1
出版社:人民郵電出版社
出版年份:2013-6
頁數:332
內容簡介:
機器學習是人工智慧研究領域中一個極其重要的研究方向,在現今的大數據時代背景下,捕獲數據並從中萃取有價值的信息或模式,成為各行業求生存、謀發展的決定性手段,這使得這一過去為分析師和數學家所專屬的研究領域越來越為人們所矚目。
本書第一部分主要介紹機器學習基礎,以及如何利用演算法進行分類,並逐步介紹了多種經典的監督學習演算法,如k近鄰演算法、樸素貝葉斯演算法、Logistic回歸演算法、支持向量機、AdaBoost集成方法、基於樹的回歸演算法和分類回歸樹(CART)演算法等。第三部分則重點介紹無監督學習及其一些主要演算法:k均值聚類演算法、Apriori演算法、FP-Growth演算法。第四部分介紹了機器學習演算法的一些附屬工具。
全書通過精心編排的實例,切入日常工作任務,摒棄學術化語言,利用高效的可復用Python代碼來闡釋如何處理統計數據,進行數據分析及可視化。通過各種實例,讀者可從中學會機器學習的核心演算法,並能將其運用於一些策略性任務中,如分類、預測、推薦。另外,還可用它們來實現一些更高級的功能,如匯總和簡化等。
作者簡介:
Peter Harrington
擁有電氣工程學士和碩士學位,他曾經在美國加州和中國的英特爾公司工作7年。Peter擁有5項美國專利,在三種學術期刊上發表過文章。他現在是Zillabyte公司的首席科學家,在加入該公司之前,他曾擔任2年的機器學習軟體顧問。Peter在業余時間還參加編程競賽和建造3D列印機。
Ⅲ 如何學習機器學習的一點心得
學習之前還是要了解下目前工業界所需要的機器學習/人工智慧人才所需要必備的技能是哪些?你才好針對性地去學習。正好我前兩天剛聽了菜鳥窩(一個程序猿的黃埔軍校)的一位阿里機器學習演算法工程師的課,幫助我理清了思路,在此分享下。
網路教程還是挺多的,就看怎麼學習了,不過遇到比較好的老師帶,會少走很多彎路。如果經濟上壓力不大,建議可以去報一下菜鳥窩的機器學習班,畢竟人家老師都是BAT實戰的,知道企業中真正要用到的東西。
不知道有沒幫到你?
Ⅳ 機器學習實戰 SMO演算法是否寫錯了
我確定,里頭的完整版SMO演算法是寫錯了。在尋找第二個變數時,每次只找了一個,優化失敗後就放棄了,重新挑選第一個變數。這樣最後演算法結束後,還有不少變數不滿足KKT條件。我一度以為這個演算法不能收斂到全局最優。而且每次運行結果都不一樣。後來,我把代碼改了一下,在尋找第二個變數時,把所有可能符合條件的變數都嘗試一遍。這樣,演算法就能收斂了。運行結束後,所有變數都能滿足KKT條件。
Ⅳ 《scikitlearn機器學習常用演算法原理及編程實戰》epub下載在線閱讀全文,求百度網盤雲資源
《scikit learn機器學習》(黃永昌)電子書網盤下載免費在線閱讀
鏈接:
書名:scikit learn機器學習
作者:黃永昌
豆瓣評分:7.9
出版社:機械工業出版社
出版年份:2018-3-1
頁數:207
內容簡介:
本書通過通俗易懂的語言、豐富的圖示和生動的實例,撥開了籠罩在機器學習上方復雜的數學「烏雲」,讓讀者以較低的代價和門檻輕松入門機器學習。本書共分為11章,主要介紹了在Python環境下學習scikit-learn機器學習框架的相關知識。本書涵蓋的主要內容有機器學習概述、Python機器學習軟體包、機器學習理論基礎、k-近鄰演算法、線性回歸演算法、邏輯回歸演算法、決策樹、支持向量機、樸素貝葉斯演算法、PCA 演算法和k-均值演算法等。本書適合有一定編程基礎的讀者閱讀,尤其適合想從事機器學習、人工智慧、深度學習及機器人相關技術的程序員和愛好者閱讀。另外,相關院校和培訓機構也可以將本書作為教材使用。
Ⅵ 完全不懂金融,想學習量化投資需要學習哪些金融科目
我個人認為學習量化投資在金融方面需要具備兩個方面的知識:
1、首先是要了解金融市場與金融產品,只有這樣才能在眾多市場與標的中選擇合適的來構建投資組合,這一方面需要了解的基礎知識有:金融市場與金融機構、投資學、金融衍生品等等;
2、其次是需要了解如何量化,相信你應該有足夠的IT背景,編程沒啥問題,其次的話就是要了解數理來溝通金融產品選擇與編程落地,需要了解的科目有:概率論、統計學、計量經濟學、金融經濟學、數理金融等。