weka教程pdf_WEKA中導入csv或者arff數據集失敗

㈠備考CDA數據分析師2級認證需要准備什麼教材

教材方面還是以官方的推薦為主吧，我在CDA數據分析的官網查到大概有4本是必讀的，1. 經管之家. CDA 數據分析師備考手冊（電子版）. 2019. (必讀)。2. 數據挖掘：概念與技術（原書第 3 版）[M]. 范明，孟小峰譯, 機械工業出版社，2012. (必讀)。3. 數據挖掘導論（原書第 2 版）[M]. 段磊，張天慶譯, 機械工業出版社，2019. (必讀)。4. 周志華. 機器學習[M]. 清華大學出版社，2016. (必讀)。還有不少是選讀的，有時間跟精力建議一起准備，多了解一些總沒錯的。

㈡ WEKA中導入csv或者arff數據集失敗

read 5, expected 6是說本要讀6個數據，但是只讀到了5個，你要檢查一下21行及「20、22行」，有沒有出現一行只有4個逗號的情況，如果沒有，有可能是你csv文件的內容包含非法字元之類的。
自己製作arff，注意attribute的類型必須正確，你又捨不得貼文件，那隻能靠你自己了

㈢ weka軟體使用教程

http://wenku..com/view/020e57f5f61fb7360b4c65cc.html

CC

㈣誰會使用weka進行數據挖掘求教！請留下聯系方式。我的qq 6 2793 08 87

網上搜索weka教程就可以了，如果你懂數據挖掘演算法，學會weka應該不是難事。我之前用過。

㈤數據可視化分析工具有沒有完全免費的

1. Excel / Spreadsheet

http://www.openoffice.org/download/

excel 基本上支持了最常用的數據分析功能：用來概述(總結)數據特徵，數據可視化，對數據轉型(去除噪音數據)從而得到新的數據集用來分析等。盡管Microsoft excel這個軟體是付費的，但你可以用其替代品，例如open office, google docs!

2. Trifacta

https://www.trifacta.com/start-wrangling/

excel在數據大小上有限制，但這個工具沒有這樣的局限，您可以安全地用它處理大數據集。這個工具有令人難以置信的特性，如圖表推薦、內置演算法、分析洞察力，您可以使用這些特性在任何時間內生成報告。

3. Rapid Miner

https://rapidminer.com/

在建立機器學習模型方面的具有專業性,包含了我們經常使用的所有ML演算法。能閃電般的快速水平上提供分析經驗。他們的生產線上有幾個為大數據、可視化、模型部署而構建的產品，其中一些產品(企業)包括訂閱費。

4. Rattle GUI

https://cran.r-project.org/bin/windows/base/

它是一個旨在連接技術，業務和數據的強大工具。它可分為兩部分：編碼和非編碼。它對任何旨在發展，建立，在網路上部署和擴展模型的組織來說都是一個完整的軟體包。

12. OpenRefine

http://openrefine.org/download.html

專門研究混亂的數據;為預測建模目的而清理、轉換和塑造數據。使用Open Refine進行改進，分析人員不僅可以節省時間，還可以將其用於生產工作。

㈥如何將txt文件轉化成weka文件格式

用excel將文件另存為csv格式，weka可以直接打開csv文件，然後另存為arff文件

㈦ weka中加入FCM不成功，有人說是因為沒有連接MYSQL資料庫，請問該怎麼連接，具體步驟，本人菜鳥

這個是不需要連資料庫的，去網上下個教程就好，紅色字體不代表錯誤

㈧如何在Mac系統下安裝R語言中 rattle這個包

配備Windows操作系統而且能夠上網的PC 安裝光碟dmg鏡像文件 23G的可用空間你的勇氣和耐性第一步：縮小現有分區卷右鍵點擊我的電腦（計算機）——>管理——>彈出來的窗口左邊的磁碟管理，這里你可以看見你的硬碟分區狀況。我的D盤有很多的剩餘空間，所以我拿它來開刀，之前說過，我們共需要20+6.3=26.3GB的空間，因此，我要先把D盤縮小26.3G，在D盤上點擊右鍵——>壓縮卷然後在彈出來的框輸入26906（1024MB/GB×26.3GB），然後按確定即可。雖然這個指南的操作不會刪除你硬碟上的數據，不過，在處理與分區有關的步驟是整個指南裡面最危險的一步，稍有不慎，你的數據將在彈指間煙消雲散，請一定不要忽略任何警告框裡面的提示。右鍵點擊未分配空間——>新建簡單卷，點擊下一步後輸入6426（1024MB/GB×6.3GB），下一步將此空間分配到E，不要格式化（記住了！）。完成之後Windows會彈出框告訴你需要格式化E才能訪問，先謝謝她的好意，不過選擇取消，不格式化。用同樣的辦法把剩下的20G也新建一個卷。這個卷隨便你格不格式化。第二步：載入DVD到硬碟並修改。把下載好的懶人版鏡像通過硬碟助手寫入後面的6.3G未格式化的那個分區。2.此時如果程序出現沒響應也不必擔心，耐心等待拷貝完成。確保完成後出現Change Partition type to AF: success字樣如下（必須），如果是Failed的話，把分區格式化，再刪除重新來一遍，或者手動使用Acronis Disk Director Suite或Paragon PM把分區格式標志設為AF，AF是16進制裡面175的意思，HFS分區應有AF的標記。第三步：使用變色龍Chameleon啟動雪豹安裝盤 1.開機的時候選擇剛從變色龍Chameleon啟動項啟動會看到類似下面的界面 2.對Mac兼容比較好主板，一般都可以直接進入安裝界面 3.現在需要進行抹盤操作就是那個20GB的分區（一定看清楚摸錯了就哭去吧） 4.將需要抹盤的分區改為max os擴展（日誌式） 5.關閉磁碟工具進行安裝 6.安裝成功後會有提示，如果安裝失敗，本人表示無能為力，別問我了。不過安裝失敗並不是「真正的失敗」，你就當作安裝成功，繼續操作，應該也可以進系統。 7.重啟後你會發現進不了win，因為此時活動分區被Mac系統盤搶去了。這時進入win7 pe把C盤標記為活動就行了 8.進入win你就可以看到Mac系統盤，然後把安裝盤的Extra文件夾復制到系統盤，重啟，通過變色龍引導系統盤， 9.接著是幾部簡單的下一步步驟真的就不給圖了，真的很簡單。第四步完善階段 .設置安全性與隱私（如果不設置此項，會不能正常安裝pkg和mpkg包。）當然這是最順利安裝，樓主可能會面臨進入MAC過後解析度不可調沒有聲音不能上網等一系列問題，到時候樓主需要開新帖求助了，安裝教程到此結束！

㈨ tsa007 行李箱密碼怎麼設置

tsa007 行李箱密碼按照如下方式設置。

1、首先按住行李箱鎖上下的按鈕。

㈩如何建立一個深度學習系統

Programming Libraries 編程庫資源
我是一個「學習要敢於冒險和嘗試」觀念的倡導者。這是我學習編程的方式，我相信很多人也是這樣學習程序設計的。先了解你的能力極限，然後去拓展你的能力。如果你了解如何編程，可以將編程經驗很快借鑒到深入學習機器學習上。在你實現一個實際的產品系統之前，你必須遵循一些規則、學習相關數學知識。
找到一個庫並且仔細閱讀相關文檔，根據教程，開始嘗試實現一些東西。下面列出的是開源的機器學習庫中最好的幾種。我認為，並不是他們中的每一種都適合用在你的系統中，但是他們是你學習、探索和實驗的好材料。
你可以從一個由你熟悉的語言編寫的庫開始學習，然後再去學習其他功能強大的庫。如果你是一個優秀的程序員，你會知道怎樣從一種語言，簡單合理地遷移到另一種語言。語言的邏輯都是相同的，只是語法和API稍有不同。
R Project for Statistical Computing：這是一個開發環境，採用一種近似於Lisp的腳本語言。在這個庫中，所有你想要的與統計相關的功能都通過R語言提供，包括一些復雜的圖標。CRAN(你可以認為是機器學弟的第三方包)中的機器學習目錄下的代碼，是由統計技術方法和其他相關領域中的領軍人物編寫的。如果你想做實驗，或是快速拓展知識，R語言都是必須學習的。但它可能不是你學習的第一站。
WEKA：這是一個數據挖掘工作平台，為用戶提供數一系列據挖掘全過程的API、命令行和圖形化用戶介面。你可以准備數據、可視化、建立分類、進行回歸分析、建立聚類模型，同時可以通過第三方插件執行其他演算法。
Mahout是Hadoop中為機器學習提供的一個很好的JAVA框架，你可以自行學習。如果你是機器學習和大數據學習的新手，那麼堅持學習WEKA，並且全心全意地學習一個庫。
Scikit Learn:這是用Python編寫的，基於NumPy和SciPy的機器學習庫。如果你是一個Python或者Ruby語言程序員，這是適合你用的。這個庫很用戶介面友好，功能強大，並且配有詳細的文檔說明。如果你想試試別的庫，你可以選擇Orange。
Octave:如果你很熟悉MatLab，或者你是尋求改變的NumPy程序員，你可以考慮 Octave。這是一個數值計算環境，與MatLab像是，藉助Octave你可以很方便地解決線性和非線性問題，比如機器學習演算法底層涉及的問題。如果你有工程背景，那麼你可以由此入手。
BigML:可能你並不想進行編程工作。你完全可以不通過代碼，來使用 WEKA那樣的工具。你通過使用BigMLS的服務來進行更加深入的工作。BigML通過Web頁面，提供了機器學習的介面，因此你可以通過瀏覽器來建立模型。
補充：
NLTK NLTK is a leading platform for building Python programs to work with human language data. It provides easy-to-use interfaces to over 50 corpora and lexical resources such as WordNet, along with a suite of text processing libraries for classification, tokenization, stemming, tagging, parsing, and semantic reasoning.LingPipe: 是一個自然語言處理的Java開源工具包。LingPipe目前已有很豐富的功能，包括主題分類（Top Classification）、命名實體識別（Named Entity Recognition）、詞性標注（Part-of Speech Tagging）、句題檢測（Sentence Detection）、查詢拼寫檢查（Query Spell Checking）、興趣短語檢測（Interseting Phrase Detection）、聚類（Clustering）、字元語言建模（Character Language Modeling）、醫學文獻下載/解析/索引（MEDLINE Download, Parsing and Indexing）、資料庫文本挖掘（Database Text Mining）、中文分詞（Chinese Word Segmentation）、情感分析（Sentiment Analysis）、語言辨別（Language Identification）等API。

挑選出一個平台，並且在你實際學習機器學習的時候使用它。不要紙上談兵，要去實踐！
Video Courses視頻課程
很多人都是通過視頻資源開始接觸機器學習的。我在YouTube和VideoLectures上看了很多於機器學習相關的視頻資源。這樣做的問題是，你可能只是觀看視頻而並不實際去做。我的建議是，你在觀看視頻的時候，應該多記筆記，及時後來你會拋棄你的筆記。同時，我建議你將學到的東西付諸實踐。
坦白講，我沒有看見特別合適初學者的視頻資源。視頻資源都需要你掌握一定的線性代數、概率論等知識。Andrew Ng在斯坦福的講解可能是最適合初學者的，下面是我推薦的一些視頻資源。
Stanford Machine Learning斯坦福的機器學習課程：可以在Coursera上觀看，這門課是由 Andrew Ng講解的。只要注冊，你可以隨時觀看所有的課程視頻，從Stanford CS229 course下載講義和筆記。這門課包括了家庭作業和小測試，課程主要講解了線性代數的知識，使用Octave庫。
Caltech Learning from Data加利福尼亞理工學院的數據分析課程：你可以在edX上學習這門課程，課程是由Yaser Abu-Mostafa講解的。所有的課程視頻和資料都在加利福尼亞理工學院的網站上。與斯坦福的課程類似，你可以根據自己的情況安排學習進度，完成家庭作業和小論文。它與斯坦福的課程主題相似，關注更多的細節和數學知識。對於初學者來說，家庭作業可能稍有難度。
Machine Learning Category on VideoLectures.Net網站中的機器學習目錄：這是個很容易令人眼花繚亂的資源庫。你可以找出比較感興趣的資源，並且深入學習。不要糾結於不適合你的視頻，或者對於感興趣的內容你可以做筆記。我自己會一直重復深入學習一些問題，同時發現新的話題進行學習。此外，在這個網站上你可以發現是這個領域的大師是什麼樣的。
「Getting In Shape For The Sport Of Data Science」 – 由Jeremy Howard講授：這是與機器學習競賽者的對話，他們是一些實踐中的R語言用戶。這是非常珍貴的資源，因為很少有人會討論研究一個問題的完整過程和究竟怎樣做。我曾經幻想過在網上找到一個TV秀，記錄機器學習競賽的全過程。這就是我開始學習機器學習的經歷！
Overview Papers綜述論文
如果你並不習慣閱讀科研論文，你會發現論文的語言非常晦澀難懂。一篇論文就像是一本教科書的片段，但是論文會介紹一個實驗或者是領域中其他的前沿知識。然而，如果你准備從閱讀論文開始學習機器學習的話，你還是可以找到一些很有意思的文章的。
The Discipline of Machine Learning機器學習中的規則：這是由Tom Mitchell編著的白皮書，其中定義了機器學習的規則。Mitchell在說服CMU總裁為一個百年內都存在的問題建立一個獨立的機器學習部門時，也用到了這本書中的觀點。
A Few Useful Things to Know about Machine Learning：這是一篇很好的論文，因為它以詳細的演算法為基礎，又提出了一些很重要的問題，比如：選擇特徵的一般化，模型簡化等。
我只是列出了兩篇重要的論文，因為閱讀論文會讓你陷入困境。
Beginner Machine Learning Books給機器學習初學者的書
關於機器學習的書有很多，但是幾乎沒有為初學者量身定做的。什麼樣的人才是初學者呢？最有可能的情況是，你從另外一個完全不同的領域比如：計算機科學、程序設計或者是統計學，來到機器學習領域。那麼，大部分的書籍要求你有一定的線性代數和概率論的基礎。
但是，還有一些書通過講解最少的演算法來鼓勵程序員學習機器學習，書中會介紹一些可以使用工具、編程函數庫來讓程序員嘗試。其中最有代表性的書是：《Programming Collective Intelligence》，《Machine Learning for Hackers》，《Hackersand Data Mining: Practical Machine Learning Tools and Techniques》（Python版, R版, 以及Java版）。如果感到迷惑的話，你可以選擇其中一本開始學習。
Programming Collective Intelligence: Building Smart Web 2.0 Applications：這本書是為程序員寫的。書中簡略介紹相關理論，重點以程序為例，介紹web中的實際問題和解決辦法。你可以買來這本書，閱讀，並且做一些練習。
Machine Learning for Hackers （中文版：機器學習:實用案例解析）：我建議你在閱讀了《Programming Collective Intelligence》一書之後，再閱讀這本書。這本書中也提供了很多實踐練習，但是涉及更多的數據分析，並且使用R語言。我個人很喜歡這本書！
Machine Learning: An Algorithmic Perspective：這本書是《Programming Collective Intelligence》的高級版本。它們目的相同（讓程序員開始了解機器學習），但是這本書包括一些數學知識，參考樣例和phython程序片段。如果你有興趣的話，我建議你在看完《Programming Collective Intelligence》之後來閱讀這本書。
數據挖掘：實用機器學習工具與技術（英文版·第3版）：我自己是從這本書開始了解機器學習的，那時是2000年這本書還是第一版。我那時是Java程序員，這本書和WEKA庫為我的學習和實踐提供了一個很好的環境。我通過這樣的平台和一些插件，實現我的演算法，並且真正開始實踐機器學習和數據挖掘的過程。我強烈推薦這本書，和這樣的學習過程。
Machine Learning（中文版：計算機科學叢書:機器學習）：這是一本很老的書，包括了一些規則和很多參考資料。這是一本教科書，為每個演算法提供了相關講解。
有一些人認為那些經典的機器學習教科書很了不起。我也贊同，那些書的確非常好。但是，我認為，對於初學者來說，這些書可能並不合適。
Further Reading 繼續閱讀
在寫這篇文章時，我認真思考了相關問題，同時也參考了其他人推薦的資料，以確保我沒有遺漏任何重要參考資料。為了確保文章的完整性，下面也列出了一些網上流行的，可以供初學者使用的材料。.
A List of Data Science and Machine Learning Resources:這是一份仔細整理的列表。你可以花一些時間，點擊鏈接，仔細閱讀作者的建議。值得一讀！
What are some good resources for learning about machine learning Why：這個問題的第一個答案令人吃驚。每次我閱讀這篇文章的時候，都會做好筆記，並且插入新的書簽。答案中對我最有啟發的部分是機器學習課程列表，以及相應的課程筆記和問答網站。
Overwhelmed by Machine Learning: is there an ML101 book：這是StackOverflow上的問題。並且提供了一系列機器學習推薦書籍。Jeff Moser提供的第一個答案是很有用的，其中有課程視頻和講座的鏈接。

導航:首頁 > 文檔加密 > weka教程pdf

weka教程pdf

與weka教程pdf相關的資料