1. 怎樣用weka對數據進行神經網路訓練
常用的神經網路就是向前反饋的BP(Back Propagation)網路,也叫多層前饋網路,而BP在weka中就是由MultilayerPerceptron演算法實現的。
所以呢
在weka explorer中選用classifiers.functions.MultilayerPerceptron訓練分類模型就可以了^^
2. 如何學習在eclipse工程中對weka演算法的調用
eka是很好用的機器學習庫,這里就不詳細介紹了。
言歸正傳,要使用程序方式使用weka,步驟如下:
一、在eclipse里新建一個java project:
1. 建立工程:單擊菜單中file->new->java project,在彈出對話框的project name中起任意一個名字,此處假設是wekaTest。單擊Finish按鈕(在對話框底部)。
2. 建立package:在package Explorer中找到剛才新建的工程,在其上右鍵->New->package。在Name文本框裡面輸入名稱,此處假設為Test。單擊Finish按鈕。
3. 建立程序文件:在剛才新建的package上面右鍵->New->class,選中public static void main(String[] args)多選框,單擊Finish。
二、在該工程中添加weka的引用:
1. package Explorer中工程名上右鍵,選擇彈出菜單最後一項properties->在左面選中java Build Path->在右面的Library頁面->單擊Add External JARs…->瀏覽weka所在目錄,將weka.jar添加進來,然後單擊ok。
3. 如何將excel表中的數據用weka進行聚類分析
你用weka做二次開發,你也沒說你哪些介面用的weka的,首先你生成的arff文件中,文檔有沒有先分詞,分詞後有沒有離散化,確保你的arff文件中attribute必須是一個一個的詞,當然訓練時也要包含類別信息,用於聚類後的驗證,離散化後轉成vsm模式,聚類方法你估計用的weka介面實現的,kmeans的輸入參數可以指定聚幾個類。
4. 如何將dbscan演算法導入weka中
看清楚dbscan演算法中有兩個關鍵的參數是 EPS, and Min group threshold. 直觀的想法是,如果你的eps很大,min-group-threshold 也很大的時候,那你得到的聚類的類數目就會少很多,那你搜索的時候就可能很快收斂。
5. Weka里可以直接使用TAN演算法嗎還是需要自己添加本人作畢業設計剛剛接觸Weka,求高人指點!
沒有的,Weka中只自帶了一些典型的演算法,像SimpleKmeans之類的。但是可以把演算法集成到Weka中,不知道你最後是用Weka的GUI演示還是用Weka的API開發,前者的話麻煩一點。我做畢設也剛好用到Weka,你也應該是做數據挖掘的東西的吧!希望對你有幫助。
6. weka中自己帶了哪些分類演算法啊,比如決策樹之外的。
weka演算法有很多,按大類分有bayes,function,tree以及rules演算法等。各個大類下麵包含很多演算法,比如tree類下就有決策樹,logistic tree,functional tree, random forest等等。具體可以看一下wake軟體說明。
7. 如何用weka將多種分類演算法集成起來
需要將文件轉換成標稱(nominal)類型,weka把exel中的數字看作是數據類型,不能處理,從而導致Apriori演算法沒法用。
WEKA的全名是懷卡托智能分析環境(Waikato Environment for Knowledge Analysis),同時weka也是紐西蘭的一種鳥名,而WEKA的主要開發者來自紐西蘭。wekaWEKA作為一個公開的數據挖掘工作,集合了大量能承擔數據挖掘任務的機器學習演算法,包括對數據進行預處理,分類,回歸、聚類、關聯規則以及在新的互動式界面上的可視化。
如果想自己實現數據挖掘演算法的話,可以參考weka的介面文檔。在weka中集成自己的演算法甚至借鑒它的方法自己實現可視化工具並不是件很困難的事情。
2005年8月,在第11屆ACM SIGKDD國際會議上,懷卡託大學的Weka小組榮獲了數據挖掘和知識探索領域的最高服務獎,Weka系統得到了廣泛的認可,被譽為數據挖掘和機器學習 歷史上的里程碑,是現今最完備的數據挖掘工具之一(已有11年的發展歷史)。Weka的每月次數已超過萬次。
8. 基於法weka兩種演算法結合怎麼做
1) 數據輸入和輸出
WOW():查看Weka函數的參數。
Weka_control():設置Weka函數的參數。
read.arff():讀Weka Attribute-Relation File Format (ARFF)格式的數據。
write.arff:將數據寫入Weka Attribute-Relation File Format (ARFF)格式的文件。
2) 數據預處理
Normalize():無監督的標准化連續性數據。
Discretize():用MDL(Minimum Description Length)方法,有監督的離散化連續性數值數據。
9. 如何在WEKA中添加自己的演算法
1. 編寫新演算法,所編寫的新演算法必須符合Weka 的介面標准。在此以從Weka中文站上下載的一個演算法(模糊C均值聚類演算法:FuzzyCMeans)的添加為例說明其具體過程。
2. 由於FuzzyCMeans是聚類演算法,所以直接將FuzzyCMeans.java 源程序考到 weka.clusterers 包下
3. 再修改weka.gui.GenericObjectEditor.props ,在#Lists the Clusterers I want to choose from的weka.clusterers.Clusterer=\下加入:weka.clusterers.FuzzyCMeans
4. 相應的修改weka.gui.GenericPropertiesCreator.props ,此去不用修改,因為包weka.clusterers已經存在,若加入新的包時則必須修改這里,加入新的包
我試了一下,這樣加入之後,重新編譯,運行後,可以在weka的Explorer界面上的Cluster選項卡中的聚類演算法中找到剛剛新添加的FuzzyCMeans演算法。
添加過程簡單吧!關鍵問題是要弄清楚Weka的內核以及其介面標准,然後編寫出符合此規范的新演算法。