导航:首页 > 源码编译 > weka中的分类算法

weka中的分类算法

发布时间:2023-04-20 11:18:41

1. 数据挖掘WEKA工具怎样来用来进行文本分类有800多个测试文本,求大神给出具体的步骤和通俗易懂的

第一步,你要有中文的数据集;
第二步,数据集要准备成weka能处理的结构,这很好做到,你把数据集压缩了就行了,因为它要求的格式是,一个类别的文件放一个文件夹下。但是还有一个问题,你的机器往往没那么多内存去处理这个数据集,滑渗那么你可以选几个类别猛让兄出来,在每个类别中放几十个文档来做就可以了。
第三步,分词。
第四步,使用weka wiki中的例子将数据集转换成arff格式。

weka是一种机器学习算法的集合,它可以用于分类,预测等。由于weka支持的数据格式是arff或csv的格式,因此在进行weka实验的时候必须进行数据的预处理。一般,我们可以在EXCEL里面导入TXT,然后另存为.CSV格式的文件(这个格式WEKA也是可以识别的),然后打开WEKA,–》TOOL–》 arffviewer中打开刚才的.CSV文件,另存枝袭为.arff就OK了!

2. weka分类算法选项不可用是怎么回事

两种原樱段因1、你的weka出脊睁誉问题了;
2、你的数据不适合分类,自然分类选项会是灰色的;早衡

3. 我是weka新手,我下载数据集后,用weka中的id3算法来进行分类,结果不能看到决策树,是怎么回事啊

weka的ID3算法是会输出一个决策树的,只不过那只是中间计算时输出的结果。同时还会输出很多其他的统计结果。
要看看它有没有报错。 数据集的属性是不是都是离散型的。如果有些是实数型,如17.1,17.2,1.735,17.2....这样就不符合要求,无法生成合理的决策树。
以下是一个简单的weka输出决策树:

age = youth
| student = no: no
| student = yes: yes
age = middle_aged: yes
age = senior
| credit_rating = fair: yes
| credit_rating = excellent
| | income = high: null
| | income = medium: no
| | income = low: no

4. 从java中调用weka中的分类函数的问题

详细咐轮乱请见:http://stackoverflow.com/questions/8112041/error-while-using-weka-api-in-java-code-class-attribute-not-set
你应桐正该在这行 Instances instances = getArffData("E:\\Book2.arff"); // 读衡档入文件
后加入一条语句: instances.setClassIndex(instances.numAttributes() - 1);
You should set class index of for your dataset before passing it into classifier. Your classifier must know which is your outcome variable.
//Rest of your code
loader.setQuery("select * from data_training"); Instances data = loader.getDataSet(); //add this line here
data.setClassIndex(instances.numAttributes() - 1);
//if Hujan is your class attribute(outcome variable)

5. 如何在WEKA中添加自己的算法

1. 编写新算法,所编写的新算法必须符合Weka 的接口标准。在此以从Weka中文站上下载的一个算法(模糊C均值聚类算法:FuzzyCMeans)的添加为例说明其具体过程。

2. 由于FuzzyCMeans是聚类算法,所以直接将FuzzyCMeans.java 源程序考到 weka.clusterers 包下

3. 再修改weka.gui.GenericObjectEditor.props ,在#Lists the Clusterers I want to choose from的weka.clusterers.Clusterer=\下加入:weka.clusterers.FuzzyCMeans

4. 相应的修改weka.gui.GenericPropertiesCreator.props ,此去不用修改,因为包weka.clusterers已经存在,若加入新的包时则必须修改这里,加入新的包

我试了一下,这样加入之后,重新编译,运行后,可以在weka的Explorer界面上的Cluster选项卡中的聚类算法中找到刚刚新添加的FuzzyCMeans算法。

添加过程简单吧!关键问题是要弄清楚Weka的内核以及其接口标准,然后编写出符合此规范的新算法。

6. weka软件中bayes分类器的使用

你进choose以后,先点filter...按钮,你看看里面数据集手散的特性手胡,你估计把bayesnet方法过毕薯氏滤掉了。

7. 用weka贝叶斯公式决策分类的步骤是什么求赐教。。。。 最好给出详细的步骤,谢谢!

你可以用程序debug跟踪一下,以前是weka中NaiveBayesSimple类的主要函数和作用。
(1) globalInfo()
返回该分类器的描述字符串.
(2) getTechnicalInformation()
返回一个TechnicalInformation类型的对象实例,包含该类的技术背景等信息.
(3) getCapabilities()
返回默认参数.
(4) BuildClassifier(Instances instances)
BuildClassifier()方法从一个训练数据集合instances构造一个分类器.求出所有名称型属性的后验概率,类属性的先验概率,数值属性的均值和方差,为后来的分类工作做准备.
(5) distributionForInstance (Instance instance)
该方法计算待分类实例instance属于各个类标的百分比,并且将各个百分比数值存于一个数组中,最后返回该数组.
(6)toString()
把分类器的参数(均值,方差,各先验概率,各后验概率)以字符串的形式返回.
(7)normalDens(double x, double mean, double stdDev)
该方法用于根据正态分布(均值为mean,方差为stdDev)计算数值型属性当属性值为x时的概率密度.
(8) getRevision()
返回程序的版本号.
(9) Main()
当类从命令行被执行时,就会调用main()方法.他只是用所给的命令行选项告诉Weka的Evaluation类来评估朴素贝叶斯,并且打印所得到的数组.完成这个功能的一行表达式包括在try-catch声明中.try-catch声明用于发现Weka例程或其他Java方法中抛出的各种异常.

8. 如何用weka将多种分类算法集成起来

需要将文件转换成标称(nominal)类型,weka把exel中的数字看作是数据类型,不能处理,从而导致Apriori算法没法用。
WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。wekaWEKA作为一个公开的数据挖掘工作,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。
如果想自己实现数据挖掘算法的话,可以参考weka的接口文档。在weka中集成自己的算法甚至借鉴它的方法自己实现可视化工具并不是件很困难的事情。
2005年8月,在第11届ACM SIGKDD国际会议上,怀卡托大学的Weka小组荣获了数据挖掘和知识探索领域的最高服务奖,Weka系统得到了广泛的认可,被誉为数据挖掘和机器学习 历史上的里程碑,是现今最完备的数据挖掘工具之一(已有11年的发展历史)。Weka的每月次数已超过万次。

阅读全文

与weka中的分类算法相关的资料

热点内容
截图怎么保存文件夹然后压缩 浏览:4
幻影服务器怎么样 浏览:27
具体哪些广东公司招程序员 浏览:867
嵌入式编译器教程 浏览:302
ssl数据加密传输 浏览:86
51单片机定时器方式2 浏览:330
命令行查看开机时间 浏览:812
python微博复杂网络分析 浏览:550
rf3148编程器 浏览:505
浙江标准网络服务器机柜云主机 浏览:587
设置网络的服务器地址 浏览:600
java图形界面设计 浏览:751
纯前端项目怎么部署到服务器 浏览:538
瓜子脸程序员 浏览:505
如何保证服务器优质 浏览:94
小微信aPP怎么一下找不到了 浏览:299
算法纂要学术价值 浏览:975
程序员你好是什么意思 浏览:803
倩女幽魂老服务器如何玩 浏览:563
电子钟单片机课程设计实验报告 浏览:1001