1. 如何将excel表中的数据用weka进行聚类分析
你用weka做二次开发,你也没说你哪些接口用的weka的,首先你生成的arff文件中,文档有没有先分词,分词后有没有离散化,确保你的arff文件中attribute必须是一个一个的词,当然训练时也要包含类别信息,用于聚类后的验证,离散化后转成vsm模式,聚类方法你估计用的weka接口实现的,kmeans的输入参数可以指定聚几个类。
2. 在cmd中用java调用weka.core.converters.TextDirectoryLoader时,说“找不到或无法加载主类weka”
环境变量没有设置,win7:在我的电脑->属性->高级系统设置->环境变量->系统变量里,找到classpath的变量,就是在设置jre环境变量的时候添加的那个属性,后面加上;C:\Program Files\Weka-3-7\weka.jar;(前后俩分号都要!),然后点确定,重启电脑,再试试
3. WEKA中导入csv或者arff数据集失败
read 5, expected 6是说本要读6个数据,但是只读到了5个,你要检查一下21行及“20、22行”,有没有出现一行只有4个逗号的情况,如果没有,有可能是你csv文件的内容包含非法字符之类的。
自己制作arff,注意attribute的类型必须正确,你又舍不得贴文件,那只能靠你自己了
4. excel转换成csv文件,用weka打开的时候报错
方法/步骤
打开Access程序,点击Access左上角按钮,并选择打开。
在高级选项卡“代码页”选项中,选择“UTF-8”,然后点击确定。
可以看到原本乱码的文件转成简体中文了,点击下一步。
字段分割符选择“逗号”,点击下一步。
字段名称,即每列列头,如无更改需要直接点击下一步。
单击完成按钮,弹出成功创建连接表文件提示框。
如图所示,右键点击刚刚创建的链接表,然后点击导出中的Excel
在弹出的窗口中选择导出文件的保存路径及保存格式,并勾选如图所示两项。
系统会为你打开刚刚你所转换的Excel,查看下是不是已经转换完成了呢。
5. weka里Apriori关联规则挖掘,我希望得到的结论是与最后一列目标属性的关系,可是总是得到的都是前边条件属
weka里面的apriori算法,先生成所有的频繁项集,然后生成规则,根据最小支持度和置信度都满足的情况,选出强规则输出。
举个例子,比如有个长度为3的频繁项集ABC
那么你生成规则时候是:
A->BC
AB->C
AC->B
B->AC
BC->A
C->AB
然后分别对上述产生的规则计算置信度,如果不满足,就不输出
那么你所说的问题,很可能是因为你的最后一列在->右边时的规则不满足置信度。
所以没有那样的规则输出。
weka默认的最小支持度是0.1,最小置信度是0.9,你可以通过命令行进行调整,适当降低
置信度,可能就能看到你想要的规则了。
6. 如何在JAVA中打印显示出R语言算法的结果
java中调用操作系统控制台(就是命令行),控制台里运行R脚本(可以在命令行里用Rscript,不一定要在R环境底下写)。
实在不行试试weka。
7. 用weka贝叶斯公式决策分类的步骤是什么求赐教。。。。 最好给出详细的步骤,谢谢!
你可以用程序debug跟踪一下,以前是weka中NaiveBayesSimple类的主要函数和作用。
(1) globalInfo()
返回该分类器的描述字符串.
(2) getTechnicalInformation()
返回一个TechnicalInformation类型的对象实例,包含该类的技术背景等信息.
(3) getCapabilities()
返回默认参数.
(4) BuildClassifier(Instances instances)
BuildClassifier()方法从一个训练数据集合instances构造一个分类器.求出所有名称型属性的后验概率,类属性的先验概率,数值属性的均值和方差,为后来的分类工作做准备.
(5) distributionForInstance (Instance instance)
该方法计算待分类实例instance属于各个类标的百分比,并且将各个百分比数值存于一个数组中,最后返回该数组.
(6)toString()
把分类器的参数(均值,方差,各先验概率,各后验概率)以字符串的形式返回.
(7)normalDens(double x, double mean, double stdDev)
该方法用于根据正态分布(均值为mean,方差为stdDev)计算数值型属性当属性值为x时的概率密度.
(8) getRevision()
返回程序的版本号.
(9) Main()
当类从命令行被执行时,就会调用main()方法.他只是用所给的命令行选项告诉Weka的Evaluation类来评估朴素贝叶斯,并且打印所得到的数组.完成这个功能的一行表达式包括在try-catch声明中.try-catch声明用于发现Weka例程或其他Java方法中抛出的各种异常.
8. 关于weka数据处理
用knowledgeflow中的appender来解决
9. Java怎么执行weka里面的命令行,也就是用Java语句将一个csv文件转换成arff文件,跪求大神~~
FileReaderfr=newFileReader("F:\我的资料\数据统计\myfile.csv");
Instancesm_inInstances=newInstances(fr);
DataSink.write("F:\我的资料\数据统计\myfile.arff",m_inInstances);
10. weka安装启动命令窗口一闪而过,之后就没有了!这是怎么回事呢(我之前已经安装了java jre)
这么长时间,不知道你解决了没有,找到安装根目录,然后找到weka.jar,这是一个可执行jar文件,选择java运行方式打开就可以了。程序就启动了。