导航:首页 > 源码编译 > kmeans聚类算法

kmeans聚类算法

发布时间:2022-02-09 11:32:15

A. k-means聚类算法中 相似中心怎么计算的

每个特征点都与各个中心点算距离,再比较哪个最近。最简单就是用欧氏距离。


B. K-means聚类算法的K怎么确定啊

你需要分几类就写K等于多少啊

C. Kmeans聚类算法的聚类数目可能小于K吗

是否可能取决于你的算法是如何实现的。建议你看看weka和matlab的km算法实现。聚类数小于k的原因是聚类过程中出现空簇,如果没有特殊的处理,这个问题是无法在后续的循环中自行解决的。weka的实现是允许输出聚类数小于k的,出现空簇就直接将空簇删除;而matlab的km有一个参数用于解决聚类数小于k的问题,例如直接选择最远离聚类中心的点作为一个新的簇。

D. K-Means聚类算法原理是怎么样的

问题:
姓名 身高 体重 眼睛
A 180 X 1.2
A X 140 X

A 180 140 X

A 168 120 1.5
姓名一样,用java算法,判断出是两个人?

E. k-means聚类算法,噪声值怎么处理

从你这情况看来貌似属于离群点了啊……离群点会影响聚类效果,应该删掉的
两个方法,你可以试试
一个是你聚类的数量K设大一些,聚类之后把那些零头喀嚓掉,就是那些只有一两个数据点的删掉
还有一个方法就是层次聚类,定义一个合并熵,每次两两合并,合并到一定程度(再合并代价高于一定阈值)之后,把落单的那些删掉
当然最简单的办法,看你这个属于一维,应该是可以直接定一个阈值把阈值以上的砍掉的,当然如果你说数值比较大的部分也需要聚一个类出来的话,那还是采用上面说的第二种方法吧

F. 急求:k-Means聚类算法实现

K-MEANS算法:
k-means 算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。

k-means 算法的工作过程说明如下:首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数. k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。

具体如下:
输入:k, data[n];
(1) 选择k个初始中心点,例如c[0]=data[0],…c[k-1]=data[k-1];
(2) 对于data[0]….data[n], 分别与c[0]…c[n-1]比较,假定与c[i]差值最少,就标记为i;
(3) 对于所有标记为i点,重新计算c[i]={ 所有标记为i的data[j]之和}/标记为i的个数;
(4) 重复(2)(3),直到所有c[i]值的变化小于给定阈值。

算法实现起来应该很容易,就不帮你编写代码了。

G. k-means聚类算法一定要指定聚类个数吗

其实我猜你想问的是怎么改进k-means算法,可以摆脱手工指定k值。实质上通过算距离达到聚类的算法是必须要手工指定一个值的,也就是说需要一个参照。
不需要制定聚类个数的聚类算法,例如:DBSCAN

阅读全文

与kmeans聚类算法相关的资料

热点内容
php大流量网站 浏览:147
买车app哪个是正规的 浏览:170
python中的class是什么 浏览:202
安卓导航屏如何接灯光线 浏览:691
哪个app能查天津违章 浏览:431
预订汽车票在哪个app 浏览:704
五菱宏光压缩机安装 浏览:460
苹果电脑怎么编译vlc 浏览:107
多传感数据融合算法 浏览:213
access2010压缩 浏览:152
安卓最旧系统是什么 浏览:709
草根到百万程序员 浏览:699
学员招聘app哪个好 浏览:450
感到解压就拍拍手 浏览:113
php404页面代码 浏览:717
php唯一编号 浏览:601
硬盘文件夹没法打开 浏览:444
访问外网的svn服务器地址 浏览:880
想去自由行有什么好的app 浏览:214
视频监控数据库如何加密 浏览:762