⑴ MI算法是什么
是文本特征选择算法
特征选择在文本挖掘技术中是一个关键部分。训练集中的文本逐个经过分词后,可形成文本分类系统的全特征空间,一般情况下,这个空间的维数都会较大,可达到几十万维。经过特征选择之后,在降低噪声的同时,特征空间的维数得以压缩,最终能提高分类算法的速度和分类精度。本文从传统的MI(Mutual Infomation)出发,并对它进行改造,最后通过实验验证改进算法的有效性。
⑵ 如何从图像中提取特征值
提取的典型技术特征包括:特征选择、特征提取、特征变换等。
特征选择:
特征选择是从原始数据中选择最相关的特征,以提高模型的泛化能力和效果。常用的特征选择方法包括过滤式、包裹式和嵌入式方法。过滤式方法通过计算特征与目标变量之间的相关性或统计指标来选择特征;
边缘检测用于检测图像中的边缘和轮廓信息;SIFT是一种局部特征描述算法,可以提取图像中的关键点和其对应的特征向量;CNN是一种深度学习模型,可以通过卷积层、池化层等操作来提取图像的高级特征。