⑴ MI演算法是什麼
是文本特徵選擇演算法
特徵選擇在文本挖掘技術中是一個關鍵部分。訓練集中的文本逐個經過分詞後,可形成文本分類系統的全特徵空間,一般情況下,這個空間的維數都會較大,可達到幾十萬維。經過特徵選擇之後,在降低雜訊的同時,特徵空間的維數得以壓縮,最終能提高分類演算法的速度和分類精度。本文從傳統的MI(Mutual Infomation)出發,並對它進行改造,最後通過實驗驗證改進演算法的有效性。
⑵ 如何從圖像中提取特徵值
提取的典型技術特徵包括:特徵選擇、特徵提取、特徵變換等。
特徵選擇:
特徵選擇是從原始數據中選擇最相關的特徵,以提高模型的泛化能力和效果。常用的特徵選擇方法包括過濾式、包裹式和嵌入式方法。過濾式方法通過計算特徵與目標變數之間的相關性或統計指標來選擇特徵;
邊緣檢測用於檢測圖像中的邊緣和輪廓信息;SIFT是一種局部特徵描述演算法,可以提取圖像中的關鍵點和其對應的特徵向量;CNN是一種深度學習模型,可以通過卷積層、池化層等操作來提取圖像的高級特徵。