⑴ 譜聚類演算法的劃分准則
譜聚類演算法將聚類問題轉化為圖的劃分問題之後,基於圖論的劃分准則的優劣直接影響到聚類結果的好壞。常見的劃分准則有Mini cut,Average cut,Normalized cut,Min-max cut,Ratio cut,MNcut等。 Mini cut准則容易出現分割出只包含幾個頂點的較小子圖的歪斜分割現象,Ratio cut和Normalized cut等在一定程度上可以避免這種現象,但是當類間重疊嚴重時歪斜分割現象仍舊會發生。Chris Ding等人提出的基於Min-max cut的圖劃分方法充分體現了「子圖內部相似度最大,子圖之間的相似度最小」原則,能夠產生比較平衡劃分。
上述五種劃分都是不斷地將圖劃分為2個子圖的反復迭代運算過程,當劃分函數的最小值滿足一定的條件時迭代過程便會終止,相應的函數可以稱為2-way劃分函數。 Meilă和Xu[64]認為可以同時把圖劃分為k個子圖並於2004年提出了一種k-way規范割目標函數,而且對於參數k的選取問題也作了分析說明。
我們可以發現當k=2時,MNcut與Ncut兩者是等價的。
⑵ 分治演算法的解題步驟
分治法解題的一般步驟:
(1)分解,將要解決的問題劃分成若干規模較小的同類問題;
(2)求解,當子問題劃分得足夠小時,用較簡單的方法解決;
(3)合並,按原問題的要求,將子問題的解逐層合並構成原問題的解。
⑶ 集合劃分演算法
設n個元素的集合可以劃分為F(n,m)個不同的由m個非空子集組成的集合。
考慮3個元素的集合,可劃分為
①
1個子集的集合:{{1,2,3}}
②
2個子集的集合:{{1,2},{3}},{{1,3},{2}},{{2,3},{1}}
③
3個子集的集合:{{1},{2},{3}}
∴F(3,1)=1;F(3,2)=3;F(3,3)=1;
如果要求F(4,2)該怎麼辦呢?
A.往①里添一個元素{4},得到{{1,2,3},{4}}
B.往②里的任意一個子集添一個4,得到
{{1,2,4},{3}},{{1,2},{3,4}},
{{1,3,4},{2}},{{1,3},{2,4}},
{{2,3,4},{1}},{{2,3},{1,4}}
∴F(4,2)=F(3,1)+2*F(3,2)=1+2*3=7
推廣,得F(n,m)=F(n-1,m-1)+m*F(n-1,m)