matlabem演算法實現_用MATLAB實現EMD演算法

1. 運行MATLAB配置要求

處理器：intel i7 3770K或以上的四核。
內存：三通道DDR3 1600，三條4G的
操作系統：64位的win7或Vista（這樣12G內存可以全部調用，32位的系統最多隻能調用3.25G）
＝＝如果要預算便宜1000塊，建議
AMD推土機FX-8150。動態加速到4.5G的8核，2013版的Matlab也算不死。
內存：雙通道DDR3 1866，4G兩條或8G兩條。
系統：64位
＝＝intel的i7，不用買1866內存，因為內存控制器只支持到1600。推土機支持1866的。
推土機的功耗比i7大48W（一年開機365天，每天8小時，電費多50塊），發熱較大，因此建議買保一年的散片，1060。另買散熱器：超頻三黃海S90F至尊版，95。不買盒裝（1220）。盒裝的散熱器不好。

2. 用MATLAB實現EMD演算法

ilovematlab論壇上可以免費下載，都可以運行

3. EM演算法深度解析

最近在做文本挖掘的時候遇到了EM演算法，雖然讀書的時候簡單地接觸過，但當時並沒有深入地去了解，導致現在只記得演算法的名字。既然EM演算法被列為數據挖掘的十大演算法之一，正好借這個機會，重新學習一下這個經典的演算法。學習的過程中，我發現網上的資料大多講解地不夠細致，很多地方解釋得並不明了。因此我決定拋開別人的想法，僅從數學推導本身出發，盡力理解每一個公式的含義，並將其對應到實際的實驗過程當中。這篇博客記錄了我對與EM演算法的思考與理解，也是我人生中的第一篇博客，希望能夠對於想要學習EM演算法的同學有所幫助。

前面談到我在做文本挖掘的時候遇到了EM演算法，EM演算法用於估計模型中的參數。提到參數估計，最常見的方法莫過於極大似然估計——在所有的候選參數中，我們選擇的參數應該讓樣本出現的概率最大。相信看到這篇筆記的同學一定對極大似然估計非常熟悉，而EM演算法可以看作是極大似然估計的一個擴充，這里就讓我們用極大似然估計來解決一個簡單的例子，來開始正式的討論。

有A，B，C三枚硬幣，我們想要估計A，B，C三枚硬幣拋出正面的概率 , , 。我們按如下流程進行實驗100次：

記錄100次實驗的結果如下：

我們將上面的實驗結果表述如下：
表示第i次實驗中，硬幣A的結果，1代表正面，0代表反面；表示第i次實驗中，硬幣B或硬幣C拋出正面的個數，則參數的極大似然估計分別為：

即硬幣A，B，C各自拋出正面的次數占總次數的比例，其中為指示函數。

實驗流程與1相同，但是我們不慎遺失了硬幣A的記錄結果，導致我們只知道隨後十次拋出了多少次正面，多少次反面，卻不知道實驗結果來自於硬幣B還是硬幣C。在這種情況下，我們是否還能估計出 , , 的值呢？

這時候利用極大似然估計似乎行不通了，因為這種情況下，我們不但缺失了硬幣A產生的觀測值，同時也不知道哪些觀測值屬於硬幣B，哪些觀測值屬於硬幣C。

有些同學可能會提出，雖然我們無法得到三個硬幣各自產生的樣本，但是我們依然可以得到每個觀測值出現的概率。比如在第一次實驗中，我們拋出了5次正面5次反面，我們可以做如下思考：

假設這5次正面由硬幣B得到，那麼概率應該為，而這次觀測值來自於硬幣B，也就是硬幣A拋出正面的概率為

假設這5次正面由硬幣C得到，那麼概率應該為，而這次觀測值來自於硬幣C，也就是硬幣A拋出反面的概率為

綜合起來，利用條件概率公式，這個觀測值出現的概率就是

因此我們可以將樣本整體的概率和似然函數利用 , , 表示出來，通過對似然函數求導，令其關於的偏導數等於0，我們可以求出三個參數的值。

這個思路聽上去十分合理，我們可以順著這個思路進行數學推導，看看可以得到什麼樣的結果。首先我們計算樣本的概率:

對應的似然函數為

其中關於的條件分布為

的分布為

因此我們可以得到

至此，我們成功地得到了似然函數。然而觀察可以發現，這個函數是由100項對數函數相加組成，每個對數函數內部包含一個求和，想通過求導並解出導數的零點幾乎是不可能的。當然我們可以通過梯度下降來極小化這個函數，藉助深度學習庫的自動微分系統在實現上也非常容易。但是這種做法過於簡單粗暴，有沒有辦法來優雅地解決這個問題呢？在繼續討論之前，我們先將這類問題進行一般化表述：

我們觀測到隨機變數產生的m個相互獨立的樣本 , 的分布由聯合分布決定，是缺失數據或無法在實驗中被直接觀測到，稱為 隱變數 ，我們想要從樣本中估計出模型參數的值。在接下來的討論中，我們假定的取值是離散的，於是可以得到似然函數如下:

接下來，我們就探討一下，如何利用EM演算法解決這個問題。

這一部分的數學推導，主要參考了吳恩達CS229n的筆記，並且根據個人的思考和理解，盡力對公式的每一步進行詳細的解釋。我們先簡單地介紹一下琴生不等式。

琴生不等式有多種形式，下面給出其離散形式的表述和概率論中的表述:
1.若為嚴格凹函數，為定義域內的n個點，是n個正實數，且滿足 , 則下述不等式成立:

當且僅當時，不等式取等號。

2.若為嚴格凹函數，為實值隨機變數，且期望存在，則下述不等式成立:

當且僅當，即為常數時，不等式取等號。

註：這里將函數上方為凹集的函數稱為凹函數，例如函數就是凹函數。
相信大家對琴生不等式都十分熟悉，因此這里就不做過多的說明。接下來，我們將琴生不等式應用到我們的問題中。

回到我們之前的問題上，我們想要極大化下面這個函數:

但是我們無法對這個函數直接求導，因此我們藉助琴生不等式，對這個函數進行變換。為了讓過程看上去簡潔，下面只對求和中的第項進行計算。

令滿足，且，則根據琴生不等式，可以得到：

當且僅當為常數時，上述不等式取等號。也就是說，對於任意，是一個與無關的量。設對於任意，我們可以得到：

因此當時，不等式取等號，容易驗證此時 , 與無關。將綜合一下，我們可以得到以下結論:

到這里為止，我們已經擁有了推導出EM演算法的全部數學基礎，基於我們可以構建出E步和M步。上面的數學推導雖然看上去略為復雜，但實際上只用到了三個知識點：
1.琴生不等式:

2.條件概率:

3.聯合分布求和等於邊緣分布:

對上面的數學推導有疑問的同學，可以結合上面這三點，再將整個推導過程耐心地看一遍。

大部分關於EM演算法的資料，只是在數學形式上引入了函數，即，以滿足琴生不等式的使用條件，卻沒有過多地解釋函數本身。這導致了很多人完全看懂了演算法的推導，卻還是不理解這些數學公式究竟在做什麼，甚至不明白EM演算法為什麼叫做EM演算法。所以在給出E步和M步之前，我想先談一談函數。

我們回顧一下函數所滿足的條件（暫時不考慮琴生不等式取等號的限制），

在所有可能的取值處有定義。可以看出，是的樣本空間上任意的一個概率分布。因此，我們可以對不等式進行改寫。首先我們可以將含有的求和寫成期望的形式:

這里指的是在概率分布下，求隨機變數和的期望。有同學會問，為什麼我們平時求期望的時候只要寫，並沒有指明是在哪個概率分布下的期望。這是因為一般情況下，我們都清楚地知道隨機變數所服從的分布，並且默認在分布下求期望。

舉個例子，我手上有一個硬幣，拋了10次，問拋出正面次數的期望。這種情況下，大部分人會默認硬幣是均勻的，也就是說拋出正面的次數服從二項分布，期望。這時有人提出了質疑，他說我認為你這個硬幣有問題，拋出正面的概率只有0.3，那麼在他眼裡，期望。

回到正題，我們利用等式改寫不等式，可以得到:

這正是琴生不等式在概率論中的形式。我們可以將不等式倒過來理解：
首先，假定隨機變數服從概率分布，是的樣本空間上的任意一個概率分布。這里可以是一組定值，也可以是關於參數的函數。

顯然，當我們取不同的時，隨機變數的期望也會隨之改變。需要注意的是，由於與相關，所以這里的期望不是一個數值，而是關於的函數。

當我們令為的後驗分布時，上面的期望最大。這里有兩點需要注意，1. 後驗分布也是一個關於參數的函數。2. 由於期望是關於的函數，所以這里的最大指的並非是最大值，而是最大的函數。

若對於每一個，我們都令為的後驗分布，則上述期望之和等於我們要極大化的似然函數，即

通過上述分析，我們為尋找似然函數的極大值點提供了一個思路。我們不去極大化似然函數本身，而是去極大化。至於如何將這個思路實際應用，就要利用到EM演算法中的E-step和M-step。

這一節中，我們先給出E-step和M-step的數學形式，隨後在結合拋硬幣的例子來解釋這兩步究竟在做什麼。下面進入演算法的流程，首先我們任意初始化，按下述過程進行迭代直至收斂：

在第次迭代中，
(E-step)對於每個，令
(M-step)更新的估計值，令

EM演算法從任意一點出發，依次利用E-step優化，M-step優化，重復上述過程從而逐漸逼近極大值點。而這個過程究竟是怎樣的呢，就讓我們一步步地揭開EM演算法的面紗。

假設我們現在隨機初始化了，進入第一輪迭代：
(E-step)

由於我們已經假定模型參數為，所以此時不再是與有關的函數，而是由一組常數構成的概率分布。結合拋硬幣的例子來看，這一步是在我們已知模型參數的基礎上(雖然這是我們瞎猜的)，去推測每一次的觀測值是由哪個硬幣產生的，或者說我們對每一次觀測值做一個軟分類。比如我們根據初始化的參數，計算出，。可以解釋為第個觀測值有20%的概率來自於硬幣B，80%的概率來自於硬幣C；或者說硬幣A拋出了0.2個正面，0.8個反面。

(M-step)

考慮到是一組常數，我們可以舍棄常數項，進一步簡化上面這個要極大化的函數

由於不再與相關，因此上面的函數變成了對數函數求和的形式，這個函數通常來說是容易求導的，令導數等於0，我們可以求出新的參數。我們仍舊以拋硬幣為例進行解釋，

令 , 可以得到，

這三個參數的解釋是顯而易見的。我們在E-step中對每個觀測值進行了軟分類，可以看成是硬幣A拋出正面的次數，所以是的極大似然估計；是我們拋硬幣B的次數，是硬幣B拋出正面的次數，所以是的極大似然估計；對於我們有相同的解釋。

我們將這個結果與拋硬幣1中極大似然估計的結果相比較可以發現，之前結果中的指示函數變成了這里的，在指示函數下，某個觀測值要麼來自於硬幣B，要麼來自於硬幣C，因此也稱為硬分類。而在函數下，某個觀測值可以一部分來自於硬幣B，一部分來自於硬幣C，因此也稱作軟分類。

將上述兩步綜合起來，EM演算法可以總結如下：我們首先初始化模型的參數，我們基於這個參數對每一個隱變數進行分類，此時相當於我們觀測到了隱變數。有了隱變數的觀測值之後，原來含有隱變數的模型變成了不含隱變數的模型，因此我們可以直接使用極大似然估計來更新模型的參數，再基於新的參數開始新一輪的迭代，直到參數收斂。接來下我們就討論為什麼參數一定會收斂。

前面寫了太多的公式，但是這一部分我不打算給出收斂性的數學推導。其實數學上證明EM演算法的收斂性很容易，只需要證明每一輪迭代之後，參數的似然函數遞增，即

4. matlab如何實現蒙特卡洛演算法

1、打開MATLAB軟體，如圖所示，輸入一下指令。

5. 急求如何用MATLab實現EM演算法

最大期望演算法（Expectation Maximization Algorithm，又譯期望最大化演算法），是一種迭代演算法，用於含有隱變數（hidden variable）的概率參數模型的最大似然估計或極大後驗概率估計。
實現代碼如下：
02 Jul 2015 hui cheng
06 May 2015 Mei Dong
very good job！

12 Nov 2014 Jobaer
please, sir , send me a source code on image segmentation. I want to segement weeds from soil.My email address is [email protected] .

18 Jan 2014 HuangJunFeng HuangJunFeng
16 Dec 2013 widdy
19 Feb 2013 Tong Chu
01 Jan 2013 manas nag
sir
after executing this it is declaring that k is undefined

04 Dec 2012 Jason Rebello
Some people want to know how to view the segmented image. For example suppose you have two classes ie k=2; us the following code to view it
[row col] = size(ima);
final_img = zeros(row,col);
for i=1:row
for j=1:col
if mask(i,j)==1
final_img(i,j)=1;
else
final_img(i,j)=255;
end
end
end
imshow(final_img/255);
This is a naive way of viewing it .. you may have to change somethings if k>2. Anywayz hope it helps. The mask basically stores the segmented image.

16 Nov 2011 surya
great job.i am using the same algorithm in my project for x-ray images.can u please tell how to view the segmented image

Comment only

18 Feb 2010 prashanth
Sir, I am starting my project on the same subject. i was unable to find the algorithm psuedocode for em algorithm. kindly send me one at [email protected]. Also can u just tell me the explanation for the source code..

Comment only

21 Dec 2009 maria
Hi, could you please explain how I can use "mask" to see result of segmentation??

Comment only

17 Mar 2009 Patrick
Greetings Prof., Very nice .. could you please let me know what exactly does the mask variable store ? As what i see it classifies each pixel that falls within each class . Am i correct in that assumption?
Thanks

24 May 2008 darko brajicic
great job!

27 Apr 2008 Bilo Bilo
Thanks

15 Aug 2007 smiled fisher
06 Nov 2006 Karthik Raja T
HI, Greetings,can it for my color image segmentation ?

04 Sep 2006 Mikel Rodriguez
12 Jul 2006 carlos mas
03 May 2006 Mohamed Sami
look when u make a code u must show us the output to see it then u read ur code .. try to explain that with output we can see bye

導航:首頁 > 源碼編譯 > matlabem演算法實現

matlabem演算法實現

與matlabem演算法實現相關的資料