馬爾科夫定位演算法_什麼是mcmc演算法

『壹』 SIL軟體採用什麼演算法呢

我知道的SIL軟體採用馬爾科夫演算法，其中做的比較好的是上海歌略軟體科技的SIL驗證軟體，是我見過

『貳』 Metropolis法和Metropolis-Hastings法有什麼區別嗎各自的優點是什麼呢感謝大神

原文鏈接：http://tecdat.cn/?p=19664

MCMC是從復雜概率模型中采樣的通用技術。

蒙特卡洛
馬爾可夫鏈
Metropolis-Hastings演算法

問題

如果需要計算有復雜後驗pdf p（θ| y）的隨機變數θ的函數f（θ）的平均值或期望值。

最受歡迎的見解

1.用R語言模擬混合制排隊隨機服務排隊系統

2.R語言中使用排隊論預測等待時間

3.R語言中實現馬爾可夫鏈蒙特卡羅MCMC模型

4.R語言中的馬爾科夫機制轉換(Markov regime switching)模型

5.matlab貝葉斯隱馬爾可夫hmm模型

6.用R語言模擬混合制排隊隨機服務排隊系統

7.Python基於粒子群優化的投資組合優化

8.R語言馬爾可夫轉換模型研究交通傷亡人數事故預測

9.用機器學習識別不斷變化的股市狀況——隱馬爾可夫模型的應用

『叄』 Markov鏈的定義3：

時間和狀態都離散的Markov過程稱為Markov鏈，形式上可以這樣表示：Pr{Xn=k|X0=h,.4一R1都能進行位移的m鱉幽猷《&；∞田的內部，而投影機的外殼用到了一種稱為「發泡鋁」的材料，這種材料本身是用於建築吸音的，這對降低風扇的噪音同樣會有幫助
源自：基於Markov鏈模型的儲層岩相隨機模擬《地球物理學進展》 2003年劉振峰，郝天珧，楊長春
來源文章摘要：在油氣儲層隨機建模研究中，基於Markov鏈模型的方法是一類較受歡迎的技術，同時也是一類不成熟的技術.問題的症結之一在於側向的轉移概率矩陣很難求取.針對這種情況，作者在深入理解Walther相律的基礎上，借鑒模擬退火演算法的相應思路，提出了一種岩相模擬的新方法，該方法依據不同岩相的百分比進行隨機模擬得到一幅初始圖像，而後以按岩相組織剖面得到的垂向和側向的岩相轉移概率矩陣的相似性作為判別標准對圖像進行擾動，直至得到滿意的圖像.二維模型試算結果表明了這種岩相隨機模擬方法的可行性. X(k+1）=X(k）×P
公式中：X(k）表示趨勢分析與預測對象在t=k時刻的狀態向量，P表示一步轉移概率矩陣，
X(k+1）表示趨勢分析與預測對象在t=k+1時刻的狀態向量。
必須指出的是，上述模型只適用於具有馬爾科夫性的時間序列，並且各時刻的狀態轉移概率保持穩定。若時間序列的狀態轉移概率隨不同的時刻在變化，不宜用此方法。由於實際的客觀事物很難長期保持同一狀態的轉移概率，故此法一般適用於短期的趨勢分析與預測。在較長時間後，馬爾科夫過程逐漸處於穩定狀態，且與初始狀態無關。馬爾科夫鏈達到穩定狀態的概率就是穩定狀態概率，也稱穩定
概率。市場趨勢分析中，要設法求解得到市場趨勢分析對象的穩態概率，並以此做市場趨勢分析。
在馬爾科夫分析法的基本模型中，當X：XP時，稱X是P的穩定概率，即系統達到穩定狀態時的概率向量，也稱X是P的固有向量或特徵向量，而且它具有唯一性。

『肆』請問誰知道markov模型是什麼啊謝謝

我想你說的應該是Hidden Markov Models
這是隱馬爾科夫模型
用在語音信號方面的,是為了分析語音信號而提出的一個演算法模型.在語音信號處理上用的比較多

隱馬爾可夫模型（HMM）是對語音信號的時間序列結構建立統計模型，可將之看作一個數學上的雙重隨機過程：一個是用具有有限狀態數的Markov鏈來模擬語音信號統計特性變化的隱含的隨機過程，另一個是與Markov鏈的每一個狀態相關聯的觀測序列的隨機過程。前者通過後者表現出來，但前者的具體參數是不可測的。人的言語過程實際上就是一個雙重隨機過程，語音信號本身是一個可觀測的時變序列，是由大腦根據語法知識和言語需要(不可觀測的狀態) 發出的音素的參數流。可見HMM合理地模仿了這一過程，很好地描述了語音信號的整體非平穩性和局部平穩性,是較為理想的一種語音模型。從整段語音來看，人類語音是一個非平穩的隨機過程，但是若把整段語音分割成若干短時語音信號，則可認為這些短時語音信號是平穩過程，我們就可以用線性手段對這些短時語音信號進行分析。若對這些語音信號建立隱馬爾可夫模型，則可以辯識具有不同參數的短時平穩的信號段，並可以跟蹤它們之間的轉化，從而解決了對語音的發音速率及聲學變化建立模型的問題。

具體的東西在這里也解釋不清的,你還是找書看吧
要搞清這個你要先去看一下"馬爾科夫鏈"的相關概念,再來這個隱馬爾科夫模型

『伍』什麼是mcmc演算法

1.MCMC方法主要是為了解決有些baysian推斷中參數期望E(f(v)|D)不能直接計算得到的問題的。
其中v是要估計的參數，D是數據觀察值
2. Markov chain monte carlo概念包含了兩部分：markov chain 和monte carlo integration。
2.1. 首先是monte carlo integration： monte carlo integration是利用采樣的方法解決參數期望不能直接計算解決的問題的：即根據v的後驗概率密度函數對v進行n次隨機采樣，計算n個f(v)，然後將這n個值求平均。根據大數定理當n足夠大並且采樣服從獨立原則的時候，該值趨向於期望的真實值。但是當v的後驗概率函數很難得到的時候該方法並不適用。
2.2 而在此基礎上產生的 Markov chain monte carlo，雖然也是通過采樣的方法進行的，卻將馬爾科夫鏈的概念引進來。它的想法是這樣的：如果某條馬爾科夫鏈具有irrecible 和aperiodic的特性的時候，該馬爾科夫鏈具有一個唯一的靜態點，即Pt=Pt-1;因此當馬爾科夫鏈足夠長後（設為N），產生的值會收斂到一個恆定的值（m）。這樣對f（v）產生馬爾科夫鏈，在N次之後f（v）的值收斂於恆定的值m，一般假設n>N後，f(v)服從N(m,scale)的正態分布。
即當n足夠大的時候，用馬爾科夫鏈產生的f(v)相當於在N(m,scale)獨立抽樣產生的值。
3. 如何產生具有這樣特性的馬爾科夫鏈：主要的方法是M-H演算法
M-H演算法有兩部分組成：1. 根據條件概率密度函數，抽樣得到下一個時間點的參數值Vt+1；2計算產生的這個值的接受概率a。如果a有顯著性，就接受抽樣得到的值，否則下一時間點的值保持不變。
在1中引入了proposal distribution的概念。在參數取值連續的情況下，後一個時間點的值服從一個分布，而這個分布函數只和前一個時間點的值有關q（.|Vt）
a的計算這里不貼了，一般都一樣。重要的計算完a之後，如果決定接受采樣獲得的值還是保持原來值不變。在這個問題上，一般的處理方法是假設a服從0~1的均勻分布，每次采樣計算a後都從U(0,1)中隨機抽樣一個值a'，如果a>=a'則接受抽樣的值，否則保持原來的值不變。
根據q（.|Vt）的不同，M-H演算法又有不同的分類：
3.1 Metroplis algorithm:在這里假設q(Vt+1|Vt)=q(|Vt+1 - Vt|)因此a被化解。該方法叫做random walk metropolis。
3.2 independence sampler:在這個演算法里，假設q(Vt+1|Vt)=q(Vt+1)
對於多參數的情況，既可以同時產生多向量的馬爾科夫鏈，又可以對每個參數分別進行更新：即，如果有h個參數需要估計，那麼，在每次迭代的時候，分h次每次更新一個參數。
4. Gibbs抽樣，H-M演算法的一個變體

『陸』求助啊，誰能告訴我馬爾科夫性質到底是什麼最好講的詳細一點，謝謝，太感謝了！

解答：根據網路給出的參考資料！
大致如下：

馬爾可夫鏈，因安德烈•馬爾可夫（A.A.Markov，1856－1922）得名，是數學中具有馬爾可夫性質的離散時間隨機過程。該過程中，在給定當前知識或信息的情況下，過去（即當期以前的歷史狀態）對於預測將來（即當期以後的未來狀態）是無關的。
原理簡介
馬爾可夫鏈是隨機變數X_1,X_2,X_3...的一個數列。這些變數的范圍，即他們所有可能取值的集合，被稱為「狀態空間」，而X_n的值則是在時間n的狀態。如果X_{n+1}對於過去狀態的條件概率分布僅是X_n的一個函數，則 P(X_{n+1}=x|X_0, X_1, X_2, \ldots, X_n) = P(X_{n+1}=x|X_n). 這里x為過程中的某個狀態。上面這個恆等式可以被看作是馬爾可夫性質。
編輯本段理論發展
馬爾可夫在1906年首先做出了這類過程。而將此一般化到可數無限狀態空間是由柯爾莫果洛夫在1936年給出的。馬爾可夫鏈與布朗運動以及遍歷假說這兩個二十世紀初期物理學重要課題是相聯系的，但馬爾可夫尋求的似乎不僅於數學動機，名義上是對於縱屬事件大數法則的擴張。物理馬爾可夫鏈通常用來建模排隊理論和統計學中的建模，還可作為信號模型用於熵編碼技術，如算術編碼（著名的LZMA數據壓縮演算法就使用了馬爾可夫鏈與類似於算術編碼的區間編碼）。馬爾可夫鏈也有眾多的生物學應用，特別是人口過程，可以幫助模擬生物人口過程的建模。隱蔽馬爾可夫模型還被用於生物信息學，用以編碼區域或基因預測。馬爾可夫鏈最近的應用是在地理統計學（geostatistics）中。其中，馬爾可夫鏈用在基於觀察數據的二到三維離散變數的隨機模擬。這一應用類似於「克里金」地理統計學（Kriging geostatistics），被稱為是「馬爾可夫鏈地理統計學」。這一馬爾可夫鏈地理統計學方法仍在發展過程中。
編輯本段馬爾可夫過程
馬爾可夫過程，能為給定樣品文本，生成粗略，但看似真實的文本：他們被用於眾多供消遣的「模仿生成器」軟體。馬爾可夫鏈還被用於譜曲。它們是後面進行推導必不可少的條件:(1)尺度間具有馬爾可夫性質.隨機場從上到下形成了馬爾可夫鏈,即 Xi 的分布只依賴於 Xi,與其他更粗糙的尺度無關,這是因為 Xi 已經包含了所有位於其上層的尺度所含有的信息.(2) 隨機場像素的條件獨立性.若 Xi 中像素的父節點已知,則 Xi 中的像素彼此獨立.這一性質使我們不必再考慮平面網格中相鄰像素間的關系,而轉為研究尺度間相鄰像素(即父子節點)間的關系.(3) 設在給定 Xn 的情況下,Y 中的像素彼此獨立.(4) 可分離性.若給定任一節點 xs,則以其各子節點為根的子樹所對應的變數相互獨立. 從只有一個節點的根到和圖像大小一致的葉子節點,建立了完整的四叉樹模型,各層間的馬爾可夫鏈的因果關系使我們可以由非迭代的推導過程快速計算出 X 的最大後驗概率或後驗邊緣概率.
編輯本段模型
完整的四叉樹模型也存在一些問題.(1) 因概率值過小,計算機的精度難以保障而出現下溢,若層次多,這一問題更為突出.雖然可以通過取對數的方法將接近於 0 的小值轉換成大的負值,但若層次過多、概率值過小,該方法也難以奏效,且為了這些轉換所採用的技巧又增加了不少計算量.(2) 當圖像較大而導致層次較多時,逐層的計算甚為繁瑣下溢現象肯定會出現 , 存儲中間變量也會占用大量空間 , 在時間空間上都有更多的開銷 . (3) 分層模型存在塊效應,即區域邊界可能出現跳躍,因為在該模型中,同一層隨機場中相鄰的像素不一定有同一個父節點,同一層的相鄰像素間又沒有交互,從而可能出現邊界不連續的現象.
編輯本段MRF 模型
為了解決這些問題,我們提出一種新的分層 MRF 模型——半樹模型,其結構和圖1 5類似,仍然是四叉樹, 只是層數比完整的四叉樹大大減少,相當於將完整的四叉樹截為兩部分,只取下面的這部分.模型最下層仍和圖像大小一致,但最上層則不止一個節點.完整的四叉樹模型所具有的性質完全適用於半樹模型,不同點僅在於最上層,完整的樹模型從上到下構成了完整的因果依賴性,而半樹模型的層間因果關系被截斷,該層節點的父節點及祖先均被刪去,因此該層中的各節點不具有條件獨立性,即不滿足上述的性質 2,因而對這一層轉為考慮層內相鄰節點間的關系.半樹模型和完整的樹模型相比,層次減少了許多,這樣,層次間的信息傳遞快了,概率值也不會因為過多層次的逐層計算而小到出現下溢.但第 0 層帶來了新的問題,我們必須得考慮節點間的交互,才能得出正確的推導結果,也正是因為在第 0 層考慮了相鄰節點間的影響,使得該模型的塊現象要好於完整的樹模型.對於層次數的選取,我們認為不宜多,太多則達不到簡化模型的目的,其優勢體現不出來,但也不能太少,因為第 0 層的概率計算仍然要採用非迭代的演算法,層數少表明第 0 層的節點數仍較多,計算費時,所以在實驗中將層數取為完整層次數的一半或一半稍少.
編輯本段MPM 演算法
3半樹模型的 MPM 演算法圖像分割即已知觀測圖像 y,估計 X 的配置,採用貝葉斯估計器,可由一個優化問題來表示: ?x = arg min [E C ( x, x )′ | Y = y] ,x其中代價函數 C 給出了真實配置為 x 而實際分割結果為 x′時的代價.在已知 y 的情況下,最小化這一代價的期望,從而得到最佳的分割.代價函數取法不同得到了不同的估計器,若 C(x,x′)=1?δ(x,x′)(當 x=x′時δ(x,x′)=1,否則 δ(x,x′)=0)得到的是 MAP 估計器,它意味著 x 和 x′只要在一個像素處有不同,則代價為 1,對誤分類的懲罰比較重,汪西莉等:一種分層馬爾可夫圖像模型及其推導演算法而在實際中存在一些誤分類是完全允許的.若將半樹模型的 MPM 演算法記為 HT-MPM,它分為向上演算法和向下演算法兩步,向上演算法自下而上根據式(2)、式 (3)逐層計算P(yd(s)|xs)和 P(xs,xρ(s)|yd(s)), 對最下層 P(yd(s)|xs)=P(ys|xs). 向下演算法自上而下根據式 (1)逐層計算 P(xs|y),對最上層由 P(x0|y)采樣 x0(1),…,x0(n),
編輯本段詳細說明
馬爾可夫鏈，因安德烈·馬爾可夫（A.A.Markov，1856－1922）得名，是數學中具有馬爾可夫性質的離散時間隨機過程。該過程中，在給定當前知識或信息的情況下，過去（即當期以前的歷史狀態）對於預測將來（即當期以後的未來狀態）是無關的。時間和狀態都是離散的馬爾可夫過程稱為馬爾可夫鏈, 簡記為Xn = X(n),n = 1,2,3,4····。馬爾可夫鏈是隨機變數的一個數列。這些變數的范圍，即他們所有可能取值的集合，被稱為「狀態空間」，而Xn的值則是在時間n的狀態。如果Xn + 1對於過去狀態的條件概率分布僅是Xn的一個函數，則這里x為過程中的某個狀態。上面這個恆等式可以被看作是馬爾可夫性質。馬爾可夫在1906年首先做出了這類過程。而將此一般化到可數無限狀態空間是由柯爾莫果洛夫在1936年給出的。馬爾可夫鏈與布朗運動以及遍歷假說這兩個二十世紀初期物理學重要課題是相聯系的，但馬爾可夫尋求的似乎不僅於數學動機，名義上是對於縱屬事件大數法則的擴張。馬爾可夫鏈是滿足下面兩個假設的一種隨機過程： 1、t+l時刻系統狀態的概率分布只與t時刻的狀態有關，與t時刻以前的狀態無關； 2、從t時刻到t+l時刻的狀態轉移與t的值無關。一個馬爾可夫鏈模型可表示為=(S，P，Q)，其中各元的含義如下： 1）S是系統所有可能的狀態所組成的非空的狀態集，有時也稱之為系統的狀態空間，它可以是有限的、可列的集合或任意非空集。本文中假定S是可數集(即有限或可列)。用小寫字母i,j(或Si,Sj)等來表示狀態。 2）是系統的狀態轉移概率矩陣，其中Pij表示系統在時刻t處於狀態i，在下一時刻t+l處於狀態i的概率，N是系統所有可能的狀態的個數。對於任意i∈s，有。 3）是系統的初始概率分布，qi是系統在初始時刻處於狀態i的概率，滿足。
編輯本段基本性質
馬爾可夫鏈模型的性質馬爾可夫鏈是由一個條件分布來表示的 P(Xn + 1 | Xn) 這被稱為是隨機過程中的「轉移概率」。這有時也被稱作是「一步轉移概率」。二、三，以及更多步的轉移概率可以導自一步轉移概率和馬爾可夫性質：同樣：這些式子可以通過乘以轉移概率並求k−1次積分來一般化到任意的將來時間n+k。邊際分布P(Xn)是在時間為n時的狀態的分布。初始分布為P(X0)。該過程的變化可以用以下的一個時間步幅來描述：這是Frobenius-Perron equation的一個版本。這時可能存在一個或多個狀態分布π滿足：其中Y只是為了便於對變數積分的一個名義。這樣的分布π被稱作是「平穩分布」（Stationary Distribution）或者「穩態分布」（Steady-state Distribution）。一個平穩分布是一個對應於特徵根為1的條件分布函數的特徵方程。平穩分布是否存在，以及如果存在是否唯一，這是由過程的特定性質決定的。「不可約」是指每一個狀態都可來自任意的其它狀態。當存在至少一個狀態經過一個固定的時間段後連續返回，則這個過程被稱為是「周期的」。
編輯本段離散狀態
離散狀態空間中的馬爾可夫鏈模型如果狀態空間是有限的，則轉移概率分布可以表示為一個具有(i,j)元素的矩陣，稱之為「轉移矩陣」： Pij = P(Xn + 1 = i | Xn = j) 對於一個離散狀態空間，k步轉移概率的積分即為求和，可以對轉移矩陣求k次冪來求得。就是說，如果是一步轉移矩陣，就是k步轉移後的轉移矩陣。平穩分布是一個滿足以下方程的向量：在此情況下，穩態分布π * 是一個對應於特徵根為1的、該轉移矩陣的特徵向量。如果轉移矩陣不可約，並且是非周期的，則收斂到一個每一列都是不同的平穩分布π * ，並且，獨立於初始分布π。這是由Perron-Frobenius theorem所指出的。正的轉移矩陣（即矩陣的每一個元素都是正的）是不可約和非周期的。矩陣被稱為是一個隨機矩陣，當且僅當這是某個馬爾可夫鏈中轉移概率的矩陣。注意：在上面的定式化中，元素(i,j)是由j轉移到i的概率。有時候一個由元素(i,j)給出的等價的定式化等於由i轉移到j的概率。在此情況下，轉移矩陣僅是這里所給出的轉移矩陣的轉置。另外，一個系統的平穩分布是由該轉移矩陣的左特徵向量給出的，而不是右特徵向量。轉移概率獨立於過去的特殊況為熟知的Bernoulli scheme。僅有兩個可能狀態的Bernoulli scheme被熟知為貝努利過程
編輯本段現實應用
馬爾可夫鏈模型的應用
科學中的應用
馬爾可夫鏈通常用來建模排隊理論和統計學中的建模，還可作為信號模型用於熵編碼技術，如演算法編碼。馬爾可夫鏈也有眾多的生物學應用，特別是人口過程，可以幫助模擬生物人口過程的建模。隱蔽馬爾可夫模型還被用於生物信息學，用以編碼區域或基因預測。馬爾可夫鏈最近的應用是在地理統計學（geostatistics）中。其中，馬爾可夫鏈用在基於觀察數據的二到三維離散變數的隨機模擬。這一應用類似於「克里金」地理統計學（Kriging geostatistics），被稱為是「馬爾可夫鏈地理統計學」。這一馬爾可夫鏈地理統計學方法仍在發展過程中。
人力資源中的應用
馬爾可夫鏈模型主要是分析一個人在某一階段內由一個職位調到另一個職位的可能性，即調動的概率。該模型的一個基本假設就是，過去的內部人事變動的模式和概率與未來的趨勢大體相一致。實際上，這種方法是要分析企業內部人力資源的流動趨勢和概率，如升遷、轉職、調配或離職等方面的情況，以便為內部的人力資源的調配提供依據。它的基本思想是：通過發現過去組織人事變動的規律，以推測組織在未來人員的供給情況。馬爾可夫鏈模型通常是分幾個時期收集數據，然後再得出平均值，用這些數據代表每一種職位中人員變動的頻率，就可以推測出人員變動情況。具體做法是：將計劃初期每一種工作的人數量與每一種工作的人員變動概率相乘，然後縱向相加，即得到組織內部未來勞動力的凈供給量。其基本表達式為： Ni(t)：t時間內I類人員數量； Pji：人員從j類向I類轉移的轉移率； Vi(t)：在時間（t-1,t）I類所補充的人員數。企業人員的變動有調出、調入、平調、晉升與降級五種。表3 假設一家零售公司在1999至2000年間各類人員的變動情況。年初商店經理有12人，在當年期間平均90%的商店經理仍在商店內，10%的商店經理離職，期初36位經理助理有 11%晉升到經理，83%留在原來的職務，6%離職；如果人員的變動頻率是相對穩定的，那麼在2000年留在經理職位上有11人（12×90%），另外，經理助理中有4人（36×83%）晉升到經理職位，最後經理的總數是15人（11+4）。可以根據這一矩陣得到其他人員的供給情況，也可以計算出其後各個時期的預測結果。

參考資料來自網路！

『柒』目標跟蹤檢測演算法（四）——多目標擴展

姓名：劉帆；學號：20021210609；學院：電子工程學院

https://blog.csdn.net/qq_34919792/article/details/89893665

【嵌牛導讀】基於深度學習的演算法在圖像和視頻識別任務中取得了廣泛的應用和突破性的進展。從圖像分類問題到行人重識別問題，深度學習方法相比傳統方法表現出極大的優勢。與行人重識別問題緊密相關的是行人的多目標跟蹤問題。

【嵌牛鼻子】深度多目標跟蹤演算法

【嵌牛提問】深度多目標跟蹤演算法有哪些？

【嵌牛正文】

第一階段（概率統計最大化的追蹤）

1）多假設多目標追蹤演算法（MHT，基於kalman在多目標上的拓展）

多假設跟蹤演算法(MHT)是非常經典的多目標跟蹤演算法，由Reid在對雷達信號的自動跟蹤研究中提出，本質上是基於Kalman濾波跟蹤演算法在多目標跟蹤問題中的擴展。

卡爾曼濾波實際上是一種貝葉斯推理的應用，通過歷史關聯的預測量和k時刻的預測量來計算後驗概率：

關聯假設的後驗分布是歷史累計概率密度的連乘，轉化為對數形式，可以看出總體後驗概率的對數是每一步觀察似然和關聯假設似然的求和。但是若同時出現多個軌跡的時候，則需要考慮可能存在的多個假設關聯。

左圖為k-3時刻三個檢測觀察和兩條軌跡的可能匹配。對於這種匹配關系，可以繼續向前預測兩幀，如圖右。得到一種三層的假設樹結構，對於假設樹根枝乾的剪枝，得到k-3時刻的最終關聯結果。隨著可能性增加，假設組合會爆炸性增多，為此，只為了保留最大關聯性，我們需要對其他的節點進行裁剪。下式為選擇方程

實際上MHT不會單獨使用，一般作為單目標追蹤的擴展添加。

2）基於檢測可信度的粒子濾波演算法

這個演算法分為兩個步驟：

1、對每一幀的檢測結果，利用貪心匹配演算法與已有的對象軌跡進行關聯。

其中tr表示一個軌跡，d是某一個檢測，他們的匹配親和度計算包含三個部分：在線更新的分類學習模型(d)，用來判斷檢測結果是不是屬於軌跡tr; 軌跡的每個粒子與檢測的匹配度，採用中心距離的高斯密度函數求和(d-p)表示；與檢測尺寸大小相關的閾值函數g(tr,d)，表示檢測與軌跡尺度的符合程度, 而α是預設的一個超參數。

計算出匹配親和度矩陣之後，可以採用二部圖匹配的Hungarian演算法計算匹配結果。不過作者採用了近似的貪心匹配演算法，即首先找到親和度最大的那個匹配，然後刪除這個親和度，尋找下一個匹配，依次類推。貪心匹配演算法復雜度是線性，大部分情況下，也能得到最優匹配結果。

2、利用關聯結果，計算每個對象的粒子群權重，作為粒子濾波框架中的觀察似然概率。

其中tr表示需要跟蹤的對象軌跡，p是某個粒子。指示函數I(tr)表示第一步關聯中，軌跡tr是不是關聯到某個檢測結果，當存在關聯時，計算與關聯的檢測d 的高斯密度P{n}(p-d )；C{tr}§是對這個粒子的分類概率；§是粒子通過檢測演算法得到的檢測可信度，(tr)是一個加權函數，計算如下：

3）基於馬爾科夫決策的多目標跟蹤演算法

作者把目標跟蹤看作為狀態轉移的過程，轉移的過程用馬爾科夫決策過程(MDP)建模。一個馬爾科夫決策過程包括下面四個元素：(S, A, T(.),R(.))。其中S表示狀態集合，A表示動作集合，T表示狀態轉移集合，R表示獎勵函數集合。一個決策是指根據狀態s確定動作a, 即 π: SA。一個對象的跟蹤過程包括如下決策過程：

從Active狀態轉移到Tracked或者Inactive狀態：即判斷新出現的對象是否是真。

從Tracked狀態轉移到Tracked或者Lost狀態：即判斷對象是否是持續跟蹤或者暫時處於丟失狀態。

從Lost狀態轉移到Lost或者Tracked或者Inactive狀態：即判斷丟失對象是否重新被跟蹤，被終止，或者繼續處於丟失狀態。

作者設計了三個獎勵函數來描述上述決策過程：

第一個是：

即判斷新出現的對象是否為真，y(a)=1時表示轉移到跟蹤狀態，反之轉移到終止狀態。這是一個二分類問題，採用2類SVM模型學習得到。這里用了5維特徵向量：包括x-y坐標、寬、高和檢測的分數。

第二個是：

這個函數用來判斷跟蹤對象下一時刻狀態是否是出於繼續跟蹤，還是處於丟失，即跟蹤失敗。這里作者用了5個歷史模板，每個模板和當前圖像塊做光流匹配，emedFB表示光流中心偏差，表示平均重合率。和是閾值。

第三個是：

這個函數用來判斷丟失對象是否重新跟蹤，或者終止，或者保持丟失狀態不變。這里當丟失狀態連續保持超過 (=50)時，則轉向終止，其他情況下通過計算M個檢測匹配，來判斷是否存在最優的匹配使上式(3-14)獎勵最大，並大於0。這里涉及兩個問題如何設計特徵以及如何學習參數。這里作者構造了12維與模板匹配相關的統計值。而參數的學習採用強化學習過程，主要思想是在犯錯時候更新二類分類器值。

第二階段深度學習應用

1）基於對稱網路的多目標跟蹤演算法

關於Siamese網路在單目標跟蹤深度學習中有了介紹，在這里不再介紹，可以向前參考。

2）基於最小多割圖模型的多目標跟蹤演算法

上述演算法中為了匹配兩個檢測採用LUV圖像格式以及光流圖像。Tang等人在文獻中發現採用深度學習計算的類光流特徵(DeepMatching)，結合表示能力更強的模型也可以得到效果很好的多目標跟蹤結果。

基於DeepMatching特徵，可以構造下列5維特徵：

其中MI,MU表示檢測矩形框中匹配的點的交集大小以及並集大小，ξv和ξw表示檢測信任度。利用這5維特徵可以學習一個邏輯回歸分類器。

同樣，為了計算邊的匹配代價，需要設計匹配特徵。這里，作者採用結合姿態對齊的疊加Siamese網路計算匹配相似度，如圖9，採用的網路模型StackNetPose具有最好的重識別性能。

綜合StackNetPose網路匹配信任度、深度光流特徵(deepMatching)和時空相關度，作者設計了新的匹配特徵向量。類似於[2], 計算邏輯回歸匹配概率。最終的跟蹤結果取得了非常突出的進步。在MOT2016測試數據上的結果如下表：

3）通過時空域關注模型學習多目標跟蹤演算法

除了採用解決目標重識別問題的深度網路架構學習檢測匹配特徵，還可以根據多目標跟蹤場景的特點，設計合適的深度網路模型來學習檢測匹配特徵。Chu等人對行人多目標跟蹤問題中跟蹤演算法發生漂移進行統計分析，發現不同行人發生交互時，互相遮擋是跟蹤演算法產生漂移的重要原因[4]。如圖10。

在這里插入圖片描述

針對這個問題，文獻[4]提出了基於空間時間關注模型(STAM)用於學習遮擋情況，並判別可能出現的干擾目標。如圖11，空間關注模型用於生成遮擋發生時的特徵權重，當候選檢測特徵加權之後，通過分類器進行選擇得到估計的目標跟蹤結果，時間關注模型加權歷史樣本和當前樣本，從而得到加權的損失函數，用於在線更新目標模型。

該過程分三步，第一步是學習特徵可見圖：

第二步是根據特徵可見圖，計算空間關注圖(Spatial Attention):

其中fatt是一個局部連接的卷積和打分操作。wtji是學習到的參數。

第三步根據空間注意圖加權原特徵圖：

對生成的加權特徵圖進行卷積和全連接網路操作，生成二元分類器判別是否是目標自身。最後用得到分類打分選擇最優的跟蹤結果。

4）基於循環網路判別融合表觀運動交互的多目標跟蹤演算法

上面介紹的演算法採用的深度網路模型都是基於卷積網路結構，由於目標跟蹤是通過歷史軌跡信息來判斷新的目標狀態，因此，設計能夠記憶歷史信息並根據歷史信息來學習匹配相似性度量的網路結構來增強多目標跟蹤的性能也是比較可行的演算法框架。

考慮從三個方面特徵計算軌跡歷史信息與檢測的匹配：表觀特徵，運動特徵，以及交互模式特徵。這三個方面的特徵融合以分層方式計算。

在底層的特徵匹配計算中，三個特徵都採用了長短期記憶模型(LSTM)。對於表觀特徵，首先採用VGG-16卷積網路生成500維的特徵ϕtA，以這個特徵作為LSTM的輸入計算循環。

對於運動特徵，取相對位移vit為基本輸入特徵，直接輸入LSTM模型計算沒時刻的輸出ϕi，對於下一時刻的檢測同樣計算相對位移vjt+1,通過全連接網路計算特徵ϕj，類似於表觀特徵計算500維特徵ϕm，並利用二元匹配分類器進行網路的預訓練。

對於交互特徵，取以目標中心位置周圍矩形領域內其他目標所佔的相對位置映射圖作為LSTM模型的輸入特徵，計算輸出特徵ϕi，對於t+1時刻的檢測計算類似的相對位置映射圖為特徵，通過全連接網路計算特徵ϕj，類似於運動模型，通過全連接網路計算500維特徵ϕI，進行同樣的分類訓練。

當三個特徵ϕA，ϕM，ϕI都計算之後拼接為完整的特徵，輸入到上層的LSTM網路，對輸出的向量進行全連接計算，然後用於匹配分類，匹配正確為1，否則為0。對於最後的網路結構，還需要進行微調，以優化整體網路性能。最後的分類打分看作為相似度用於檢測與軌跡目標的匹配計算。最終的跟蹤框架採用在線的檢測與軌跡匹配方法進行計算。

5）基於雙線性長短期循環網路模型的多目標跟蹤演算法

在對LSTM中各個門函數的設計進行分析之後，Kim等人認為僅僅用基本的LSTM模型對於表觀特徵並不是最佳的方案，在文獻[10]中，Kim等人設計了基於雙線性LSTM的表觀特徵學習網路模型。

除了利用傳統的LSTM進行匹配學習，或者類似[5]中的演算法，拼接LSTM輸出與輸入特徵，作者設計了基於乘法的雙線性LSTM模型，利用LSTM的隱含層特徵(記憶)信息與輸入的乘積作為特徵，進行匹配分類器的學習。

這里對於隱含層特徵ht-1,必須先進行重新排列(reshape)操作，然後才能乘以輸入的特徵向量xt。

其中f表示非線性激活函數，mt是新的特徵輸入。而原始的檢測圖像採用ResNet50提取2048維的特徵，並通過全連接降為256維。下表中對於不同網路結構、網路特徵維度、以及不同LSTM歷史長度時，表觀特徵的學習對跟蹤性能的影響做了驗證。

可以看出採用雙線性LSTM(bilinear LSTM)的表觀特徵性能最好，此時的歷史相關長度最佳為40，這個值遠遠超過文獻[5]中的2-4幀歷史長度。相對來說40幀歷史信息影響更接近人類的直覺。

『捌』歌略RiskCloud有給詳細說下嗎

歌略RiskCloud是一款由上海歌略軟體科技有限公司（下稱「歌略」）獨立自主研發的風險分析軟體（國家專利：CN201710121334一種自定義風險分析方法）。據曾經任職於世界著名運營風險管理領域領導者Dyadem（現已被Sphera公司收購）公司、在安全、質量領域擁有40年從業經驗的資深顧問Paul
Mainprize先生稱，據他所知，歌略RiskCloud是迄今為止世界上唯一一款做到以Hierarchical Data Modeling
(HDM)
為內核，基於網路版可自定義風險分析模型的風險分析軟體，同時也是迄今為止世界上唯一一款做到基於自定義分析方法的引擎，集智能HAZOP分析與LOPA定級和基於Markov演算法的SIL驗算為一體的風險分析軟體。

歌略RiskCloud能夠讓客戶根據自身實際需求定義符合自身特點的風險分析方法，如HAZOP分析、LOPA定級、SIL驗算、FMEA分析、HAZID分析、JSA分析、What-IF等多種風險分析模型，創建自身專屬的一站式整體風險管理工具。更加難能可貴的是，歌略RiskCloud實現了一項前人從未實現的技術，即其做到了一個接近於Web版Excel的專業工具，操作方式與Web版Excel非常相似，易於掌握且使用便利。與Web版Excel不同的是，歌略RiskCloud能夠提前預設好數據列之間的邏輯關系，然後根據預設的數據之間的邏輯關系自動生成帶有嚴謹邏輯關系的表格，單元格也會根據數據的邏輯關系進行自動的合並(歌略RiskCloud的HDM核心技術)。

模板靈活配置

HAZOP分析工作表

HAZOP報告導出

HAZOP分析LOPA定級SIL驗算數據集成

SIL安全功能貢獻率統計

SIL驗算PFD曲線統計

SIL驗算統計

基於網路版自定義風險分析模型技術是歌略RiskCloud最為核心的技術及最大的亮點。這項技術可以使身處不同行業且具有不同習慣的客戶根據自身實際需求靈活地配置符合自身特點的分析模板。據Paul
Mainprize先生稱，目前世界上其他全部風險分析軟體均無法實現這項技術，但是，歌略RiskCloud真的做到了。

歌略RiskCloud也是目前國內唯一一款真正邁出國門，走向世界的風險分析軟體。歌略已與其合作夥伴在北美設立專門的營銷中心（Sharrix），全面負責歌略RiskCloud在北美及加拿大市場的銷售及推廣，為歌略RiskCloud進軍海外市場邁出了扎實的第一步。通過全球數百名客戶的應用與實踐，歌略RiskCloud在專業化、國際化的道路上得以不斷前行。

軟體功能

邏輯嚴謹的研究工作表
快速復制數據
基於知識庫的數據提示
圖紙上傳及預覽
離線研究編輯
研究數據備份
數據統計和匯總
基於過去的研究創建研究
在線研究導入
建議措施自動提取
圖形視圖查看
快捷鍵支持
研究樹形結構導航
桌面研究快捷訪問
智能提示數據源設置
預置豐富行業研究庫
繁體和英文語言支持
支持HAZOli方法(危害與可操作性分析)
支持FMEA方法(失效模式和後果分析)
支持JHA方法(作業危害分析)
支持BBS方法(行為模式安全分析)
支持lirHA(初始危害分析)分析方法
支持Checklist方法(檢查表分析)
支持LOPA方法(保護層分析)
支持What IF方法(故障假設分析)
支持SVA方法(安全脆弱性分析)
支持HACCP方法(危害分析和關鍵控制點分析)
支持SIL方法(安全完整等級驗證)
專業報告(Word、Excel)導出
風險矩陣定製
研究分析方法的定製
研究分析方法重用
知識管理的數據映射

『玖』一文讀懂MCMC演算法（馬爾科夫鏈蒙特卡洛）

理解本文需要一些貝葉斯基礎，小白可移步 https://www.jianshu.com/p/c942f8783b97

為了理解MCMC，我們依然是從一個具體的事例出發：假設當我們來到了一個小人國，我們感興趣的是小人國的國民的 身高分布情況 ，即有多少人高1米，有多少人高0.5米，又有多少人像我們正常人一樣高。一種解決這個問題的暴力方法是找遍這個小人國的所有人，然後都測量身高，但顯然，這是一個愚公移山式的方法，在很多情況下都是不可能的。

所以，由於精力有限，我們只找到了10個小人國的人民，這十個人的高度分別是:
1.14，1.02，1.08，0.96，0.79，0.94，1.00，0.93，1.13，1.02

聰明的我們的直覺是，這大概符合一個正態分布，然後我們碰到了一個開掛了的長老，他說：「沒錯，就是正態分布，而且標准差sd=0.1，現在讓我看看你們這些愚蠢的人類能不能知道這個正態分布的平均值μ是多少！」。

一對分別名為馬爾科夫和蒙特卡洛的名偵探組合就此登場，他們說：「首先，我們先隨便猜一個平均值μ，比如μ(1) = 0.8好了。」

*我這里用μ(n)表示第n個提出的μ值，所以μ(1)是提出的第一個μ值，μ(2)是第二個提出的μ值。

接著他們要做的事，是要確定另一個值μ(2)，通常我們要謹慎一點去選擇一個和之前提出來的值μ(1)差別不大的值，比如μ(2) = 0.7。

接著的問題就是，我們需要判斷：究竟是μ(1) 更符合實際情況，還是μ(2) 更符合實際情況呢？但要如何作出這個判斷呢，這里就要用到前面的貝葉斯公式了。

判斷哪個值更好，實際上是在問，基於目前觀察到的數據，得到這個參數μ的可能性哪個更大？ 即：
已知D = {1.14，1.02，1.08，0.96，0.79，0.94，1.00，0.93，1.13，1.02}
p(μ(2)|D) 大於還是小於還是等於 p(μ(1)|D) ？

這不就是在問誰的後驗概率更大嘛？

為了解決這件事，一種思路是我們要把p(μ(2)|D) 和 p(μ(1)|D) 都用前面的貝葉斯公式解出來。但你很快就會發現在這種情況下證據概率p(D)會很難算。

但如果我們轉念一想，我們要做的是比較p(μ(2)|D) 和p(μ(1)|D) ，那麼 我們其實只要求p(μ(2)|D) / p(μ(1)|D) 就可以了，如果這個比值大於1，則說明μ2的後驗概率更大，更符合實際情況 。

可以看到，由於分子和分母上的P(D)被相互抵消了，剩下來需要知道的值就只剩下μ(1)和μ(2)的 先驗概率 ，以及分別在μ=μ(1)和μ=μ(2)時得到數據D的 似然概率 了。

現在，我們面臨的問題要比之前簡化了一些。但實際上我們還需要處理似然概率的計算和先驗概率的問題。

先說說似然概率p(D|μ(2)) 和p(D|μ(1))，此時的似然概率是完全可以算出來的。因為我們已經假設了數據D符合的是正態分布模型了，且已知sd=0.1（前面大師說的），所以當我們假設μ=μ(1)時，就確定了一個平均值為μ(1)和標准差為0.1的正態分布，也就確定了這個正態分布的概率密度函數f(x)，接著基於我們的數據D計算x = 1.14，1.02，1.08...等值的概率密度，再將這些值相乘，便得到了似然概率*。

** 可以這樣理解這一似然概率的計算：如果我們此時假定的正態分布與數據實際對應的正態分布越接近，就自然可能有越多的數據落在高概率密度函數的區域（即分布的平均值附近），如此，作為概率密度函數的連乘的似然概率自然也會更高。相比之下，如果你現在確定的正態分布的平均值為1500，標准差為1，那麼它在x = 1.14的概率密度（概率密度的具體數值不等於概率，但是兩者的數學意味是接近的）就會高度趨近於0，將這樣一個數作為因子去計算似然概率，似然概率也顯然將會比較低。

說完了似然概率，就輪到先驗概率p(μ(2))和p(μ(1))的問題了。先驗概率要怎麼去算呢？答案是不用算！我們自己來定。但是先驗概率毫無疑問對MCMC演算法是有影響的，就像我們之前從之前貝爺的故事裡看到的那樣，後驗概率是受到先驗概率影響的。之所以一枚90%擊中率的硬幣幾乎不能預測一個人是否得病，是因為得這種病本身的先驗概率就超級低。 一個你需要記住的簡單事實是，我們設定的先驗概率越是背離真實的情況，就需要越多的數據去將先驗概率修正，讓後驗概率符合實際的情況。 從這個意義上說，貝葉斯推理不是無中生有，而是要先對數據背後的結果有一個信念（belief）的基礎上，根據所見的數據，不斷地修正原本的信念，使之逐漸接近數據背後對應的真實情況。（貝葉斯公式本身就帶有學習、更新的意味，所以學界現在還有種說法是我們的大腦是貝葉斯式的）

當我們看到數據的時候，通過觀察數據，我們最開始會猜想μ=1的概率比較高，因此我們可以假定μ的先驗概率是服從平均值為1，sd為0.5的概率分布，有了這樣的先驗概率分布，我們就可以計算得到當μ=μ1，μ2時分別對應的概率密度了。

搞定了先驗概率和似然概率，就可以計算前面的公式p(μ(2))p(D|μ(2)) / p(μ(1))p(D|μ(1))了。當這個比值大於等於1時，我們就接受μ(2)，而如果這個比值小於1，我們就以這個比值為概率接受μ(2)。比如比值為0.5時，我們只有50%的概率接受μ(2)。當不接受的時候，我們得重新尋找一個μ(2)，再進行同樣的後驗概率比較。

反復進行這樣的步驟之後， 我們可以想像，我們自然會更大程度地訪問那些後驗概率更高的μ值。我們訪問不同的μ值的頻率分布，就是關於μ值的後驗概率分布（的近似）。 至於這背後具體的數學推導，我們就不談了。但注意，參數的近似後驗分布並不是我們想要擬合的模型「即最開始的問題：小人國的國民的 身高分布情況 」。還記得我們最開始假設小人國的身高分布情況符合正態分布，且我們已經得知這個正態分布的標准差sd=1，而MCMC最終會告訴我們根據現有的數據，我們推斷小人國身高分布的平均值μ，符合某個概率分布（比如平均值為1，sd為5），如果我們覺得合適，我們可以將μ的後驗分布的平均值作為μ的最可能值。即，「小人國的國民的 身高分布情況 最有可能符合μ=1，sd=1的概率分布」。

最後總結一下MCMC演算法：
（1）確定參數值的先驗分布。
（2）先確定第一個訪問（或者說采樣）的參數的數值，作為當前參數數值
（3）根據當前訪問的參數的數值，以一定的方式（比如 Metropolis sampler ）提出下一個待考慮訪問的參數的數值。
（4）以比值的形式，比較當前參數數值和待考慮訪問的參數數值的後驗概率，計算後驗概率涉及到先驗概率和後驗概率的概率密度。根據這個比值的大小，接受或拒絕該待考慮采樣的參數數值。接受後則將該參數數值視為當前參數數值。
（5）重復（3）和（4），直到符合某種終止條件（比如說訪問了10000個參數數值）

最終，將被采樣的參數數值的頻率分布作為對該參數的後驗概率分布的近似。

看完以後，你是不是想說這么復雜的事，是人乾的嗎！？

廢話，這種事當然是計算機來干啊，你還想手算不成？

『拾』數據挖掘十大經典演算法之EM

EM（Expectation-Maximum）演算法也稱期望最大化演算法，它是最常見的隱變數估計方法，在機器學習中有極為廣泛的用途，例如常被用來學習高斯混合模型（Gaussian mixture model，簡稱GMM）的參數；隱式馬爾科夫演算法（HMM）、LDA主題模型的變分推斷等等。

EM演算法是一種迭代優化策略，由於它的計算方法中每一次迭代都分兩步，其中一個為期望步（E步），另一個為極大步（M步），一輪輪迭代更新隱含數據和模型分布參數，直到收斂，即得到我們需要的模型參數。

1. EM演算法推導過程

補充知識：Jensen不等式：

如果f是凸函數，函數的期望大於等於期望的函數。當且僅當下式中X是常量時，該式取等號。（應用於凹函數時，不等號方向相反）

2. EM演算法流程

3. EM演算法的其他問題

上面介紹的傳統EM演算法對初始值敏感，聚類結果隨不同的初始值而波動較大。總的來說，EM演算法收斂的優劣很大程度上取決於其初始參數。

EM演算法可以保證收斂到一個穩定點，即EM演算法是一定收斂的。

EM演算法可以保證收斂到一個穩定點，但是卻不能保證收斂到全局的極大值點，因此它是局部最優的演算法，當然，如果我們的優化目標是凸的，則EM演算法可以保證收斂到全局最大值，這點和梯度下降法這樣的迭代演算法相同。

EM演算法的簡單實例： https://zhuanlan.hu.com/p/40991784

參考：

https://zhuanlan.hu.com/p/40991784

https://blog.csdn.net/u011067360/article/details/24368085

導航:首頁 > 源碼編譯 > 馬爾科夫定位演算法

馬爾科夫定位演算法

與馬爾科夫定位演算法相關的資料