導航:首頁 > 源碼編譯 > 蒙特卡洛樹的演算法

蒙特卡洛樹的演算法

發布時間:2025-04-15 03:09:04

『壹』 蒙特卡洛樹是什麼演算法

蒙特卡羅樹搜索(MCTS)會逐漸的建立一顆不對稱的樹。可以分為四步並反復迭代:

(1)選擇
從根節點,也就是要做決策的局面R出發向下選擇一個最急迫需要被拓展的節點T;局面R是第一個被檢查的節點,被檢查的節點如果存在一個沒有被評價過的招式m,那麼被檢查的節點在執行m後得到的新局面就是我們所需要展開的T;如果被檢查的局面所有可行的招式已經都被評價過了,那麼利用ucb公式得到一個擁有最大ucb值的可行招式,並且對這個招式產生的新局面再次進行檢查;如果被檢查的局面是一個游戲已經結束的游戲局面,那麼直接執行步驟4;通過反復的進行檢查,最終得到一個在樹的最底層的最後一次被檢查的局面c和它的一個沒有被評價過的招式m,執行步驟2。

(2)拓展
對於此時存在於內存中的局面c,添加一個它的子節點。這個子節點由局面c執行招式m而得到,也就是T。

(3)模擬
從局面T出發,雙方開始隨機的落子。最終得到一個結果(win/lost),以此更新T節點的勝利率。

(4)反向傳播
在T模擬結束之後,它的父節點c以及其所有的祖先節點依次更新勝利率。一個節點的勝利率為這個節點所有的子節點的平均勝利率。並從T開始,一直反向傳播到根節點R,因此路徑上所有的節點的勝利率都會被更新。

閱讀全文

與蒙特卡洛樹的演算法相關的資料

熱點內容
prim演算法c實現 瀏覽:636
python正則表達式匹配括弧內容 瀏覽:609
怎樣才能加密呢 瀏覽:48
mac的文件夾怎麼壓縮 瀏覽:236
解壓膠帶有毒嗎 瀏覽:561
如何把鬧鈴設置成自己喜歡的安卓 瀏覽:512
安卓手機怎麼加電量組件 瀏覽:423
ibm伺服器如何設置啟動不了機 瀏覽:148
二次結構構造柱加密區 瀏覽:242
php必須在什麼伺服器下運行 瀏覽:359
linux不啟動桌面 瀏覽:277
李洪成pdf 瀏覽:223
單片機驅動能力 瀏覽:800
安卓開機為什麼要激活 瀏覽:382
橡膠壓縮永久變形國標 瀏覽:847
dns伺服器地址是一樣的嗎 瀏覽:155
手游單機app什麼兔的軟體 瀏覽:393
蘋果耳機在安卓怎麼查看電量 瀏覽:146
手機usb連接到電腦哪個文件夾 瀏覽:811
有什麼免費聽的電台app 瀏覽:867