110 likes | 416 Views
TCGA2014 電腦 對局 研討會 暨 國科會 計畫 研究成果發表 適用於電腦遊戲之通用工作層級計算系統框架及其應用 -- 子計畫三:基於工作層級計算系統開發蒙地卡羅樹搜尋圍棋程式 顏士淨 、 周政緯、蘇粲程、林璟農、楊正文、陳威良、黃郁庭. 計畫名稱 : 適用於電腦遊戲之通用工作層級計算系統框架及其應用 -- 子計畫三:基於工作層級計算系統開發蒙地卡羅樹搜尋圍棋程式 計畫編號 : NSC 102-2221-E-259-011-MY2 執行單位:國立東華大學 計畫主持人 : 顏士淨 教授 研討會地點 : 國立 師範 大學
E N D
TCGA2014電腦對局研討會 暨 國科會計畫研究成果發表適用於電腦遊戲之通用工作層級計算系統框架及其應用--子計畫三:基於工作層級計算系統開發蒙地卡羅樹搜尋圍棋程式顏士淨、周政緯、蘇粲程、林璟農、楊正文、陳威良、黃郁庭 計畫名稱: 適用於電腦遊戲之通用工作層級計算系統框架及其應用--子計畫三:基於工作層級計算系統開發蒙地卡羅樹搜尋圍棋程式 計畫編號:NSC 102-2221-E-259-011-MY2 執行單位:國立東華大學 計畫主持人: 顏士淨 教授 研討會地點: 國立師範大學 研討會時間: 2014年6月27-28日
Outline • 前言 • 研究目的 • 研究方法 • 結果與自評
前言 • 前計畫運用志願型計算系統建構圍棋開局庫,開發了電腦圍棋開局庫,提升棋力 • 本計畫繼續改良此計算系統,並以通用工作層級計算系統框架來發展MCTS圍棋程式
研究目的 • 發展MCTS圍棋程式兩個部分 • 發展特徵強化演算法(Minorization-Maximization)加強搜尋策略 • 發展平衡模擬演算法(Simulation Balance)改進模擬策略 • 預計本計畫結束時,我們的十九路圍棋程式將有機會跟高段棋士一較高下
研究方法 相關研究 • 第一年主要研究方法是使用機器學習改善搜尋策略 • RemiCoulom提出了一個基於Elo rating system 的機器學習方法,一般稱為MM 演算法 (Minorization-Maximization) • 先找出所謂的「著手特徵」:位於棋盤的第幾線、距離上一手的位置、符合哪些棋型等等,每一個特徵有相對應的特徵值 • 每個合法著手均符合某些著手特徵,高段或職業棋士選擇的落子點就是勝利者,其他合法著手為失敗者,利用此方法不斷更新特徵值
研究方法 第一年進行步驟 • 研究特徵強化演算法 • 收集網路圍棋伺服器上的業餘高段棋譜,並對資料進行篩選 • 參酌業餘高段棋士意見,選擇要使用的特徵 • 2014/6王銘琬本因坊 • 實作特徵強化演算法,並將獲得的特徵值用於著手排名,以降低分支度 • 經由實驗結果,調整選用的特徵
研究方法 第一年進行步驟(續) • 運用行之有效的特徵,針對所收集的棋譜,統計各種特徵組合之出現率 • 利用工作層級運算系統,在其上運行改良後的特徵強化演算法 • 進行實驗,並調整特徵組合,以驗證演算法改良後的效果 • 整理實驗結果,發表論文,作為下一年度研究之基礎
結果與自評 預期完成之成果 • 兩年計畫結束時,十九路圍棋程式將有機會跟高段棋士一較高下 • 期刊論文與研討會論文發表 • 國際比賽成績
結果與自評(1) 第一年成果 • 與人類比較 • 2014/6與職業棋士測試 • 期刊論文 • 共3篇SCI論文,3篇研討會論文 • 比賽 • 參加2013ICGA國際奧林匹亞電腦對局競賽共獲得1金2銀,參加2013TAAI國際性的比賽,得到3金5銀2銅。其中圍棋部分分別得到一銀與一金
結果與自評(2) 期刊論文 • Shi-Jim Yen*, Cheng-Wei Chou, Jr-Chang Chen, I-Chen Wu, and Kuo-Yuan Kao, "Design and Implementation of Chinese Dark Chess Programs," IEEE Transactions on Computational Intelligence and AI in Games( IEEE TCIAIG), accepted. DOI 10.1109/TCIAIG.2014.2329034 • Sheng-Ta Hsieh*, Shih-Yuan Chiu and Shi-Jim Yen, "Adaptive Search Range and Multi-Mutation Strategies for Differential Evolution," Journal of Information Science and Engineering, Volume 30, No. 3, May, 2014, pp. 749-763. • Kuo-Yuan Kao, I-Chen Wu*, Shi-Jim Yen, and Yi-Chang Shan, "Incentive Learning in Monte Carlo Tree Search," IEEE Transactions on Computational Intelligence and AI in Games( IEEE TCIAIG), VOL. 5, NO. 4, December 2013, pp. 346-352.
結果與自評(3) 研討會論文 • Shi-Jim Yen, Cheng-Wei Chou, Jr-Chang Chen, I-Chen Wu, and Kuo-Yuan Kao, “The Art of the Chinese Dark Chess Program DIABLE,” International Computer Symposium, 2012, Hualien. • Yu-Jie Ho, Shun-Chin Hsu, Shi-Jim Yen, "An Efficient Index Structure for Go," The 27th Annual Conference of the Japanese Society for Artificial Intelligence, June 4-7, Toyoma, Japan, 2013. • Shi-Jim Yen, Chen-Shin Lee, Jr-Chang Chen, Tai-Ning Yang, Shun-Chin Hsu, "Suffix Tree Index Structure on Go Game Record," The 27th Annual Conference of the Japanese Society for Artificial Intelligence, June 4-7, Toyoma, Japan, 2013.