中文  |  EN
新聞動态
當前位置: 首頁 >> 青春土建 >> 新聞動态 >> 正文
土建學院“科研我當先”實踐團隊進行第十次會議
發布時間:2021年02月13日 16:35    作者:    點擊:[]

2月10日晚9時,ob欧宝体育在线登录“科研我當先”實踐團隊線上進行第九次内容分享。會議由曹博文同學主持,全體成員參加。

在本次線上交流中,曹博文關于圍棋AI中的AlphaGo整體算法進行了深入淺出的分享 。首先曹博文簡單講解了深度卷積神經網絡(DCNN)的核心思想。之後,他介紹了Deepmind團隊基于DCNN實現的四個“大腦”:SL.Policy Network(監督學習策略網絡)RL.Policy Network(強化學習策略網絡),Rollout(随機模拟走子),Vaue Network(價值網絡)。

接着,曹博文通過與傳統博弈遊戲樹搜索算法--極大極小搜索進行對比,點明了傳統算法解決圍棋問題的困難性,引出了AlphaGo整體算法的框架,也是算法核心--蒙特卡洛樹搜索。蒙特卡洛樹搜索的主要概念是搜索,即沿着博弈樹向下的一組遍曆過程。單次遍曆的路徑會從根節點(當前博弈狀态)延伸到沒有完全展開的節點,未完全展開的節點表示其子節點至少有一個未訪問到。遇到未完全展開的節點時,它的一個未訪問子節點将會作為單次模拟的根節點,随後模拟的結果将會反向傳播回當前樹的根節點并更新博弈樹的節點統計數據。一旦搜索受限于時間或計算力而終止,下一步行動将基于收集到的統計數據進行決策。他通過對蒙特卡洛樹算法原理的講解,帶着大家完整地體會了一遍AlphaGo算法的流程。

通過此次曹博文同學的分享,團隊成員對AlphaGo的算法實現原理有了大緻的了解,拓展了知識。本次會議分享持續了三十五分鐘,對于非本專業的學生是一次很好的學習機會

(文/曹博文 圖/毛潆晗)


上一條:土建學院“山木”社會實踐團隊中期調研成果展示 下一條:土建學院“相約山大,勵志啟航”山東省451分隊順利開展宣講活動

關閉

Copyright © 2018-2020    版權所有:ob欧宝体育在线登录-欧宝体育最新官网入口首页    [網站管理]

地址:山東省濟南市經十路17923号    郵編:250061    電話:0531-88392446    傳真:0531-88392446    院長信箱:tjyzxx@sdu.edu.cn

網址:    E-mail:tjfdw@sdu.edu.cn    技術支持:奇賽信科

Baidu
sogou