No.174 - ディープマインド
最近の記事で、AI(Artificial Intelligence。人工知能)について3回書きました。
No.159
AIBOは最後のモルモットか
No.166
データの見えざ..
タグ: 李世乭 AlphaGo DeepMind 王銘琬 井山裕太 保木邦仁 コンピュータ将棋 深層強化学習 強化学習 深層学習
No.181 - アルファ碁の着手決定ロジック(2)
(前回から続く)
前回の No.180「アルファ碁の着手決定ロジック(1)」の続きです。以下に出てくる policy network、SL policy network、RL policy netw..
タグ: tree policy アルゴリズム 論文 AlphaGo Zero 解説 AlphaGo ディープマインド DeepMind nature ニューラルネットワーク
No.180 - アルファ碁の着手決定ロジック(1)
アルファ碁(AlphaGo)
No.174「ディープマインド」で、英国・ディープマインド社(DeepMind)のコンピュータ囲碁プログラム、アルファ碁が、世界最強レベルの囲碁棋士である韓国の李世..
タグ: 多腕バンディット問題 アルゴリズム 論文 解説 ディープマインド DeepMind AlphaGo アルファ碁 nature ニューラルネットワーク