No.181 - アルファ碁の着手決定ロジック(2)
(前回から続く)
前回の No.180「アルファ碁の着手決定ロジック(1)」の続きです。以下に出てくる policy network、SL policy network、RL policy netw..
タグ: tree policy アルゴリズム 論文 AlphaGo Zero 解説 AlphaGo ディープマインド DeepMind nature ニューラルネットワーク
No.180 - アルファ碁の着手決定ロジック(1)
アルファ碁(AlphaGo)
No.174「ディープマインド」で、英国・ディープマインド社(DeepMind)のコンピュータ囲碁プログラム、アルファ碁が、世界最強レベルの囲碁棋士である韓国の李世..
タグ: 多腕バンディット問題 アルゴリズム 論文 解説 ディープマインド DeepMind AlphaGo アルファ碁 nature ニューラルネットワーク