記事 での「確率的勾配降下法」の検索結果 3件
No.365 - 高校数学で理解する ChatGPT の仕組み(1)
\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{..
タグ: 正規分布 MLP ヘヴィサイド関数 単位ステップ関数 ReLU 活性化関数 多重パーセプトロン 標準偏差 積分 微分
No.181 - アルファ碁の着手決定ロジック(2)
(前回から続く)
前回の No.180「アルファ碁の着手決定ロジック(1)」の続きです。以下に出てくる policy network、SL policy network、RL policy netw..
タグ: tree policy アルゴリズム 論文 AlphaGo Zero 解説 AlphaGo ディープマインド DeepMind nature ニューラルネットワーク
No.180 - アルファ碁の着手決定ロジック(1)
アルファ碁(AlphaGo)
No.174「ディープマインド」で、英国・ディープマインド社(DeepMind)のコンピュータ囲碁プログラム、アルファ碁が、世界最強レベルの囲碁棋士である韓国の李世..
タグ: 多腕バンディット問題 アルゴリズム 論文 解説 ディープマインド DeepMind AlphaGo アルファ碁 nature ニューラルネットワーク