強化学習 - タグ検索：SSブログ

SSブログ

タグ検索トップ > 記事 / 強化学習

記事での「強化学習」の検索結果 6件

No.366 - 高校数学で理解する ChatGPT の仕組み（２）

[ クラバートの樹 ] 07:39 10/06

\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{..
タグ： OpenAI 目標駆動型学習注意機構ニューラル・ネットワーク大規模言語モデルは新たな知能か Google 岡野原大輔ファイン・チューニング位置エンコーディング残差結合

No.183 - ソニーの失われた10年

[ クラバートの樹 ] 20:02 07/22

No.159「AIBOは最後のモルモットか」の続きです。最近何回か書いた人工知能（AI）に関する記事の継続という意味もあります。（No.166、No.173、No.174、No.175、　No..
タグ： Slam 集合知 AIBO アイボコジタイピーター・ストーンロボット工学三原則アイザック・アシモフ iRobot ルンバ

No.181 - アルファ碁の着手決定ロジック（２）

[ クラバートの樹 ] 20:20 06/24

（前回から続く）前回の No.180「アルファ碁の着手決定ロジック（１）」の続きです。以下に出てくる policy network、SL policy network、RL policy netw..
タグ： tree policy アルゴリズム論文 AlphaGo Zero 解説 AlphaGo ディープマインド DeepMind nature ニューラルネットワーク

No.180 - アルファ碁の着手決定ロジック（１）

[ クラバートの樹 ] 19:49 06/17

アルファ碁（AlphaGo） No.174「ディープマインド」で、英国・ディープマインド社（DeepMind）のコンピュータ囲碁プログラム、アルファ碁が、世界最強レベルの囲碁棋士である韓国の李世..
タグ：多腕バンディット問題アルゴリズム論文解説ディープマインド DeepMind AlphaGo アルファ碁 nature ニューラルネットワーク

No.174 - ディープマインド

[ クラバートの樹 ] 09:45 04/16

最近の記事で、AI（Artificial Intelligence。人工知能）について３回書きました。 No.159 AIBOは最後のモルモットか No.166 データの見えざ..
タグ：李世乭 AlphaGo DeepMind 王銘琬井山裕太保木邦仁コンピュータ将棋深層強化学習強化学習深層学習

脳を活かす勉強法　奇跡の「強化学習」茂木健一郎著

[ 考えるラクだ ] 16:27 02/20

ＰＨＰ、２００７年１２月発売。茂木健一郎さんといえば、脳科学者としてもテレビに出る前から広く知られている同氏。とはいえ、有名になったのは、ＮＨＫの「プロフェッショナル」。２年以上見..
タグ：茂木健一郎強化学習プロフェッショナル NHK 一流試行錯誤オタクマニア奇才成功体験

最近チェックしたタグ