タグ検索    

記事 画像
タグ検索トップ  >  記事  /  強化学習
記事 での「強化学習」の検索結果 6
No.183 - ソニーの失われた10年
クラバートの樹 ] 20:02 07/22
No.159「AIBOは最後のモルモットか」の続きです。最近何回か書いた人工知能(AI)に関する記事の継続という意味もあります。 (No.166、No.173、No.174、No.175、  No..
タグ: Slam 集合知 AIBO アイボ コジタイ ピーター・ストーン ロボット工学三原則 アイザック・アシモフ iRobot ルンバ
No.181 - アルファ碁の着手決定ロジック(2)
クラバートの樹 ] 20:20 06/24
(前回から続く) 前回の No.180「アルファ碁の着手決定ロジック(1)」の続きです。以下に出てくる policy network、SL policy network、RL policy netw..
タグ: tree policy アルゴリズム 論文 AlphaGo Zero 解説 AlphaGo ディープマインド DeepMind nature ニューラルネットワーク
No.180 - アルファ碁の着手決定ロジック(1)
クラバートの樹 ] 19:49 06/17
アルファ碁(AlphaGo) No.174「ディープマインド」で、英国・ディープマインド社(DeepMind)のコンピュータ囲碁プログラム、アルファ碁が、世界最強レベルの囲碁棋士である韓国の李世..
タグ: 多腕バンディット問題 アルゴリズム 論文 解説 ディープマインド DeepMind AlphaGo アルファ碁 nature ニューラルネットワーク
No.174 - ディープマインド
クラバートの樹 ] 09:45 04/16
最近の記事で、AI(Artificial Intelligence。人工知能)について3回書きました。 No.159 AIBOは最後のモルモットか No.166 データの見えざ..
タグ: 李世乭 AlphaGo DeepMind 王銘琬 井山裕太 保木邦仁 コンピュータ将棋 深層強化学習 強化学習 深層学習
脳を活かす勉強法 奇跡の「強化学習」茂木健一郎著
考えるラクだ ] 16:27 02/20
PHP、2007年12月発売。 茂木健一郎さんといえば、 脳科学者としてもテレビに出る前から広く知られている同氏。 とはいえ、有名になったのは、NHKの「プロフェッショナル」。 2年以上見..
タグ: 茂木健一郎 強化学習 プロフェッショナル NHK 一流 試行錯誤 オタク マニア 奇才 成功体験