No.366 - 高校数学で理解する ChatGPT の仕組み(2)
\(\newcommand{\bs}[1]{\boldsymbol{#1}} \newcommand{\mr}[1]{\mathrm{#1}} \newcommand{\br}[1]{\textbf{..
タグ: OpenAI 目標駆動型学習 注意機構 ニューラル・ネットワーク 大規模言語モデルは新たな知能か Google 岡野原大輔 ファイン・チューニング 位置エンコーディング 残差結合
No.183 - ソニーの失われた10年
No.159「AIBOは最後のモルモットか」の続きです。最近何回か書いた人工知能(AI)に関する記事の継続という意味もあります。
(No.166、No.173、No.174、No.175、
No..
タグ: Slam 集合知 AIBO アイボ コジタイ ピーター・ストーン ロボット工学三原則 アイザック・アシモフ iRobot ルンバ
No.181 - アルファ碁の着手決定ロジック(2)
(前回から続く)
前回の No.180「アルファ碁の着手決定ロジック(1)」の続きです。以下に出てくる policy network、SL policy network、RL policy netw..
タグ: tree policy アルゴリズム 論文 AlphaGo Zero 解説 AlphaGo ディープマインド DeepMind nature ニューラルネットワーク
No.180 - アルファ碁の着手決定ロジック(1)
アルファ碁(AlphaGo)
No.174「ディープマインド」で、英国・ディープマインド社(DeepMind)のコンピュータ囲碁プログラム、アルファ碁が、世界最強レベルの囲碁棋士である韓国の李世..
タグ: 多腕バンディット問題 アルゴリズム 論文 解説 ディープマインド DeepMind AlphaGo アルファ碁 nature ニューラルネットワーク
No.174 - ディープマインド
最近の記事で、AI(Artificial Intelligence。人工知能)について3回書きました。
No.159
AIBOは最後のモルモットか
No.166
データの見えざ..
タグ: 李世乭 AlphaGo DeepMind 王銘琬 井山裕太 保木邦仁 コンピュータ将棋 深層強化学習 強化学習 深層学習
脳を活かす勉強法 奇跡の「強化学習」茂木健一郎著
PHP、2007年12月発売。
茂木健一郎さんといえば、
脳科学者としてもテレビに出る前から広く知られている同氏。
とはいえ、有名になったのは、NHKの「プロフェッショナル」。
2年以上見..
タグ: 茂木健一郎 強化学習 プロフェッショナル NHK 一流 試行錯誤 オタク マニア 奇才 成功体験