強化学習(機械学習プロフェッショナルシリーズ) [全集叢書]
    • 強化学習(機械学習プロフェッショナルシリーズ) [全集叢書]

    • ¥3,30099 ゴールドポイント(3%還元)
    • 在庫あり2025年8月12日火曜日までヨドバシエクストリームサービス便(無料)がお届け
強化学習(機械学習プロフェッショナルシリーズ) [全集叢書]
画像にマウスを合わせると上部に表示
100000009003126802

強化学習(機械学習プロフェッショナルシリーズ) [全集叢書]

価格:¥3,300(税込)
ゴールドポイント:99 ゴールドポイント(3%還元)(¥99相当)
フォーマット:
お届け日:在庫あり今すぐのご注文で、2025年8月12日火曜日までヨドバシエクストリームサービス便(無料)がお届けします。届け先変更]詳しくはこちら
出版社:講談社
販売開始日: 2019/05/23
お取り扱い: のお取り扱い商品です。
ご確認事項:返品不可

カテゴリランキング

店舗受け取りが可能です
マルチメディアAkibaマルチメディア梅田マルチメディア博多にて24時間営業時間外でもお受け取りいただけるようになりました

強化学習(機械学習プロフェッショナルシリーズ) の 商品概要

  • 目次

    準備
    プランニング
    探索と活用のトレードオフ
    モデルフリー型の強化学習
    モデルベース型の強化学習
    関数近似を用いた強化学習
    部分観測マルコフ決定過程
    最近の話題
  • 出版社からのコメント

    強化学習で必要になる数理を広くカバーした。一貫したていねいな解説なので、じっくり読める。参考文献・付録も充実!
  • 内容紹介

    理論は裏切らない
    ・強化学習で必要になる数理を広くカバーした。
    ・一貫したていねいな解説なので、じっくり読める。付録・参考文献も充実!
    ・ベルマン方程式、TD学習、方策勾配、POMDP、深層強化学習をより深く!

    【おもな内容】
    第1章 準備
    1.1 強化学習とは
    1.2 マルコフ決定過程と逐次的意思決定問題
    1.3 方策
    1.4 逐次的意思決定問題の定式化

    第2章 プランニング
    2.1 準備
    2.2 動的計画法
    2.3 動的計画法による解法
    2.4 線形計画法による解法

    第3章 探索と活用のトレードオフ
    3.1 概要
    3.2 探索と活用のトレードオフ
    3.3 方策モデル

    第4章 モデルフリー型の強化学習
    4.1 データにもとづく意思決定
    4.2 価値関数の推定
    4.3 方策と行動価値関数の学習
    4.4 収束性
    4.5 アクター・クリティック法

    第5章 モデルベース型の強化学習
    5.1 問題設定の整理
    5.2 環境推定
    5.3 ブラックボックス生成モデルに対するプランニング
    5.4 オンラインのモデルベース型強化学習

    第6章 関数近似を用いた強化学習
    6.1 概要
    6.2 価値関数の関数近似
    6.3 方策の関数近似

    第7章 部分観測マルコフ決定過程
    7.1 部分観測マルコフ決定過程(POMDP)の基礎
    7.2 POMDP のプランニング
    7.3 POMDP の学習

    第8章 最近の話題
    8.1 分布強化学習
    8.2 深層強化学習

    付録A 補足
    A.1 証明
    A.2 ノルム
    A.3 線形計画法
    A.4 自然勾配法の補足
  • 著者について

    森村 哲郎 (モリムラ テツロウ)
    日本アイ・ビー・エム  東京基礎研究所 研究員

強化学習(機械学習プロフェッショナルシリーズ) の商品スペック

商品仕様
出版社名:講談社
著者名:森村 哲郎(著)
発行年月日:2019/05
ISBN-10:4065155916
ISBN-13:9784065155912
判型:A5
対象:専門
発行形態:全集叢書
内容:数学
言語:日本語
ページ数:305ページ
縦:21cm
他の講談社の書籍を探す

    講談社 強化学習(機械学習プロフェッショナルシリーズ) [全集叢書] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!