深層強化学習入門 [単行本]
    • 深層強化学習入門 [単行本]

    • ¥3,19096 ゴールドポイント(3%還元)
    • 在庫あり2025年6月3日火曜日までヨドバシエクストリームサービス便(無料)がお届け
100000009003396636

深層強化学習入門 [単行本]

価格:¥3,190(税込)
ゴールドポイント:96 ゴールドポイント(3%還元)(¥96相当)
フォーマット:
お届け日:在庫あり今すぐのご注文で、2025年6月3日火曜日までヨドバシエクストリームサービス便(無料)がお届けします。届け先変更]詳しくはこちら
出版社:共立出版
販売開始日: 2021/04/10
お取り扱い: のお取り扱い商品です。
ご確認事項:返品不可

カテゴリランキング

店舗受け取りが可能です
マルチメディアAkibaマルチメディア梅田マルチメディア博多にて24時間営業時間外でもお受け取りいただけるようになりました

深層強化学習入門 [単行本] の 商品概要

  • 目次

    第1章 はじめに
    1.1 なぜ強化学習?
    1.2 本書の概要

    第2章 機械学習と深層学習
    2.1 教師あり学習,および偏りと過適合の概念
    2.2 教師なし学習
    2.3 深層学習の手法

    第3章 強化学習の基礎
    3.1 形式的な枠組み
    3.2 方策を学習するためのさまざまな要素
    3.3 データから方策を学習するためのさまざまな設定

    第4章 価値ベース手法による深層強化学習
    4.1 Q学習
    4.2 当てはめQ学習
    4.3 深層Qネットワーク
    4.4 2重深層Q学習
    4.5 決闘型ネットワーク構造
    4.6 分布型深層Qネットワーク
    4.7 多段階学習
    4.8 DQNの改良版と派生手法の組み合わせ

    第5章 方策勾配法による深層強化学習
    5.1 確率的方策勾配
    5.2 確定的方策勾配
    5.3 アクター・クリティック法
    5.4 自然方策勾配
    5.5 信頼領域最適化
    5.6 方策勾配とQ学習の組み合わせ

    第6章 モデルベース手法による深層強化学習
    6.1 純粋モデルベース法
    6.2 モデルフリー手法とモデルベース手法の組み合わせ

    第7章 汎化性
    7.1 特徴選択
    7.2 学習アルゴリズムと関数近似器の選択
    7.3 目的関数の修正
    7.4 階層的学習
    7.5 最良の偏り・過適合のトレードオフの獲得

    第8章 オンライン問題に特有の課題
    8.1 探索・活用のジレンマ
    8.2 経験再生の管理

    第9章 深層強化学習のベンチマーク
    9.1 ベンチマークの環境
    9.2 深層強化学習ベンチマークにおけるベストプラクティス
    9.3 深層強化学習のオープンソースソフトウェア

    第10章 MDPを超える深層強化学習
    10.1 部分観測性と関連する複数環境のMDPの分布
    10.2 転移学習
    10.3 明示的な報酬関数を持たない学習
    10.4 マルチエージェントシステム

    第11章 深層強化学習の展望
    11.1 深層強化学習の成功
    11.2 深層強化学習を実世界問題に適用する際の課題
    11.3 深層強化学習と神経科学の関係

    第12章 結論
    12.1 深層強化学習の将来の発展
    12.2 深層強化学習や人工知能の応用と社会への影響

    付録:深層強化学習のフレームワーク

    参考文献
    欧文索引
    和文索引
  • 出版社からのコメント

    強化学習の基礎から,深層強化学習の主要アルゴリズム,最先端の話題までを網羅。実験結果の一貫性や再現性といった実践面も詳説。
  • 内容紹介

    深層強化学習は,強化学習と深層学習の組み合わせである。この研究分野の発展により,従来機械で扱う範疇ではなかった広範囲の複雑な意思決定問題を解けるようになってきた。深層強化学習はヘルスケア,ロボティクス,スマートグリッド,金融工学,その他さまざまな領域において,新たな応用の可能性を切り拓きつつある。本書は,そのような深層強化学習に関し,強化学習の基礎から始まり,深層強化学習の主要なアルゴリズムや最先端の話題まで,豊富な参考文献も含めて幅広く網羅している。特に本書は,汎化性を向上させるノウハウや深層強化学習が実応用でどのように使われるかという観点に着目して執筆されている。

    機械学習の基礎知識を有する大学生・大学院生や企業の研究者・技術者が,深層強化学習の概要を効率的に勉強したいと思ったときの最初の一冊として推薦できる構成となっている。

    原著:An Introduction to Deep Reinforcement Learning, 2019
  • 著者紹介(「BOOK著者紹介情報」より)(本データはこの書籍が刊行された当時に掲載されていたものです)

    松原 崇充(マツバラ タカミツ)
    奈良先端科学技術大学院大学研究推進機構研究推進部門、特任准教授(テニュア・トラック教員)、博士(工学)

    井尻 善久(イジリ ヨシヒサ)
    オムロン株式会社技術・知財本部、技術専門職。オムロンサイニックエックス株式会社リサーチアドミニストレイティブディビジョン、リサーチオーガナイザ、博士(情報科学)

    〓屋 政志(ハマヤ マサシ)
    オムロンサイニックエックス株式会社リサーチアドミニストレイティブディビジョン、シニアリサーチャ、博士(工学)

深層強化学習入門 [単行本] の商品スペック

商品仕様
出版社名:共立出版
著者名:ヴァンサン フランソワ-ラヴェ(著)/ピーター ヘンダーソン(著)/リアシャット イスラム(著)/マーク・G. ベルマーレ(著)/ジョエル ピノー(著)/松原 崇充(監訳)/井尻 善久(訳)/〓屋 政志(訳)
発行年月日:2021/04/15
ISBN-10:4320124723
ISBN-13:9784320124721
判型:A5
発売社名:共立出版
対象:専門
発行形態:単行本
内容:数学
言語:日本語
ページ数:124ページ
縦:21cm
その他: 原書名: An Introduction to Deep Reinforcement Learning〈Fran〓ois-Lavet,Vincent;Henderson,Peter;Islam,Riashat;Bellemare,Marc G.;Pineau,Joelle〉
他の共立出版の書籍を探す

    共立出版 深層強化学習入門 [単行本] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!