最適化のための強化学習(Pythonによる問題解決シリーズ<第3巻>) [全集叢書]
    • 最適化のための強化学習(Pythonによる問題解決シリーズ<第3巻>) [全集叢書]

    • ¥3,520106 ゴールドポイント(3%還元)
    • 在庫あり2025年8月4日月曜日までヨドバシエクストリームサービス便(無料)がお届け
100000009003870668

最適化のための強化学習(Pythonによる問題解決シリーズ<第3巻>) [全集叢書]



ゴールドポイントカード・プラスのクレジット決済で「書籍」を購入すると合計12%ゴールドポイント還元!合計12%還元書籍の購入はゴールドポイントカード・プラスのクレジット決済がお得です。
通常3%ゴールドポイント還元のところ、後日付与されるクレジット決済ポイント(1%)と特典ポイント(6%)、さらにご利用明細WEBチェックにご登録いただくと2%追加して合計12%ゴールドポイント還元!詳しくはこちら

価格:¥3,520(税込)
ゴールドポイント:106 ゴールドポイント(3%還元)(¥106相当)
フォーマット:
お届け日:在庫あり今すぐのご注文で、2025年8月4日月曜日までヨドバシエクストリームサービス便(無料)がお届けします。届け先変更]詳しくはこちら
出版社:近代科学社
販売開始日: 2024/09/30
お取り扱い: のお取り扱い商品です。
ご確認事項:返品不可

カテゴリランキング

店舗受け取りが可能です
マルチメディアAkibaマルチメディア梅田マルチメディア博多にて24時間営業時間外でもお受け取りいただけるようになりました

最適化のための強化学習(Pythonによる問題解決シリーズ<第3巻>) の 商品概要

  • 目次

    第1章 Python で強化学習を行うための環境構築
    1.1 オンラインサービスを利用する方法
    1.2 手元のコンピュータに実行環境を整える方法
    1.3 パッケージのインストール
    1.4 実行環境

    第2章 Python の基礎
    2.1 データ構造
    2.2 科学技術計算パッケージNumPy
    2.3 条件分岐
    2.4 繰り返し処理
    2.5 擬似乱数生成パッケージrandom
    2.6 可視化ライブラリMatplotlib
    2.7 関数
    2.8 内包表記

    第3章 強化学習の概要

    第4章 マルコフ決定過程
    4.1 マルコフ性
    4.2 推移確率行列
    4.3 マルコフ過程
    4.4 マルコフ報酬過程
    4.5 リターン
    4.6 価値関数
    4.7 方策
    4.8 マルコフ決定過程

    第5章 動的計画
    5.1 例1: 整数の和
    5.2 例2: 最短路問題
    5.3 動的計画による価値関数の評価
    5.4 方策評価
    5.5 方策改善
    5.6 方策反復
    5.7 価値反復

    第6章 モンテカルロ学習
    6.1 全幅探索とサンプル探索
    6.2 モンテカルロ方策評価
    6.3 First-visit モンテカルロ方策評価
    6.4 Every-visit モンテカルロ方策評価
    6.5 平均の増分計算

    第7章 Temporal Difference 学習
    7.1 TD(0) 学習
    7.2 オンポリシー学習とオフポリシー学習
    7.3 オンポリシーモンテカルロ学習
    7.4 オンポリシーTD 学習ーSARSA
    7.5 オフポリシーTD 学習ーQ 学習
  • 内容紹介

     本書では、強化学習における基本的な考え方や計算手法を紹介し、実際にPython を用いて実現する方法をまとめている。具体的にはマルコフ決定過程、価値関数、方策評価、方策反復、価値反復、モンテカルロ評価、SARSA、Q学習を扱う。ほとんどの内容は簡単な数学の知識があれば問題なく理解できるよう記述し、読者の学びやすさを優先して繰り返しの説明や既出の数式を再掲するなど工夫している。Pythonの基礎から強化学習の利用までを詳細に解説した充実の一冊。
  • 著者について

    小林和博 (コバヤシカズヒロ)
    青山学院大学 理工学部 経営システム工学科 准教授

最適化のための強化学習(Pythonによる問題解決シリーズ<第3巻>) の商品スペック

商品仕様
出版社名:近代科学社
著者名:小林和博(著)
発行年月日:2024/09
ISBN-10:4764907100
ISBN-13:9784764907102
判型:B5
発売社名:近代科学社
対象:専門
発行形態:全集叢書
内容:情報科学
言語:日本語
ページ数:204ページ
他の近代科学社の書籍を探す

    近代科学社 最適化のための強化学習(Pythonによる問題解決シリーズ<第3巻>) [全集叢書] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!