生成AIアプリケーション評価入門 [単行本]
    • 生成AIアプリケーション評価入門 [単行本]

    • ¥2,64080 ゴールドポイント(3%還元)
    • ただいま予約受付中!発売日以降のお届け日本全国配達料金無料
生成AIアプリケーション評価入門 [単行本]
画像にマウスを合わせると上部に表示
100000009004228025

生成AIアプリケーション評価入門 [単行本]

松木 晋祐(著・文・その他)


ゴールドポイントカード・プラスのクレジット決済で「書籍」を購入すると合計12%ゴールドポイント還元!合計12%還元書籍の購入はゴールドポイントカード・プラスのクレジット決済がお得です。
通常3%ゴールドポイント還元のところ、後日付与されるクレジット決済ポイント(1%)と特典ポイント(6%)、さらにご利用明細WEBチェックにご登録いただくと2%追加して合計12%ゴールドポイント還元!詳しくはこちら

価格:¥2,640(税込)
ゴールドポイント:80 ゴールドポイント(3%還元)(¥80相当)
お届け日:ただいま予約受付中!発売日以降のお届け
日本全国配達料金無料
出版社:技術評論社
販売開始日: 2026/05/01
お取り扱い: のお取り扱い商品です。
ご確認事項:返品不可

生成AIアプリケーション評価入門 [単行本] の 商品概要

  • 目次

    第1章 生成AIアプリケーションの評価の概要
    1.1 生成AI アプリケーションの特徴と評価の必要性
    1.2 生成AI アプリケーションの基本的な構造モデルと評価プロセスモデル
    1.3 開発ライフサイクルにおける生成AI アプリケーションの評価アプローチ
    1.4 まとめ

    第2章 生成AIアプリケーションの評価基盤モデルと評価アプローチ
    2.1 生成AI アプリケーションの品質モデル
    2.2 機械学習利用システムの外部品質特性レベル
    2.3 品質モデルとテストタイプを組み合わせて
    2.4 生成AI アプリケーションの基盤評価モデル
    2.5 評価観点基盤モデルにもとづく製品独自の評価観点モデルの構築とメトリクス設計
    2.6 生成AI アプリケーション開発における開発チームとQA チームの役割分担の例
    2.7 まとめ

    第3章 基本的な評価メトリクス
    3.1 混同行列にもとづくメトリクス
    3.2 検索・RAG 向けの基本的なメトリクス
    3.3 生成テキストの内容一致の基本的なメトリクス
    3.4 各メトリクスを実際に運用する
    3.5 まとめ

    第4章 評価メトリクスのツールによる評価の実際
    4.1 LLMを評価者として利用する「LLM-as-a-Judge」
    4.2 メトリクスの評価環境の構築
    4.3 評価の実行
    4.4 pytestと統合した利用
    4.5 まとめ

    第5章 生成AIアプリケーションのセキュリティ評価
    5.1 OWASP LLMとは
    5.2 OWASP LLM2025
    5.3 生成AI・LLMのセキュリティテスト・レッドチーミング
    5.4 まとめ

    第6章 AIエージェントの評価
    6.1 AI エージェントとは
    6.2 AIエージェントのパターンと構造・評価観点の例
    6.3 AIエージェントの評価メトリクス
    6.4 まとめ

    第7章 生成AIアプリケーションのテスト・評価のその他のトピック
    7.1 プロパティベースドテスト
    7.2 画像分析型の生成AI アプリケーションの評価
    7.3 AI 駆動開発のテスト・QA
  • 内容紹介

    生成AIを活用したアプリケーションは、リサーチ、ソフトウェア開発、各種創作活動の補助等、さまざまな知的労働において、欠かせないパートナーとなりつつあります。従来の演繹的なロジックの積み重ねにより構築されたソフトウェアと構造的に異なる生成AIアプリケーションは、その性質上、次の特徴を持ちます。

    ・確率的出力:同じ入力に対して、常に同じ出力が得られるとは限らない
    ・複雑な挙動:入力と出力の関係が明確ではなく、ブラックボックス的な側面がある
    ・文脈依存性:過去のやり取りや外部情報によって出力が変化する

    これらの特徴から、生成AIアプリケーションの品質を保証するためには、従来のソフトウェアテストとは異なる手法によるテストと評価が不可欠となります。
    本書では、生成AIを活用したアプリケーション、システムに焦点をあてて、そのテスト、評価のアプローチを紹介していきます。
  • 著者について

    松木 晋祐 (マツキ シンスケ)
    株式会社ベリサーブ 執行役員 研究開発管掌AIQVE ONE株式会社 取締役CTO独立系ソフトウェアベンダにて、テストオペレータから品質部門統括まで、ソフトウェアテストと品質保証にまつわるさまざまなロールを経験後、株式会社ベリサーブ/AIQVE ONE株式会社へ。ソフトウェア開発、QA/テストにまつわる先進技術推進、応用技術開発を担う部門を創設、運用。生成AIが組み込まれたシステムの品質保証技術、AI駆動開発に向けたプロセスQA技術の研究などを推進。また、AIQVE ONE株式会社ではゲーム分野へのAI4QA技術/製品開発などを企画、製品化を実現。AIとQAの掛け合わせで国内のさまざまな企業産業に向けた技術開発、提案を行なっている。社外活動に、東京電機大学CySec講師、テスト自動化研究会ファウンダー、ISO/IEC JTC1/SC7/WG26、JSTQB Technical Committee、W3C CSSWG コントリビューターなど。

生成AIアプリケーション評価入門 [単行本] の商品スペック

商品仕様
出版社名:技術評論社
著者名:松木 晋祐(著・文・その他)
発行年月日:2026/05/01
ISBN-13:9784297156145
判型:A5
対象:専門
発行形態:単行本
内容:電子通信
言語:日本語
ページ数:184ページ
他の技術評論社の書籍を探す

    技術評論社 生成AIアプリケーション評価入門 [単行本] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!