画像にマウスを合わせると上部に表示

生成AIアプリケーション評価入門 [単行本]

【合計12％還元】書籍の購入はゴールドポイントカード・プラスのクレジット決済がお得です。
通常3％ゴールドポイント還元のところ、後日付与されるクレジット決済ポイント（1％）と特典ポイント（6％）、さらにご利用明細WEBチェックにご登録いただくと2％追加して合計12％ゴールドポイント還元！詳しくはこちら

価格：	￥2,640（税込）
ゴールドポイント：	80 ゴールドポイント（3％還元）（￥80相当）
フォーマット：	単行本￥2,640 80 ゴールドポイント（3％還元）電子書籍￥2,640 528 ゴールドポイント（20％還元）
お届け日：	在庫あり今すぐのご注文で、2026年7月25日土曜日までにヨドバシエクストリームサービス便（無料）がお届けします。［届け先変更］詳しくはこちら

出版社：	技術評論社
販売開始日：	2026/05/01
お取り扱い：	のお取り扱い商品です。
バリエーション：	生成AIアプリケーション評価入門 [単行本] 5件のバリエーションがあります
ご確認事項：	返品不可

カテゴリランキング

書籍
10744位

数量

ショッピングカートに入れる

お気に入りに登録する

在庫のある店舗6

店舗受け取りが可能です

マルチメディアAkiba、マルチメディア梅田、マルチメディア博多では24時間営業時間外でもお受け取りいただけますマルチメディア池袋では朝6:00〜23:30の間、営業時間外でもお受け取りいただけます

お客様へのおすすめ【PR】

今すぐ使えるかんたんぜったいデキます!Copilot超入門(Imasugu Tsukaeru Kantan Series) [単行本]

￥1,650
50 ゴールドポイント
在庫あり
2026年7月25日土曜日までにヨドバシエクストリームサービス便がお届け

最速でわかる生成AI実践ガイド [単行本]

￥3,520
106 ゴールドポイント
在庫あり
2026年7月25日土曜日までにヨドバシエクストリームサービス便がお届け

（2）

Gemini AI活用最強の教科書 [単行本]

￥1,980
60 ゴールドポイント
在庫あり
2026年7月25日土曜日までにヨドバシエクストリームサービス便がお届け

AIに恋しちゃダメですか?―AIと生きるための倫理と哲学 [単行本]

￥1,760
53 ゴールドポイント
在庫あり
2026年7月25日土曜日までにヨドバシエクストリームサービス便がお届け

Copilot仕事術&時短技生成AI活用BESTセレクション―Microsoft 365 Copilot対応(今すぐ使えるかんたんEx) [単行本]

￥1,980
60 ゴールドポイント
在庫あり
2026年7月25日土曜日までにヨドバシエクストリームサービス便がお届け

今すぐ使えるかんたんいちばんやさしいChatGPT超入門改訂新版 (Imasugu Tsukaeru Kantan Series) [単行本]

￥1,760
53 ゴールドポイント
在庫あり
2026年7月25日土曜日までにヨドバシエクストリームサービス便がお届け

￥1,848
56 ゴールドポイント
在庫あり
2026年7月25日土曜日までにヨドバシエクストリームサービス便がお届け

生成AIの安全性入門(ML Systems) [単行本]

￥3,300
99 ゴールドポイント
在庫あり
2026年7月25日土曜日までにヨドバシエクストリームサービス便がお届け

はじめてのMicrosoft Power Platform入門―ローコード+AIで業務システムを作る [単行本]

￥3,520
106 ゴールドポイント
在庫あり
2026年7月25日土曜日までにヨドバシエクストリームサービス便がお届け

MastraによるAIエージェント開発・運用実践入門(エンジニア選書) [単行本]

￥3,960
119 ゴールドポイント
在庫あり
2026年7月25日土曜日までにヨドバシエクストリームサービス便がお届け

作って学ぶAIエージェント―TypeScriptとLLMで切り拓くAI時代のエンジニアリング(エンジニア選書) [単行本]

￥3,520
106 ゴールドポイント
在庫あり
2026年7月25日土曜日までにヨドバシエクストリームサービス便がお届け

ChatGPT & Copilot入社1年目の教科書 [単行本]

￥1,980
60 ゴールドポイント
在庫あり
2026年7月25日土曜日までにヨドバシエクストリームサービス便がお届け

生成AIアプリケーション評価入門 [単行本]と一緒に購入されている商品

数理最適化がわかる機械学習の連続最適化編―逐一数式の意味を追いながら、連続最適化としての機械学習を理解する(ファーストブック) [単行本]

Pythonではじめるクリーンアーキテクチャ―SOLID原則/ドメイン駆動設計/テスト駆動開発を実践(IMPRESS TOP GEAR) [単行本]

実務で使える数理最適化の考え方―基礎から学ぶモデリング [単行本]

実践ハイブリッドクラウド・セキュリティアーキテクチャ―ゼロトラスト原則を用いたセキュリティ設計の実践的手法 [単行本]

Pythonで学ぶWebアプリのセキュアコーディング―脆弱性の見つけ方・直し方が身につく実践入門 [単行本]

（1）

AIとソフトウェアテスト―信頼できるシステムを構築するために [単行本]

Claude AIエージェント開発入門―Computer Useやアーティファクト自作からMCPサーバー構築まで [単行本]

生成AIデザインパターン―AIエージェント構築、アプリケーション開発のベストプラクティス [単行本]

生成AIアプリケーション評価入門 [単行本] の商品概要

要旨（「BOOK」データベースより）
生成ＡＩの出力を評価し、再現性・品質・安全性を確保する。正確な情報を提供できるか。出力結果にばらつきはないか。不適切な表現を制御できるか。存在しない事実を提示していないか。プライバシーの侵害につながらないか。実際に評価を行うサンプルコード付き。
目次
第1章生成AIアプリケーションの評価の概要
1.1 生成AI アプリケーションの特徴と評価の必要性
1.2 生成AI アプリケーションの基本的な構造モデルと評価プロセスモデル
1.3 開発ライフサイクルにおける生成AI アプリケーションの評価アプローチ
1.4 まとめ

第2章生成AIアプリケーションの評価基盤モデルと評価アプローチ
2.1 生成AI アプリケーションの品質モデル
2.2 機械学習利用システムの外部品質特性レベル
2.3 品質モデルとテストタイプを組み合わせて
2.4 生成AI アプリケーションの基盤評価モデル
2.5 評価観点基盤モデルにもとづく製品独自の評価観点モデルの構築とメトリクス設計
2.6 生成AI アプリケーション開発における開発チームとQA チームの役割分担の例
2.7 まとめ

第3章基本的な評価メトリクス
3.1 混同行列にもとづくメトリクス
3.2 検索・RAG 向けの基本的なメトリクス
3.3 生成テキストの内容一致の基本的なメトリクス
3.4 各メトリクスを実際に運用する
3.5 まとめ

第4章評価メトリクスのツールによる評価の実際
4.1 LLMを評価者として利用する「LLM-as-a-Judge」
4.2 メトリクスの評価環境の構築
4.3 評価の実行
4.4 pytestと統合した利用
4.5 まとめ

第5章生成AIアプリケーションのセキュリティ評価
5.1 OWASP LLMとは
5.2 OWASP LLM2025
5.3 生成AI・LLMのセキュリティテスト・レッドチーミング
5.4 まとめ

第6章 AIエージェントの評価
6.1 AI エージェントとは
6.2 AIエージェントのパターンと構造・評価観点の例
6.3 AIエージェントの評価メトリクス
6.4 まとめ

第7章生成AIアプリケーションのテスト・評価のその他のトピック
7.1 プロパティベースドテスト
7.2 画像分析型の生成AI アプリケーションの評価
7.3 AI 駆動開発のテスト・QA
内容紹介
生成AIを活用したアプリケーションは、リサーチ、ソフトウェア開発、各種創作活動の補助等、さまざまな知的労働において、欠かせないパートナーとなりつつあります。従来の演繹的なロジックの積み重ねにより構築されたソフトウェアと構造的に異なる生成AIアプリケーションは、その性質上、次の特徴を持ちます。

・確率的出力：同じ入力に対して、常に同じ出力が得られるとは限らない
・複雑な挙動：入力と出力の関係が明確ではなく、ブラックボックス的な側面がある
・文脈依存性：過去のやり取りや外部情報によって出力が変化する

これらの特徴から、生成AIアプリケーションの品質を保証するためには、従来のソフトウェアテストとは異なる手法によるテストと評価が不可欠となります。
本書では、生成AIを活用したアプリケーション、システムに焦点をあてて、そのテスト、評価のアプローチを紹介していきます。
著者紹介（「BOOK著者紹介情報」より）（本データはこの書籍が刊行された当時に掲載されていたものです）
松木晋祐(マツキシンスケ)
株式会社ベリサーブ　執行役員　研究開発管掌。ＡＩＱＶＥ　ＯＮＥ株式会社　取締役ＣＴＯ。独立系ソフトウェアベンダにて、テストオペレータから品質部門統括まで、ソフトウェアテストと品質保証にまつわるさまざまなロールを経験後、株式会社ベリサーブ／ＡＩＱＶＥ　ＯＮＥ株式会社へ。ソフトウェア開発、ＱＡ／テストにまつわる先進技術推進、応用技術開発を担う部門を創設、運用。生成ＡＩが組み込まれたシステムの品質保証技術、ＡＩ駆動開発に向けたプロセスＱＡ技術の研究などを推進。また、ＡＩＱＶＥ　ＯＮＥ株式会社ではゲーム分野へのＡＩ４ＱＡ技術／製品開発などを企画、製品化を実現。ＡＩとＱＡの掛け合わせで国内のさまざまな企業産業に向けた技術開発、提案を行なっている。社外活動に、東京電機大学ＣｙＳｅｃ講師、テスト自動化研究会ファウンダー、ＩＳＯ／ＩＥＣ　ＪＴＣ１／ＳＣ７／ＷＧ２６、ＪＳＴＱＢ　Ｔｅｃｈｎｉｃａｌ　Ｃｏｍｍｉｔｔｅｅ、Ｗ３Ｃ　ＣＳＳＷＧコントリビューターなど
著者について
松木晋祐 (マツキシンスケ)
株式会社ベリサーブ執行役員研究開発管掌AIQVE ONE株式会社取締役CTO独立系ソフトウェアベンダにて、テストオペレータから品質部門統括まで、ソフトウェアテストと品質保証にまつわるさまざまなロールを経験後、株式会社ベリサーブ／AIQVE ONE株式会社へ。ソフトウェア開発、QA／テストにまつわる先進技術推進、応用技術開発を担う部門を創設、運用。生成AIが組み込まれたシステムの品質保証技術、AI駆動開発に向けたプロセスQA技術の研究などを推進。また、AIQVE ONE株式会社ではゲーム分野へのAI4QA技術／製品開発などを企画、製品化を実現。AIとQAの掛け合わせで国内のさまざまな企業産業に向けた技術開発、提案を行なっている。社外活動に、東京電機大学CySec講師、テスト自動化研究会ファウンダー、ISO/IEC JTC1/SC7/WG26、JSTQB Technical Committee、W3C CSSWG コントリビューターなど。

生成AIアプリケーション評価入門 [単行本] の商品スペック

商品仕様	出版社名：技術評論社
	著者名：松木晋祐（著）
	発行年月日：2026/05/13
	ISBN-10：4297156148
	ISBN-13：9784297156145
	判型：A5
	対象：専門
	発行形態：単行本
	内容：電子通信
	言語：日本語
	ページ数：184ページ
	縦：21cm
他の技術評論社の書籍を探す	書籍技術評論社 Gijyutu-Hyohron > 情報･通信･コンピュータ技術評論社 Gijyutu-Hyohron > コンピュータ･情報処理技術評論社 Gijyutu-Hyohron > 人工知能･知的情報処理技術評論社 Gijyutu-Hyohron