Pythonと大規模言語モデルで作る リアルタイムマルチモーダル対話システム [単行本]
    • Pythonと大規模言語モデルで作る リアルタイムマルチモーダル対話システム [単行本]

    • ¥3,960119 ゴールドポイント(3%還元)
    • 在庫あり2025年8月2日土曜日までヨドバシエクストリームサービス便(無料)がお届け
Pythonと大規模言語モデルで作る リアルタイムマルチモーダル対話システム [単行本]
画像にマウスを合わせると上部に表示
100000009003854353

Pythonと大規模言語モデルで作る リアルタイムマルチモーダル対話システム [単行本]



ゴールドポイントカード・プラスのクレジット決済で「書籍」を購入すると合計12%ゴールドポイント還元!合計12%還元書籍の購入はゴールドポイントカード・プラスのクレジット決済がお得です。
通常3%ゴールドポイント還元のところ、後日付与されるクレジット決済ポイント(1%)と特典ポイント(6%)、さらにご利用明細WEBチェックにご登録いただくと2%追加して合計12%ゴールドポイント還元!詳しくはこちら

価格:¥3,960(税込)
ゴールドポイント:119 ゴールドポイント(3%還元)(¥119相当)
お届け日:在庫あり今すぐのご注文で、2025年8月2日土曜日までヨドバシエクストリームサービス便(無料)がお届けします。届け先変更]詳しくはこちら
出版社:その他
販売開始日: 2024/06/18
お取り扱い: のお取り扱い商品です。
ご確認事項:返品不可

カテゴリランキング

店舗受け取りが可能です
マルチメディアAkibaマルチメディア梅田マルチメディア博多にて24時間営業時間外でもお受け取りいただけるようになりました

Pythonと大規模言語モデルで作る リアルタイムマルチモーダル対話システム の 商品概要

  • 目次

    第1 章 対話システム
    1 - 1 対話システムとは
    1 - 2 リアルタイムマルチモーダル対話システムとは
    1 - 3 一般的な対話システムのアーキテクチャ
    1 - 4 リアルタイムマルチモーダル対話システムのアーキテクチャ
    1 - 5 リアルタイムマルチモーダル対話システムツールキットRemdis
    1 - 6 ツール・ソフトウェアのインストール
    1 - 6 - 1 API キーの取得
    1 - 6 - 2 Windows のインストール手順
    1 - 6 - 3 Mac のインストール手順
    1 - 6 - 4 Windows/Mac 共通のインストール手順
    1 - 7 プログラムの起動

    第2 章 大規模言語モデルに基づくテキスト対話システム
    2 - 1 大規模言語モデル
    2 - 1 - 1 大規模言語モデルの理論
    2 - 1 - 2 大規模言語モデルを用いた応答生成の実装
    2 - 1 - 3 大規模言語モデル差し替えの実装
    2 - 2 リアルタイムテキスト対話システム
    2 - 2 - 1 リアルタイムテキスト対話システムの理論
    2 - 2 - 2 リアルタイムテキスト対話システムの実装
    2 - 3 リアルタイムテキスト対話システムの改善
    2 - 3 - 1 応答生成(高速版)の実装
    2 - 3 - 2 自発的な発話生成の実装
    2 - 4 本章のまとめ

    第3 章 音声対話システム
    3 - 1 音声認識
    3 - 1 - 1 音声認識の理論
    3 - 1 - 2 ストリーミング音声認識システムの実装
    3 - 2 音声合成
    3 - 2 - 1 音声合成の理論
    3 - 2 - 2 音声対話システムの実装
    3 - 3 ターンテイキング
    3 - 3 - 1 ターンテイキングの理論
    3 - 3 - 2 Voice Activity Projection (VAP)
    3 - 3 - 3 リアルタイム音声対話システムの実装
    3 - 4 本章のまとめ

    第4 章 マルチモーダル対話システム
    4 - 1 マルチモーダル対話システム
    4 - 2 マルチモーダル対話システムの理論
    4 - 2 - 1 入出力
    4 - 2 - 2 表出の方法
    4 - 2 - 3 エージェントの見た目のデザイン
    4 - 3 MMDAgent-EX
    4 - 3 - 1 入手・準備
    4 - 3 - 2 基本的な操作
    4 - 3 - 3 コンテンツの構成
    4 - 3 - 4 メッセージによる制御
    4 - 3 - 5 ログの表示と保存
    4 - 3 - 6 動作スクリプト
    4 - 3 - 7 CG エージェントの表示
    4 - 3 - 8 モーションの再生
    4 - 3 - 9 オーディオの再生
    4 - 3 - 10 リップシンク付き音声再生
    4 - 4 リアルタイムマルチモーダル対話システムの実装
    4 - 4 - 1 起動
    4 - 4 - 2 ファイルの構成
    4 - 4 - 3 同梱の3D モデルについて
    4 - 4 - 4 main.mdf
    4 - 4 - 5 動作スクリプトの解説
    4 - 4 - 6 RabbitMQ プラグイン
    4 - 5 カスタマイズ方法
    4 - 5 - 1 リップシンクを調整する
    4 - 5 - 2 テキストや画像を提示する
    4 - 5 - 3 Remdis との連携を拡張する
    4 - 5 - 4 開発情報

    第5 章 今後の展望
    5 - 1 より知的な応答
    5 - 2 実世界との紐づけ
    5 - 3 多人数対話
    5 - 4 リアルタイムに変化するシステム
    5 - 5 共通理解
    5 - 6 意図や欲求
  • 内容紹介

    石黒浩 氏(大阪大学基礎工学研究科教授・ATR石黒浩特別研究所客員所長)よりコメントを頂きました!
    『対話システムによって人間の生活はより豊かになる』
    『大規模言語モデルを用いて人間らしい対話システムを実現する方法を教えてくれる本』

    本書は,人間のようにスムーズなやり取りを行う対話システムを実現するための書籍です.具体的には,Remdisというツールキットの説明を通して,リアルタイムな応答の実現方法やマルチモーダル情報の表出方法を説明します.本書を用いることで「自分のシステムはなんだかもっさりしている」「もっと表現豊かな対話システムが作りたい!」「ChatGPT を組み込んだだけではなんだか物足りない」という悩みを解消できるはずです.

    本書の対象者は,対話システムに未来を感じている学生やエンジニアです.サイエンスフィクションなどで登場する,人間と対話をするコンピュータを実現したい,と考えている方にうってつけです.

    第1章では,対話システムという分野の概要について説明するとともに,リアルタイムマルチモーダル対話システムのアーキテクチャについて説明した後,ツールキットのインストール手順とプログラムの起動の仕方について説明しています.
    第2章では,大規模言語モデルとそれに基づくテキスト対話システムをRemdis のコードを参照しながら説明します.また,リアルタイムに大規模言語モデルの理論と実装について説明します.
    第3章では,音声対話システムについて説明します.音声認識の理論,音声合成の理論,そして,ターンテイキング(話者の交替)の理論について述べるとともに,これらをどのようにリアルタイムに動作するように実装するかをRemdis のコードとともに説明します.
    第4章では,マルチモーダル対話システムについて説明します.マルチモーダル対話システムの理論について述べたあと,マルチモーダルエージェントのためのツールキットであるMMDAgent-EX の説明を通して,マルチモーダル対話システムの実装について説明します.Remdis との連携方法についても具体的に説明します.
    第5章では,今後の展望として,これからの対話システムがどのように進化するかについて著者らが考えていることを述べます.
  • 著者について

    東中 竜一郎 (ヒガシナカリュウイチロウ)
    2001 年慶應義塾大学大学院政策・メディア研究
    科修士課程,2008 年博士課程修了.博士(学術).
    2001 年日本電信電話株式会社入社.2020 年より,
    名古屋大学大学院情報学研究科教授.NTT 人間
    情報研究所客員上席特別研究員.慶應義塾大学
    環境情報学部特別招聘教授.
    対話システムの研究に従事.著書に「Python でつくる対話システム」(オーム社),「AI の雑談力」(KADOKAWA),「対話システムの作り方」(近代科学社) など.

    光田 航 (ミツダコウ)
    2013 年東京工業大学工学部情報工学科卒業.2015
    年同大学院情報理工学研究科修士課程修了.2021
    年筑波大学大学院システム情報工学研究群博士
    課程修了.博士(工学).2015 年から2023 年まで,日本電信電話株式会社研究員.2023 年より,rinna 株式会社Applied Scientist.自然言語処理,対話システムの研究開発に従事.

    千葉 祐弥 (チバユウヤ)
    2012 年,2015 年に東北大学大学院工学研究科
    前期,後期課程を修了.博士(工学).2016 年か
    ら2020 年まで東北大学大学院工学研究科助教.
    2020 年NTT に入社,NTT コミュニケーション
    科学基礎研究所主任研究員.音声対話システム,マルチモーダル対話システムの研究に従事.

    李 晃伸 (リアキノブ)
    2000 年京都大学大学院情報学研究科博士課程修
    了.博士(情報学).同年奈良先端科学技術大学
    院大学情報科学研究科助手.2005 年より名古屋
    工業大学大学院工学研究科にて助教授,2007 年
    同准教授.2016 年同教授.音声認識・音声言語
    理解・音声対話システム・音声インタラクションの研究に従事.オープンソースソフトウェアJulius, MMDAgent-EX の主開発者.

Pythonと大規模言語モデルで作る リアルタイムマルチモーダル対話システム の商品スペック

商品仕様
出版社名:科学情報出版
著者名:東中竜一郎(著)/光田航(著)/千葉祐弥(著)
発行年月日:2024/06
ISBN-10:4910558306
ISBN-13:9784910558301
判型:A5
発売社名:科学情報出版
対象:専門
発行形態:単行本
内容:情報科学
言語:日本語
ページ数:239ページ
他のその他の書籍を探す

    その他 Pythonと大規模言語モデルで作る リアルタイムマルチモーダル対話システム [単行本] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!