進化するヒトと機械の音声コミュニケーション Vol.2-AIの活用と感情に寄り添う音声認識・合成の新展開 [単行本]

販売休止中です

    • 進化するヒトと機械の音声コミュニケーション Vol.2-AIの活用と感情に寄り添う音声認識・合成の新展開 [単行本]

    • ¥49,5001,485 ゴールドポイント(3%還元)
100000009004104637

進化するヒトと機械の音声コミュニケーション Vol.2-AIの活用と感情に寄り添う音声認識・合成の新展開 [単行本]

伊藤彰則ほか29名(著・文・その他)


ゴールドポイントカード・プラスのクレジット決済で「書籍」を購入すると合計10%ポイント還元!書籍の購入はゴールドポイントカード・プラスのクレジット決済がお得です。
通常3%ポイント還元のところ、後日付与されるクレジット決済ポイント(1%)と特典ポイント(6%)で合計10%ポイント還元!詳しくはこちら

価格:¥49,500(税込)
ゴールドポイント:1,485 ゴールドポイント(3%還元)(¥1,485相当)
日本全国配達料金無料
出版社:エヌ・ティー・エス
販売開始日: 2025/04/12
お取り扱い: のお取り扱い商品です。
ご確認事項:返品不可

進化するヒトと機械の音声コミュニケーション Vol.2-AIの活用と感情に寄り添う音声認識・合成の新展開 の 商品概要

  • 目次

    序論 音声処理研究の動向と今後の展望
     1. 音声処理研究の変遷の概観
     2. 音声の分析合成
     3. 音声認識
     4. 音声合成
     5. 今後の展望
    第1編 聴覚・発声のメカニズムと音声認識・合成の最新技術
     第1章 聴覚・発声のメカニズム
      第1節 聴覚のメカニズム
       1. はじめに
       2. 振動の伝達と電気信号への変換
       3. 情報の抽出
       4. 情報の統合
       5. まとめ
      第2節 音声生成のメカニズム
       1. 音声生成のメカニズムの基礎
       2. 発声
       3. 調音運動
       4. 言語情報・パラ言語情報・非言語情報
     第2章 音声認識の最新技術
      第1節 End-to-Endモデルによる音声認識
       1. はじめに
       2. 音声認識のためのEnd-to-Endモデルの分類
       3. Connectionist Temporal Classification(CTC)
       4. RNNトランスデューサ(RNN transducer)
       5. アテンションモデル(Attention model)
       6. トランスフォーマ(Transformer)
       7. 自己教師付き学習に基づく大規模事前学習モデル
       8. 主な大規模事前学習モデル
       9. おわりに
      第2節 骨導デバイスを利用した音声コミュニケーション:人と機械による音声認識
       1. はじめに
       2. 骨導音声の伝搬
       3. 集音した骨導音声の認識
       4. 骨導提示した音声の認識
       5. おわりに
      第3節 読唇技術:音声情報を利用せずに映像情報のみを用いた音声認識技術
       1. はじめに
       2. 関連研究
       3. 基本モデル
       4. 検討モデル
       5. 評価実験
       6. おわりに
     第3章 音声合成の最新技術
      第1節 脳活動信号を用いた言語情報の抽出と音声合成技術の動向
       1. はじめに
       2. 脳活動信号の計測方法
       3. 意思伝達を目的としたブレイン・マシン・インタフェース(BMI)
       4. 脳活動信号を用いた音声・言語情報の抽出
       5. 脳活動信号を用いた言語情報抽出と音声合成の展望
      第2節 口真似による模倣音声からの効果音合成技術
       1. はじめに
       2. 非音声・非音楽な音響合成関連技術
       3. 擬音的模倣音声のみに基づく効果音合成
       4. おわりに
      第3節 視覚障害者の映像鑑賞における音声合成利用
       1. はじめに
       2. 視覚障害者の映像鑑賞の歴史と音声合成の導入
       3. 音声合成を用いた音声ガイドの心理学的評価
       4. 音声合成を用いた音声ガイド制作の課題と音の作用
       5. 音声ガイドの自動生成技術の発展
       6. 課題と展望
    第2編 音声認識・合成・コミュニケーションの応用技術
     第1章 音声認識の応用技術
      第1節 ロボット聴覚のためのオープンソースソフトウェアHARKとPyHARK
       1. はじめに
       2. ロボット聴覚オープンソースソフトウェアHARK
       3. HARKの課題とPython化
       4. PyHARKアーキテクチャ
       5. PyHARKを用いた実装例
       6. PyHARKの性能
       7. おわりに
      第2節 叫び声から危機を検知するための音声コーパス構築
       1. はじめに
       2. 叫び声コーパスRISCの構築
       3. RISCを用いた評価実験
       4. おわりに
      第3節 聴覚障がい者向け音声認識システムの開発
       1. Honda CAシステム
       2. 従来の音声認識技術の課題
       3. 語彙拡張を実現する音声認識モデル
       4. 性能評価
       5. まとめと今後の展望
      第4節 世界最高水準の高精度音声認識AI文字起こし「shirushi」の開発
       1. はじめに
       2. 音声認識の課題と昨今の技術発展
       3. Whisper実用化のための取り組み
       4. 大規模言語モデル(LLM)との組み合わせによるさらなる性能向上
       5. 今後の展望
      第5節 音声認識AIを搭載したティーチングレスロボットシステムの開発
       1. 概要
       2. ティーチングレスロボットシステム
       3. 音声認識AI技術の特徴
       4. まとめ
     第2章 音声合成の応用技術
      第1節 生成AI時代の音声合成プロダクト「FutureVoice Crayon」
       1. はじめに
       2. 会社紹介
       3. FutureVoice Crayonのプロダクト構成と技術動向
       4. FutureVoice Crayonの導入事例
       5. 今後の適用業界の拡大
       6. 今後の課題
      第2節 落語を演じる音声合成
       1. はじめに
       2. 情報伝達を超えた音声合成としての落語を演じる音声合成
       3. 落語
       4. リサーチ・クエスチョンと技術的課題
       5. 落語を演じる音声合成を作る
       6. 落語の音声合成は前座・二ツ目・真打ならどの水準に相当するのか
       7. おわりに
      第3節 日本放送協会における音声合成の研究開発と実用化
       1. はじめに
       2. 研究開発
       3. NHKにおける音声合成の実用化
       4. おわりに
     第3章 音声によるコミュニケーション技術
      第1節 音声による感情認識の開発
       1. はじめに
       2. 感情音声コーパス
       3. 言語特徴と音響特徴を併用した音声感情認識
       4. まとめと今後の展望
      第2節 共感的な傾聴対話ロボットの開発
       1. はじめに
       2. 傾聴対話システム
       3. 高齢者との対話実験
       4. 同調笑いの生成
       5. おわりに
      第3節 聞き手の反応によって発話タイミングを変える音声ガイダンス
       1. はじめに
       2. 聞き手反応の実時間検出
       3. 聞き手アウェアな音声ガイドシステムの開発
       4. 音声ガイドシステムとのインタラクション実験
       5. 考察
       6. おわりに
      第4節 ろう・難聴者や盲ろう者のコミュニケーションを支援する音声処理
       1. はじめに
       2. 音声認識を用いた字幕による情報保障
       3. ろう・難聴者を対象とした音声認識
       4. 盲ろう者のための音声点訳
       5. ろう・難聴者の聞き取り支援
       6. おわりに
      第5節 音声認識AIを搭載したコミュニケーションロボットの開発
       1. はじめに
       2. 音声認識技術とは
       3. 音声認識技術の実装上の課題
       4. おわりに
  • 出版社からのコメント

    人工知能の発展で飛躍的に進歩している音声認識・合成技術、聴覚・発声のメカニズムから最新技術、応用、今後の展望まで網羅&詳解!
  • 内容紹介

    ◆人工知能の発展に伴い、飛躍的に進歩している音声認識・合成技術!
    ◆聴覚・発声のメカニズムから音声の認識・合成の最新技術、今後の展望まで網羅&詳解!
    ◆娯楽・情報・福祉等、実用化事例も満載!より豊かな生活に向けたコミュニケーションの実現へ‼

    【主な目次】
    序論 音声処理研究の動向と今後の展望
    第1編 聴覚・発声のメカニズムと音声認識・合成の最新技術
     第1章 聴覚・発声のメカニズム
     第2章 音声認識の最新技術
     第3章 音声合成の最新技術
    第2編 音声認識・合成・コミュニケーションの応用技術
     第1章 音声認識の応用技術
     第2章 音声合成の応用技術
     第3章 音声によるコミュニケーション技術
  • 著者について

    伊藤彰則ほか29名 (イトウアキノリホカニジュウキュウメイ)
    【執筆者(全30名)】
    伊藤 彰則
    森川 大輔
    上江洲 安史
    鳥谷 輝樹
    高野 佐代子
    河原 達也
    鵜木 祐史
    齊藤 剛史
    吉村 奈津江
    平井 重行
    中島 佐和子
    大河内 直之
    中臺 一博
    糸山 克寿
    福森 隆寛
    周藤 唯
    松田 裕之
    渡辺 光太朗
    白土 浩司
    三井 祥幹
    鳥居 崇
    中川 達也
    高橋 敏
    加藤 集平
    栗原 清
    小坂 哲夫
    井上 昂治
    森 大毅
    小林 彰夫
    松田 健

進化するヒトと機械の音声コミュニケーション Vol.2-AIの活用と感情に寄り添う音声認識・合成の新展開 の商品スペック

商品仕様
出版社名:エヌ・ティー・エス
著者名:伊藤彰則ほか29名(著・文・その他)
発行年月日:2025/04/12
ISBN-13:9784860439361
判型:B5
発売社名:エヌ・ティー・エス
対象:専門
発行形態:単行本
内容:情報科学
言語:日本語
ページ数:280ページ
他のエヌ・ティー・エスの書籍を探す

    エヌ・ティー・エス 進化するヒトと機械の音声コミュニケーション Vol.2-AIの活用と感情に寄り添う音声認識・合成の新展開 [単行本] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!