Pythonで学ぶ音声認識 機械学習実践シリーズ(インプレス) [電子書籍]
    • Pythonで学ぶ音声認識 機械学習実践シリーズ(インプレス) [電子書籍]

    • ¥3,850770 ゴールドポイント(20%還元)
    • すぐ読めます
100000086601333076

Pythonで学ぶ音声認識 機械学習実践シリーズ(インプレス) [電子書籍]

価格:¥3,850(税込)
ゴールドポイント:770 ゴールドポイント(20%還元)(¥770相当)
フォーマット:
専用電子書籍リーダアプリ「Doly」が必要です。無料ダウンロード
出版社:インプレス
公開日: 2021年05月20日
すぐ読めます。
お取り扱い: のお取り扱い商品です。
ご確認事項:電子書籍リーダーアプリ「Doly」専用コンテンツ
こちらの商品は電子書籍版です

Pythonで学ぶ音声認識 機械学習実践シリーズ(インプレス) の 商品概要

  • 「音声認識」とは、音声信号から発話内容を認識することで、AIスピーカなどに利用されている技術です。本書は、現在までの音声認識技術の発展経緯を学びながら、深層学習を用いた最新の音声認識システムを実装できるようになることを目的としています。まず手法の目的やアルゴリズムの概要を解説し、続いて数式レベルでの詳説、最後にソースコード付きで実装という流れで解説しています。特に手法の概要については「そもそもその手法は何を目的として生み出されたのか」という経緯と、「なぜその手法は前述の目的を達成できるのか」について直感的に理解できるよう工夫しています。本書は中級者以上に向けた、特定の技術分野のアルゴリズムの紹介と、それを実装したコードを解説する、より技術的・実践的な「機械学習実践シリーズ」です。
  • 目次

    表紙
    本書の前提
    目次
    序章
    第1章 音声認識とは?
    第1節 音声認識とは? どんなことに使える?
    第2節 音声を認識するとは?─音声認識のしくみ─
    第3節 本書の目的と構成
    第2章 音声認識の基礎知識
    第1節 音声認識と確率
    第2節 音声認識の問題を数式で定義する
    第3節 テキストの種類と発音辞書-音素・かな・文字・単語-
    第4節 2種類の音声認識実験
    第5節 音声認識実験の大まかな流れ
    第3章 音声処理の基礎と特徴量抽出
    第1節 データの準備
    第2節 音声ファイルを読み込んでみよう
    第3節 フーリエ変換を使って音声を周波数分解しよう
    第4節 音声を短時間フーリエ変換してスペクトログラムを作成しよう
    第5節 対数メルフィルタバンク特徴量
    第6節 メル周波数ケプストラム特徴量
    第7節 特徴量の平均と標準偏差を計算してみよう
    第4章 音声認識の初歩-DPマッチング-
    第1節 音声認識につきまとう、アライメント問題
    第2節 DPマッチング
    第3節 DPマッチングを実装してみよう
    第5章 GMM-HMMによる音声認識
    第1節 テンプレートから分布と尤度という考え方へ
    第2節 正規分布と最尤推定法によるパラメータ推定
    第3節 混合正規分布(GMM)とEMアルゴリズム
    第4節 隠れマルコフモデル(HMM)
    第5節 GMM-HMMを実装してみよう
    第6章 DNN-HMMによる音声認識
    第1節 分布からディープニューラルネットワークへ
    第2節 ディープニューラルネットワーク
    第3節 DNNとHMMを組み合わせたDNN-HMMハイブリッドシステム
    第4節 DNN-HMMをPythonとPytorchで実装してみよう
    第5節 HMMベース方式における大語彙連続音声認識
    第7章 End-to-Endモデルによる連続音声認識
    第1節 ハイブリッドシステムからフルニューラルネットワークモデルへ
    第2節 リカレントニューラルネットワーク
    第3節 Connectionist temporal classification(CTC)
    第4節 CTCをPythonとPytorchで実装してみよう
    第5節 Attention encoder-decoderモデル
    第6節 AttentionモデルをPythonとPytorchで実装してみよう
    第7節 その他のテクニックと音声認識モデル
    第8節 参考文献
    おわりに
    索引
    著者プロフィール
    奥付

Pythonで学ぶ音声認識 機械学習実践シリーズ(インプレス) の商品スペック

発行年月日 2021/05/20
Cコード 3055
出版社名 インプレス
本文検索
他のインプレスの電子書籍を探す
紙の本のISBN-13 9784295011385
ファイルサイズ 259.9MB
著者名 高島 遼一
著述名 著者

    インプレス Pythonで学ぶ音声認識 機械学習実践シリーズ(インプレス) [電子書籍] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!