日本全国スピードお届け実施中！配達料金無料

JavascriptがOFFになっております。 ヨドバシ・ドット・コムはJavascriptをONにしてご利用ください。詳しくはこちらへ。

カテゴリから選ぶ

音声変換入門 Pythonで作って学ぶボイスチェンジャー（講談社） [電子書籍]

画像を投稿する

専用電子書籍リーダーアプリ「Doly」の
無料ダウンロードはこちら

音声変換入門 Pythonで作って学ぶボイスチェンジャー（講談社） [電子書籍]

中村泰貴(著者)、齋藤佑樹(著者)

価格：	￥3,960（税込）
ゴールドポイント：	792 ゴールドポイント（20％還元）（￥792相当）
フォーマット：	電子書籍￥3,960 792 ゴールドポイント（20％還元）単行本￥3,960 119 ゴールドポイント（3％還元）専用電子書籍リーダーアプリ「Doly」が必要です。無料ダウンロード

出版社：	講談社
公開日：	2026年04月23日すぐ読めます。
お取り扱い：	のお取り扱い商品です。
バリエーション：	音声変換入門 Pythonで作って学ぶボイスチェンジャー（講談社） [電子書籍] 5件のバリエーションがあります
ご確認事項：	電子書籍リーダーアプリ「Doly」専用コンテンツ

こちらの商品は電子書籍版です

ショッピングカートに入れる
「今すぐ買う」でご注文する場合は
ログインしてご利用ください

お気に入りに登録する

音声変換入門 Pythonで作って学ぶボイスチェンジャー（講談社）の商品概要

音響学・機械学習の基礎から積み上げ、Diffusion Transformerによる音声変換の実装まで至る。
基礎から最先端まで一気通貫に解説！

《目次》
［第1部　統計的機械学習に基づく音声言語情報処理］
第1章　音声言語情報処理
1.1　音声言語情報処理とは何か
1.2　人間の音声生成
1.3　人間の音知覚
1.4　音声言語データの特徴抽出

第2章　統計的機械学習
2.1　音声から何かを学習するということ
2.2　統計的機械学習の手引き
2.3　分類タスク
2.4　回帰タスク

第3章　深層ニューラルネットワークの基礎
3.1　単純パーセプトロンから多層パーセプトロンへ
3.2　多層パーセプトロンからDNNへ
3.3　深層生成モデル

第4章　実践して学ぶ音声言語情報処理
4.1　Google ColabolatoryでのPythonプログラミング
4.2　多話者音声コーパスのダウンロードと分析
4.3　PyTorchでの深層学習実装

［第2部　統計的音声変換の基礎と応用］
第5章　深層学習による音声変換の基礎
5.1　音声変換の定義と分類
5.2　作って学ぶ深層学習によるパラレル音声変換
5.3　作って学ぶ深層学習によるノンパラレル音声変換

第6章　音声変換を取り巻く技術と社会的側面
6.1　処理タイミングによる音声変換の分類
6.2　変換対象話者の指定方法による音声変換の分類
6.3　変換先話者の学習データ量による分類
6.4　社会への影響
6.5　法的な視点

第7章　正規化フローに基づく音声変換
7.1　FreeVCの概要と特徴
7.2　FreeVCのアーキテクチャ
7.3　事前エンコーダ
7.4　事後エンコーダと潜在変数zの推定
7.5　デコーダと波形出力
7.6　話者エンコーダ
7.7　音声変換モデル全体
7.8　識別器
7.9　スペクトログラムリサイズによるデータ拡張
7.10　訓練手順と損失関数
7.11　推論時の流れ

第8章　拡散モデルに基づく音声変換モデル
8.1　ゼロショット音声変換
8.2　SeedVCの特徴と強み
8.3　拡散トランスフォーマー
8.4　フローマッチング
8.5　SeedVCの学習と推論
目次
［第1部　統計的機械学習に基づく音声言語情報処理］
第1章　音声言語情報処理
1.1　音声言語情報処理とは何か
1.2　人間の音声生成
1.3　人間の音知覚
1.4　音声言語データの特徴抽出

第2章　統計的機械学習
2.1　音声から何かを学習するということ
2.2　統計的機械学習の手引き
2.3　分類タスク
2.4　回帰タスク

第3章　深層ニューラルネットワークの基礎
3.1　単純パーセプトロンから多層パーセプトロンへ
3.2　多層パーセプトロンからDNNへ
3.3　深層生成モデル

第4章　実践して学ぶ音声言語情報処理
4.1　Google ColaboratoryでのPythonプログラミング
4.2　多話者音声コーパスのダウンロードと分析
4.3　PyTorchでの深層学習実装

［第2部　統計的音声変換の基礎と応用］
第5章　深層学習による音声変換の基礎
5.1　音声変換の定義と分類
5.2　作って学ぶ深層学習によるパラレル音声変換
5.3　作って学ぶ深層学習によるノンパラレル音声変換

第6章　音声変換を取り巻く技術と社会的側面
6.1　処理タイミングによる音声変換の分類
6.2　変換対象話者の指定方法による音声変換の分類
6.3　変換先話者の学習データ量による分類
6.4　社会への影響
6.5　法的な視点

第7章　正規化フローに基づく音声変換
7.1　FreeVCの概要と特徴
7.2　FreeVCのアーキテクチャ
7.3　事前エンコーダ
7.4　事後エンコーダと潜在変数zの推定
7.5　デコーダと波形出力
7.6　話者エンコーダ
7.7　音声変換モデル全体
7.8　識別器
7.9　スペクトログラムリサイズによるデータ拡張
7.10　訓練手順と損失関数
7.11　推論時の流れ

第8章　フローマッチングに基づく音声変換モデル
8.1　ゼロショット音声変換
8.2　SeedVCの特徴と強み
8.3　拡散トランスフォーマー
8.4　フローマッチング
8.5　SeedVCの学習と推論

音声変換入門 Pythonで作って学ぶボイスチェンジャー（講談社）の商品スペック

Cコード	3055
出版社名	講談社
本文検索	可
紙の本のISBN-13	9784065426371
他の講談社の電子書籍を探す	電子書籍講談社 > 情報･通信･コンピュータ講談社 > プログラミング講談社 > プログラミング講談社

ファイルサイズ	41.5MB
著者名	中村泰貴
著者名	齋藤佑樹
著述名	著者

コミュニティ
0
レビューを投稿する

講談社音声変換入門 Pythonで作って学ぶボイスチェンジャー（講談社） [電子書籍] に関するレビューとＱ＆Ａ

商品に関するご意見やご感想、購入者への質問をお待ちしています！

音声変換入門 Pythonで作って学ぶボイスチェンジャー（講談社） [電子書籍]

あわせて買いたい、よく一緒に購入されている商品

音声変換入門 Pythonで作って学ぶボイスチェンジャー（講談社）の商品概要

目次

音声変換入門 Pythonで作って学ぶボイスチェンジャー（講談社）の商品スペック

コミュニティ

カテゴリから選ぶ

メーカーから商品を選ぶ

イベントから商品を選ぶ

特集から商品を選ぶ

はじめてのお客様へ

アフターサービス

お買い物をもっと便利に

音声変換入門 Pythonで作って学ぶボイスチェンジャー（講談社） [電子書籍]

あわせて買いたい、よく一緒に購入されている商品

音声変換入門 Pythonで作って学ぶボイスチェンジャー（講談社） の 商品概要

目次

音声変換入門 Pythonで作って学ぶボイスチェンジャー（講談社） の商品スペック

コミュニティ

カテゴリから選ぶ

メーカーから商品を選ぶ

イベントから商品を選ぶ

特集から商品を選ぶ

はじめてのお客様へ

アフターサービス

お買い物をもっと便利に

音声変換入門 Pythonで作って学ぶボイスチェンジャー（講談社）の商品概要

音声変換入門 Pythonで作って学ぶボイスチェンジャー（講談社）の商品スペック