日本全国スピードお届け実施中！配達料金無料

JavascriptがOFFになっております。 ヨドバシ・ドット・コムはJavascriptをONにしてご利用ください。詳しくはこちらへ。

カテゴリから選ぶ

画像にマウスを合わせると上部に表示

音声変換入門―Pythonで作って学ぶボイスチェンジャー [単行本]

齋藤佑樹(著)、中村泰貴(著)

【合計12％還元】書籍の購入はゴールドポイントカード・プラスのクレジット決済がお得です。
通常3％ゴールドポイント還元のところ、後日付与されるクレジット決済ポイント（1％）と特典ポイント（6％）、さらにご利用明細WEBチェックにご登録いただくと2％追加して合計12％ゴールドポイント還元！詳しくはこちら

価格：	￥3,960（税込）
ゴールドポイント：	119 ゴールドポイント（3％還元）（￥119相当）
フォーマット：	単行本￥3,960 119 ゴールドポイント（3％還元）電子書籍￥3,960 792 ゴールドポイント（20％還元）
お届け日：	在庫あり今すぐのご注文で、2026年7月27日月曜日までにヨドバシエクストリームサービス便（無料）がお届けします。［届け先変更］詳しくはこちら

出版社：	講談社
販売開始日：	2026/04/11
お取り扱い：	のお取り扱い商品です。
バリエーション：	音声変換入門―Pythonで作って学ぶボイスチェンジャー [単行本] 5件のバリエーションがあります
ご確認事項：	返品不可

カテゴリランキング

書籍
152006位

数量

ショッピングカートに入れる

お気に入りに登録する

在庫のある店舗0

店舗受け取りが可能です

マルチメディアAkiba、マルチメディア梅田、マルチメディア博多では24時間営業時間外でもお受け取りいただけますマルチメディア池袋では朝6:00〜23:30の間、営業時間外でもお受け取りいただけます

お客様へのおすすめ【PR】

ITエンジニアのためのMarkdown実践入門―生成AI時代の"伝わる"書き方 [単行本]

￥2,640
80 ゴールドポイント
在庫あり
2026年7月27日月曜日までにヨドバシエクストリームサービス便がお届け

作って学ぶSpring Boot入門 [単行本]

￥2,970
90 ゴールドポイント
在庫あり
2026年7月27日月曜日までにヨドバシエクストリームサービス便がお届け

（1）

モバイルアプリ開発の知識地図―一冊でiOS/Android/Flutterの開発技術が学べる本 [単行本]

￥3,080
93 ゴールドポイント
在庫あり
2026年7月27日月曜日までにヨドバシエクストリームサービス便がお届け

うんこドリルもっとプログラミング小学1-6年生 [全集叢書]

￥1,265
38 ゴールドポイント
在庫あり
2026年7月28日火曜日までにヨドバシエクストリームサービス便がお届け

音声変換入門―Pythonで作って学ぶボイスチェンジャーの商品概要

要旨（「BOOK」データベースより）
理論から実践まで／基礎から最先端まで一気通貫！音響学・機械学習の初歩からはじまり、Ｄｉｆｆｕｓｉｏｎ　Ｔｒａｎｓｆｏｒｍｅｒによる音声変換の実装まで至る！
目次
［第1部　統計的機械学習に基づく音声言語情報処理］
第1章　音声言語情報処理
1.1　音声言語情報処理とは何か
1.2　人間の音声生成
1.3　人間の音知覚
1.4　音声言語データの特徴抽出

第2章　統計的機械学習
2.1　音声から何かを学習するということ
2.2　統計的機械学習の手引き
2.3　分類タスク
2.4　回帰タスク

第3章　深層ニューラルネットワークの基礎
3.1　単純パーセプトロンから多層パーセプトロンへ
3.2　多層パーセプトロンからDNNへ
3.3　深層生成モデル

第4章　実践して学ぶ音声言語情報処理
4.1　Google ColaboratoryでのPythonプログラミング
4.2　多話者音声コーパスのダウンロードと分析
4.3　PyTorchでの深層学習実装

［第2部　統計的音声変換の基礎と応用］
第5章　深層学習による音声変換の基礎
5.1　音声変換の定義と分類
5.2　作って学ぶ深層学習によるパラレル音声変換
5.3　作って学ぶ深層学習によるノンパラレル音声変換

第6章　音声変換を取り巻く技術と社会的側面
6.1　処理タイミングによる音声変換の分類
6.2　変換対象話者の指定方法による音声変換の分類
6.3　変換先話者の学習データ量による分類
6.4　社会への影響
6.5　法的な視点

第7章　正規化フローに基づく音声変換
7.1　FreeVCの概要と特徴
7.2　FreeVCのアーキテクチャ
7.3　事前エンコーダ
7.4　事後エンコーダと潜在変数zの推定
7.5　デコーダと波形出力
7.6　話者エンコーダ
7.7　音声変換モデル全体
7.8　識別器
7.9　スペクトログラムリサイズによるデータ拡張
7.10　訓練手順と損失関数
7.11　推論時の流れ

第8章　フローマッチングに基づく音声変換モデル
8.1　ゼロショット音声変換
8.2　SeedVCの特徴と強み
8.3　拡散トランスフォーマー
8.4　フローマッチング
8.5　SeedVCの学習と推論
出版社からのコメント
最先端の音声変換を支える技術について、音響学・機械学習の基礎から実装まで一気通貫（ｅｎｄ－ｔｏ－ｅｎｄ）に解説！
内容紹介
音響学・機械学習の基礎から積み上げ、Diffusion Transformerによる音声変換の実装まで至る。
基礎から最先端まで一気通貫に解説！

《目次》
［第1部　統計的機械学習に基づく音声言語情報処理］
第1章　音声言語情報処理
1.1　音声言語情報処理とは何か
1.2　人間の音声生成
1.3　人間の音知覚
1.4　音声言語データの特徴抽出

第2章　統計的機械学習
2.1　音声から何かを学習するということ
2.2　統計的機械学習の手引き
2.3　分類タスク
2.4　回帰タスク

第3章　深層ニューラルネットワークの基礎
3.1　単純パーセプトロンから多層パーセプトロンへ
3.2　多層パーセプトロンからDNNへ
3.3　深層生成モデル

第4章　実践して学ぶ音声言語情報処理
4.1　Google ColaboratoryでのPythonプログラミング
4.2　多話者音声コーパスのダウンロードと分析
4.3　PyTorchでの深層学習実装

［第2部　統計的音声変換の基礎と応用］
第5章　深層学習による音声変換の基礎
5.1　音声変換の定義と分類
5.2　作って学ぶ深層学習によるパラレル音声変換
5.3　作って学ぶ深層学習によるノンパラレル音声変換

第6章　音声変換を取り巻く技術と社会的側面
6.1　処理タイミングによる音声変換の分類
6.2　変換対象話者の指定方法による音声変換の分類
6.3　変換先話者の学習データ量による分類
6.4　社会への影響
6.5　法的な視点

第7章　正規化フローに基づく音声変換
7.1　FreeVCの概要と特徴
7.2　FreeVCのアーキテクチャ
7.3　事前エンコーダ
7.4　事後エンコーダと潜在変数zの推定
7.5　デコーダと波形出力
7.6　話者エンコーダ
7.7　音声変換モデル全体
7.8　識別器
7.9　スペクトログラムリサイズによるデータ拡張
7.10　訓練手順と損失関数
7.11　推論時の流れ

第8章　フローマッチングに基づく音声変換モデル
8.1　ゼロショット音声変換
8.2　SeedVCの特徴と強み
8.3　拡散トランスフォーマー
8.4　フローマッチング
8.5　SeedVCの学習と推論
著者紹介（「BOOK著者紹介情報」より）（本データはこの書籍が刊行された当時に掲載されていたものです）
齋藤佑樹(サイトウユウキ)
博士（情報理工学）。東京大学大学院情報理工学系研究科　講師。２０１４年に釧路工業高等専門学校を卒業。２０１６年に同高専専攻科を修了。２０２１年に東京大学大学院情報理工学系研究科博士課程を修了。２０２４年より現職。統計的機械学習理論に基づく音声合成・声質変換の研究に従事

中村泰貴(ナカムラタイキ)
Ｐａｒａｋｅｅｔ株式会社代表取締役　ＣＥＯ／東京大学大学院博士課程　在籍。２０１７年に福島工業高等専門学校を卒業。２０２０年に東京大学工学部を卒業。２０２２年に東京大学大学院情報理工学系研究科修士課程を修了。２０２２年にＰａｒａｋｅｅｔ株式会社を創業。音声合成・声質変換の研究および社会実装に従事
著者について
齋藤佑樹 (サイトウユウキ)
齋藤佑樹
東京大学大学院情報理工学系研究科講師。2014年に釧路工業高等専門学校を卒業。2016年に同高専専攻科を修了。2021年に東京大学大学院情報理工学系研究科博士課程を修了。2024年より現職。博士（情報理工学）。統計的機械学習理論に基づく音声合成・声質変換の研究に従事。

中村泰貴 (ナカムラタイキ)
中村泰貴
Parakeet株式会社代表取締役CEO／東京大学大学院博士課程在籍。2017年に福島工業高等専門学校を卒業。2020年に東京大学工学部を卒業。2022年に東京大学大学院情報理工学系研究科修士課程を修了。2022年にParakeet株式会社を創業。音声合成・声質変換の研究および社会実装に従事。

音声変換入門―Pythonで作って学ぶボイスチェンジャーの商品スペック

商品仕様	出版社名：講談社
	著者名：齋藤佑樹（著）／中村泰貴（著）
	発行年月日：2026/04/09
	ISBN-10：4065426375
	ISBN-13：9784065426371
	判型：B5
	対象：専門
	発行形態：単行本
	内容：電子通信
	言語：日本語
	ページ数：272ページ
	縦：24cm
他の講談社の書籍を探す	書籍講談社 > 情報･通信･コンピュータ講談社 > プログラミング講談社 > プログラミング講談社

コミュニティ
0
レビューを投稿する

講談社音声変換入門―Pythonで作って学ぶボイスチェンジャー [単行本] に関するレビューとＱ＆Ａ

商品に関するご意見やご感想、購入者への質問をお待ちしています！

音声変換入門―Pythonで作って学ぶボイスチェンジャー [単行本]

カテゴリランキング

あわせて買いたい、よく一緒に購入されている商品

お客様へのおすすめ【PR】

音声変換入門―Pythonで作って学ぶボイスチェンジャーの商品概要

要旨（「BOOK」データベースより）

目次

出版社からのコメント

内容紹介

著者紹介（「BOOK著者紹介情報」より）（本データはこの書籍が刊行された当時に掲載されていたものです）

著者について

音声変換入門―Pythonで作って学ぶボイスチェンジャーの商品スペック

コミュニティ

カテゴリから選ぶ

メーカーから商品を選ぶ

イベントから商品を選ぶ

特集から商品を選ぶ

はじめてのお客様へ

アフターサービス

お買い物をもっと便利に

音声変換入門―Pythonで作って学ぶボイスチェンジャー [単行本]

カテゴリランキング

あわせて買いたい、よく一緒に購入されている商品

お客様へのおすすめ【PR】

音声変換入門―Pythonで作って学ぶボイスチェンジャー の 商品概要

要旨（「BOOK」データベースより）

目次

出版社からのコメント

内容紹介

著者紹介（「BOOK著者紹介情報」より）（本データはこの書籍が刊行された当時に掲載されていたものです）

著者について

音声変換入門―Pythonで作って学ぶボイスチェンジャー の商品スペック

コミュニティ

カテゴリから選ぶ

メーカーから商品を選ぶ

イベントから商品を選ぶ

特集から商品を選ぶ

はじめてのお客様へ

アフターサービス

お買い物をもっと便利に

音声変換入門―Pythonで作って学ぶボイスチェンジャーの商品概要

音声変換入門―Pythonで作って学ぶボイスチェンジャーの商品スペック