序一
序二
前言
基礎篇
第1章語音閤成技術史的敘述
1.1機械式語音閤成器
1.1.1Kempelen的講話機
1.1.2Euphonia講話機
1.2電子式語音閤成器
1.2.1VODER
1.2.2模式播放器
1.2.3共振峰閤成器
1.3基於計算機的語音閤成
1.3.1數字式共振峰語音閤成技術
1.3.2波形拼接閤成技術
1.4漢語語音閤成的發展
1.4.1漢語閤成研究的先驅
1.4.2國內漢語閤成技術的研究
1.5總結
參考文獻
附錄閤成語音樣品
第2章聲學語音學
2.1聲學基礎
2.1.1空氣中的聲波
2.1.2波動方程
2.1.3聲音在管子中的傳播
2.2言語交際過程
2.2.1語音的産生
2.2.2語音的感知
2.3語音的聲學特徵
2.3.1語音的時間維及頻率維錶示
2.3.2頻譜分析
2.3.3語圖和語音的頻譜分析方法
2.3.4元音的頻譜
2.3.5輔音的頻譜
2.3.6音軌
2.4漢語普通話的音位係統
2.4.1漢語普通話的輔音係統
2.4.2漢語普通話的元音係統
2.4.3漢語傳統的聲韻調係統
2.5總結
參考文獻
第3章韻律
3.1語調模型
3.1.1“調核”理論和INTSINT語調模型
3.1.2Pierrehumbert有限狀態網絡模型
3.1.3Tilt語調模型
3.1.4Fujisaki模型
3.1.5PENTA模型
3.2漢語普通話韻律的基本單元
3.2.1詞調
3.2.2短語語調
3.3句調和篇章韻律
3.3.1語篇語調
3.3.2朗讀風格的影響
3.4總結
參考文獻
第4章漢語文語轉換係統
4.1閤成語音自然度的研究
4.1.1閤成語音自然度實驗
4.1.2音聯對自然度的影響
4.1.3漢語語句重音的聲學錶現
4.2漢語共振峰閤成係統
4.2.1係統框圖
4.2.2閤成單元
4.2.3語言學處理
4.2.4韻律設計
4.2.5聲學處理
4.3基音同步波形疊加閤成
4.3.1PSOLA算法
4.3.2漢語的韻律——播音風格言語的聲學分析
4.3.3KX-PSOLA漢語文語轉換係統的韻律模型
4.3.4高清晰度高自然度KX-PSOLA漢語文語轉換係統
4.3.5《聯想佳音》
4.4總結
參考文獻
專題篇
第5章普通話的節律和重音的實驗研究
5.1基於大規模語料庫的韻律研究
5.1.1語料庫的設計原則
5.1.2語料庫的後期加工
5.1.3語料庫的實體
5.2普通話的節律組織
5.2.1節律組織中的自由度
5.2.2節律組織規則
5.3普通話的重音標注、分類及分配
5.3.1重音的知覺強度標注
5.3.2重音強度的三級標注
5.3.3語義重音與節奏重音
5.3.4重音的分布與韻律邊界
5.3.5總結
參考文獻
第6章基於大規模語料庫的波形拼接閤成
6.1韻律控製策略
6.1.1全控製策略
6.1.2半控製策略
6.1.3軟控製策略
6.2基於韻律軟控製策略的TTS係統的結構
6.3單元選擇和波形拼接的策略和方法
6.3.1音節關聯的上下文矢量
6.3.2上下文矢量的距離
6.4建立語音特徵覆蓋完備的言語數據庫
6.4.1音庫覆蓋率與規模
6.4.2言語數據波形的采集和標注
6.4.3標注精度對閤成自然度的影響
6.4.4基於上下文相關邊界模型的自動切分方法
6.4.5音段波形的直接拼接閤成
6.4.6小結
6.5木蘭-漢英雙語TTS係統
6.5.1木蘭的結構
6.5.2統一的文本標準化模塊
6.5.3語言檢測和分發模塊及單元提取模塊
6.5.4言語數據庫
6.5.5小結
6.6更多應用
6.6.1個性化TTS係統
6.6.2領域自適應TTS
6.6.3互聯網個性化語音服務
6.7總結
參考文獻
第7章波形拼接閤成語料庫生成技術
7.1錄音腳本的設計
7.1.1音段特徵覆蓋
7.1.2韻律特徵覆蓋
7.2發音人的挑選
7.2.1發音人性彆的選擇
7.2.2發音人年齡的限製
7.2.3發音人籍貫的選擇
7.2.4音色的要求
7.2.5專業水平的考查
7.2.6發音人的工作時間保證
7.2.7候選發音人人數的考慮
7.2.8候選人的發音評估
7.3音庫錄製
7.3.1錄音室
7.3.2錄音設備
7.3.3錄音程序
7.4數字錄音材料的處理
7.4.1復審
7.4.2標音
7.5總結
參考文獻
第8章語音閤成係統的質量評估
8.1語音輸齣係統質量評估方法
8.1.1音節清晰度測試
8.1.2詞和句的可懂度測試
8.1.3語句和篇單的整體性能測試
8.1.4評測的原則
8.2漢語語音閤成質量評估
8.2.11994年“863”漢語語音閤成係統評測
8.2.21995年漢語語音閤成係統評價方法
8.3國傢語言文字工作委員會漢語語音閤成係統評測
8.3.12004年漢語語音閤成係統評價方法
8.3.22004年的評測結果和分析
8.4MOS和PC評估方法的比較
8.4.1測試文本和測試條件
8.4.2MOS評估
8.4.3PC測試
8.4.4MOS和PC評測比較結果
8.5漢語閤成語音評測新方法探索
8.6總結
參考文獻
附錄2004年評估測試語料
第9章展望
9.1STRAIGHT分析閤成技術
9.2基於HMM的語音閤成
9.2.1係統的框圖
9.2.2訓練集及參數提取
9.2.3HMM模型化
9.2.4基於上下文聚類的決策樹
9.2.5言語閤成
9.3從概念到語音的閤成
9.3.1SOLE係統
9.3.2SOCS係統
9.4多語種閤成係統
9.5口語翻譯係統
9.6總結
參考文獻
後記
· · · · · · (
收起)