結合HMM 頻譜模型與ANN 韻律模型之國語語音合成系統 (A Mandarin Speech Synthesis System Combining HMM Spectrum Model and ANN Prosody Model) [In Chinese]

@inproceedings{Gu2010HMM,
  title={結合HMM 頻譜模型與ANN 韻律模型之國語語音合成系統 (A Mandarin Speech Synthesis System Combining HMM Spectrum Model and ANN Prosody Model) [In Chinese]},
  author={Hung-Yan Gu and Ming-Yen Lai and Sung-Fung Tsai},
  booktitle={ROCLING},
  year={2010}
}
本論文研究了一種結合 HMM (hidden Markov model)頻譜模型與 ANN (articifical neural network )韻律模型的國語語音合成系統。在訓練階段,對各個訓練語料音框算出 DCC 係數(discrete cepstrum coefficients),以作為頻譜特徵參數,接著對於一種音節的多 個發音,依 DTW (dynamic time warping)匹配出的頻譜演進路徑作分群,各群建立一個 HMM,並記錄各音節發音的文依性資訊。在合成階段,首先依據文依性資訊挑選出輸 入文句各音節的 HMM 模型,接著判定音節 HMM 的各個狀態為無聲、或有聲,然後使 用音長 ANN 模型及狀態平均音長來決定 HMM 各狀態應該產生的音框數。除了前人提 出的 MLE(maximum… CONTINUE READING