基于韵律的蒙古语语音合成研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
本研究基于大规模语音数据库,采取语音实验的方法考察了蒙古语语音合成中遇到的韵律问题。文章主要由三个部分组成:一是开展了面向蒙古语合成的大规模语音数据库和电子词典等基础资源的建设工作;二是细致描写了蒙古语连续话语中的音节结构变化现象,包括音段的增加和脱落以及由此引起的音节重组问题,并在此基础上探讨了蒙古语口语和书面语的音节对应关系以及音段增减变化和话语韵律结构之间的关系问题;三是深入考察了蒙古语在朗读条件下的韵律组织结构问题,并从音高和音长等基本声学参数入手,对韵律词和韵律短语在朗读话语中的实际表现进行了细致考察,揭示出音高曲拱这一语音声学特征在韵律短语分析过程中的重要作用。
     本研究得到的结论主要有:
     一、研制了一套面向蒙古语语音合成的字音转写符号系统,该系统包括词首、词中、词末位置出现的50个元音(包括长元音、短元音、二合元音)符号和27个辅音(基本辅音和借词辅音)符号,并从语音区别特征方面对每个音素进行了描写和区分。语音合成结果表明本文对蒙古语音段系统的描写和区分是有效和必要的,系统而细致的音素分类能在一定程度上改善合成语音的可懂度。
     二、在连续话语中,词的多个读音在语义、语法、语用三个层面上存在差异。在具体的语境中,每个多音字的读音具有唯一性,根据这一特点,在字音转写过程中可以有效地区分多音字。没有区别词义也不存在语法和语用特征的多音字属于读音规范化范畴的问题,有进一步整理合并的必要。
     三、在单词层面上,蒙古语单音节词在口语和书面语中的音节结构基本一致,而针对双音节词的书面语读音与口语读音之间的不对应性,本研究细致归纳出了音节结构变化的12条规律。多音节词在口语中的音节结构变化从词末音节开始往前变,并遵循双音节词的音节结构变化规律。在蒙古语口语中,音节重组与音节中的元音类型以及该音节在词中的位置有一定的联系:短元音音节的结构容易发生变化,而长元音音节和二合元音音节的结构比较稳定;词首音节(不包括单音节词)的结构比较稳定,词中音节和词末音节相对容易发生音节重组。根据这一特点,本研究把蒙古语口语中的音节分为稳定音节与易变音节,并认为在蒙古语语音合成的字音转写中易变音节是转写的重点和难点。
     四、在连续话语层面上,引起音节结构变化的主要因素是名词附加成分和词缀化虚词,这些附加成分或虚词在书写形式上与其他成分是分开的、但在口语读音中却往往不能单独构成一个独立音节。它们在连读后发生的音节重组规律与单词内部的音节变化规律基本一致。当名词附加成分的音节类型是V、C、 VLC时,需要借助其前置音节的辅音来构成独立音节。当附加成分的音节类型是CVL时,其表现比较稳定,在连读时能单独构成词末音节。蒙古语口语中的音段脱落和增加、音节重组等现象与话语的韵律结构有一定的联系:韵律词是此类音变现象的作用域,名词与名词附加成分之间发生的音节重组以及音段增加和脱落等现象通常发生在韵律词内部。因此,可以把名词附加成分看做预测韵律词边界的有用线索。研究结果还表明,词缀化虚词的韵律作用域存在一定区别:虚词“(?)”的作用域是韵律词,虚词“(?)”的韵律作用域是韵律短语,虚词“(?)”和“(?)”的作用域是语调短语。
     五、本研究发现,在正常朗读的陈述句中,每个韵律短语一般都包含一个相对独立完整的音高曲拱,有且仅只有一个音高峰值,在此之前音高呈上升走势,在此之后音高呈下降走势,并且一般会一直延续到韵律短语的结束位置。这种“低-高-低”的音高变化模式构成了一个个相对独立完整的音高曲拱,起始于韵律短语之首,结束于韵律短语之末。根据这一发现,本研究认为,当一个语句内部既无标点符号又无显著停顿时,可在一定程度上参考音高的变化走势来帮助确定其内部的韵律短语边界位置:韵律短语边界往往处于两个音高曲拱的交界处。数据统计结果还表明,韵律短语边界前音节会有一定的延长。另外,词末弱短元音也是预测韵律短语边界的重要语音事件。
     六、韵律词边界处没有可明显感知到的停顿,也没有明显的延长。韵律词内部的每个音节的时长分布与该音节在韵律词内的位置有一定关系:尾音节时长>首音节时长>中间音节时长。韵律词在韵律短语中的位置会影响韵律词的长度,通常韵律短语边界处的韵律词时长比韵律短语中间位置上的韵律词时长略长。韵律词在韵律短语中的位置会影响韵律词的音高特性。根据统计,韵律词主要有以下4种组构方式:(1)1至5个音节的单个语法词;(2)并列关系的两个单音节语法词;(3)1至4音节的语法词和一个单音节虚词的组合;(4)处于韵律短语边界位置的单音节语法词或功能词。
     七、语音合成结果表明,在增加韵律短语和韵律词的切分信息之后,能够在一定程度上改善合成语音的自然度。但由于目前用于训练的韵律切分语料还相对较少,所以导致合成语音的自然度提升效果不够显著。但作者相信,随着对蒙古语韵律特性的研究逐渐深入,以及在训练过程中不断增加包含韵律切分信息的语料,将有可能合成出高质量、高自然度的蒙古语语音。
Based on large-scale speech corpus and phonetic experiments, this paper examined Mongolian prosody issue in Mongolian speech synthesis. The paper consists of three parts. The first part is about resources construction of large-scale Mongolian speech synthesis-based speech corpus and E-dictionary. The second part inspects syllabic structure changes in Mongolian discourse such as segment adding, dropping and re-organizing and explores syllabic corresponding relation between spoken and writing Mongolian and the relation between segment adding&dropping and prosodic structure of discourse. The third part studies prosodic structure of reading Mongolian. Through checking basic acoustic parameters such as pitch and duration, the paper made comprehensive inspection on prosodic words and prosodic phrase and proposes that pitch contour plays important role in dividing prosodic phrase. Followings are main conclusions of the paper:
     A. We proposed a set of Phonetic Transcription Symbols used in Mongolian speech synthesis including50vowels (long, short and compound) in word-initial, median, final positions and27consonants (basic consonants and borrowed consonants), which are described and differentiated in phonetic contrast features. Mongolian speech synthesis results indicate that these descriptions and differentiations are effective and improve understanding level of synthesized speech.
     B. In discourse, the multiple pronunciations of words differentiate in syntax, grammar and pragmatic. In specific context, however, the pronunciation of polyphone is sole, which can be used to differentiate polyphones. Some polyphones, which have neither meaning contrast, nor grammar and pragmatic features, belong to pronunciation normalization issue and should be integrated.
     C. In terms of word level, syllabic structures of monosyllabic words of spoken and writing Mongolian are almost same. There are12syllabic structure-changing rules for disyllabic words between spoken and writing Mongolian. In polysyllabic spoken Mongolian words, syllabic structure changes begin from the final syllable to the initial, keeping same syllabic structure changing rules with disyllabic words. In spoken Mongolian, syllabic structure is variable for syllable with short vowel. Syllables with Long vowel and diphthong are stable. Word-initial syllables are stable. Based on these findings, syllables of spoken Mongolian can be divided into stable and variable. In Mongolian synthesis, transcription of words in variable syllables is vital.
     D. In continuous speech, the primary factors causing syllabic structure change are noun supplements and affixed function words, which cannot constitute independent syllable in spoken Mongolian. For sentence and words, syllabic re-organizing rules are same. When syllabic type of affixed elements is V, C, VLC, consonant of previous syllable constitutes independent syllable. CVL is very stable and can be word-final syllable. Segment dropping and adding of spoken Mongolian, syllabic re-organizing and prosodic structure of discourse are related. Syllabic re-organizing, adding and dropping of segments all happen in prosodic words. Affixed noun elements are useful phonetic clues to predict prosodic word boundary. Action scopes of prosody of four function words are different:for function word "uAE(?)u", it is prosodic phrase; for function words "(?)" and "(?)", it is intonation phrase; for function word "(?)", it is prosodic words in sentence.
     E. In declarative discourse at normal reading speed, every prosodic phrase has a complete pith contour and a pitch peak. Pitch contour goes up before the pitch peak and goes down after that, forming L-H-L pitch pattern, which begins at initial of prosodic phrase and ends at final of prosodic phrase. Therefore, this paper concludes that when a sentence has neither punctuation mark nor evident pause, prosodic phrase boundary is at the intersection of two pitch contours. Statistics show that previous syllable of prosodic phrase prolongs at some extent. In addition, word-final schwa is also stress cue to predict prosodic phrase boundary.
     F. Prosodic word boundary has neither evident pause nor lengthening. Within prosodic words, syllabic duration and syllabic position are related:duration of final syllable> duration of initial syllable> duration of medial syllable. Duration of prosodic words at prosodic phrase boundary is a little bit longer than those at the medial of prosodic phrase. Syllabic position at prosodic phrase affects pitch pattern of prosodic words. Based on statistics data, there are four types of prosodic words:1) Grammar words of one-five syllables.2) Two parallel monosyllables grammar words.3) Grammar words of one-four syllables and monosyllable function words.4) Monosyllabic grammar words or function words at prosodic phrase boundary.
     G. Speech synthesis results show that segmenting cues of prosodic phrase and words can improve naturalness of synthesized speech at some extent. However, due to small size of speech corpus of prosody transcription, improvement of naturalness of synthesized speech is limited. We believe that, with advancing of Mongolian prosody research and more speech corpus with prosodic transcription, it is possible that high quality and high naturalness of synthesized Mongolian speech can be achieved.
引文
1内蒙古大学蒙古学学院蒙古语文研究所编, 《现代蒙古语》,2005年版。
    2清格尔泰, 《蒙古语语法》,1991年版。
    4宝玉柱,孟和宝音,现代蒙古语正蓝旗土语音节研究,中央民族大学学报,2008年第五期。
    [1]Aijun Li, Prosodic boundary perception in spontaneous speech of standard chinese,Report of phonetic research,2003
    [2]Grant,K.W.&Walden,B.E.. Spectral Distribution of Prosodic Information. Journal of Speech and Hearing Research,1996,39:228 - 238
    [3]GAOguanglai, HE min and ZHAO siqin,research and implementation of Mongolian text to speech, ICSP'02 Proceedings
    [4]Hayes. The prosodic hierarchy in meter[G]//P KIPARSKY,GYOUMANS. Phonetics and phonology:rhythm and meter. SanDiego,CA:Academic Press,201-260
    [5]Huhe, Baoguilan, EPG Based Research on Tongue Position and Its Constraint of Word-Initial Consonants in Standard Mongolian in China, The 17th International Congress of Phonetic Sciences Hong Kong, August 17-21,2011
    [6]Lehiste,I..Suprasegmentals.MIT Press,1970
    [7]LEUNG Y W, WANG Yu-ping. An orthogonal genetic algorithm with quantization for global numerical optimization[J].IEEE Trans on Evolutionary Computation,2001,5 (1):41-53.
    [8]Li Aijun, Chinese prosody prosodic labeling of spontaneous speech, Report of phonetic research, 2002
    [9]Liu Yabin Li Aijun, Cues of prosodic boundaries in Chinese spontaneous speech, Report of phonetic research,2003
    [10]Maolin Wang,Maocan Lin, An analysis of pitch Chinese spontaneous speech, Report of phonetic research,2003
    [11]Pierrehumbert,J..The Phonology and Phonetics of English Intonation.PHD thesis,Massachusetts Institute of Technology,Cambridge,MA,1980
    [12]Pijper,Jan Roelof de & Sanderman,Angelien A. On the Perceptual Strength of Prosodic Boundaries and Its Relation to Suprasegmental Cued. Journal of Acoustical Society of America,1994,96(4)
    [13]Qian,Y.,Chu,M.and Peng,Hu.2001."Segmenting unrestricted Chinese text into prosodic words instead of lexical words", ICASSP20001
    [14]Schmidt, I. J.1831. Grammatik der Mongolischen Sprache. St. Petersburg
    [15]Scott, D. R.. Durantion as a Cue to the Perception of Phrase Boundary.Journal of the Acoustic Societh of Ameraca,1982,71(4):996 - 1007
    [16]Selkirk, Elisabeth. On the prosodic structure and its relation to syntactic structure[R]. Nordic prosody II. Trondheim:TAPIR,1978
    [17]Streeter,L.A,.Acoustic Determinants of Phrase Boundary Perception.Journal of the Acoustic Society of America,1978,64(6):1582-1592
    [18]Streeter L A.A Acoustic determinants of phrase boundary perception. Journal Acoustic of Society of America,1978;64(6):1582-1592
    [19]Tseng Chiu-yu et al. Fluent Spechh Prosody:Framework and Modeling. Speech Communication.2005,46:284 - 309
    [20]WU Zhiyong,CAO Guangqi,MENG M.Helen,CAI Lianhong, A Unified Framework for
    [21]Zec Draga.Sonorit constraints on prosodic structure[D].Stanford:Stanford University,1989
    [22]Zhang Hongming. Topics in Chinese phrasal tonology[D].San Diego:University of California,1992
    [23]艾霞.面向语音识别的蒙古言模型的研究,呼和浩特:内蒙古大学,2007年6月.
    [24]阿拉坦.蒙古语布里亚特土语元音声学分析[D].呼和浩特:内蒙古大学,2006年6月.
    [25]阿拉坦,布里亚特语单词自然节奏模式[A].第八届中国语音学学术会议[C],2008年4月,北京.
    [26]敖敏.蒙古语肃北土语元音声学研究[D].呼和浩特:内蒙古大学,2008年6月.
    [27]敖登格日乐.蒙古语元音和谐律声学分析[D].呼和浩特:内蒙古大学,2009年6月.
    [28]敖敦其木格.对蒙古语辅音的生理和声学分析[D].呼和浩特:内蒙古大学,2004年5月.
    [29]白希吉日乐特.关于同形词和多义词的辨别方法.蒙古语文[J],1995年12月.
    [30]白梦璇.蒙古语阿拉善土语元音声学分析[D].呼和浩特:内蒙古大学,2005年5月.
    [31]白音门德.关于巴林、科尔沁土语词重音.蒙古语文(蒙文版)[J],1997年第6期.
    [32]白音门德.关于巴林、察哈尔、科尔沁土语依附元音及其央化问题.内蒙古大学学报(蒙文版)[J],1997年第3期,pp.30-37.
    [33]宝音套格套胡.关于同形词,蒙古语文学[J],1989年2月.
    [34]包世恩.蒙古语非特定人大词汇量连语音识别系统的研究与实现[D].呼和浩特:内蒙古大学,2005年6月.
    [35]包桂兰.蒙古语协同发音初探.内蒙古大学学报[J],2009年3期增刊.
    [36]包桂兰.蒙古语擦辅音实验语音学研究[D].呼和浩特:内蒙古大学,2007年6月.
    [37]毕力格图.基于HMM建模的蒙古语连语音识别系统的研究与实现[D].呼和浩特:内蒙古大学,2006年6月.
    [38]蔡连红.崔丹丹.蔡锐.汉语普通话语音合成语料库TH-CoSS的建设和分析.中文信息学报[J],2007年2期.
    [39]蔡连红.蔡锐.吴志勇.陶建华.语音合成语料库的设计与声学特征分析[A].中国声学学会2002年全国声学学术会议[C],2002年9月,桂林.
    [40]曹晓东.HTS汉语合成及其自然度的研究[D].大连:大连理工大学,2006年6月.
    [41]曹剑芬.韵律结构与语音的变化.南京师范大学文学院学报[J],2011年3期.
    [42]曹剑芬.音段延长的不同类型及其韵律价值.南京师范大学文学院学报[J],2005年4期.
    [43]曹剑芬.普通话语音的环境音变与双音子和三音子结构.语言文字应用[J],1996年2期.
    [44]曹剑芬.汉语韵律切分的语音学和语言学线索[A].新世纪的现代语音学—第五届现代语音学学术会议论文集[C],北京:清华大学出版社,2001年P184-187.
    [45]查娜.蒙古语鄂尔多斯土语元音声学分析[D].呼和浩特:内蒙古大学,2001年5月.
    [46]陈晨.陈琪.李永宏.于洪志.藏语语音合成语料库的韵律标注规则设计.西北民族大学学报[J],2010年第2期.
    [47]陈肖霞.对连续话语中语音变化类型的初步分析.语音研究报告[J],2004年.
    [48]陈肖霞.语音变化问题研究.语音研究报告[J],2005年.
    [49]陈明.吕士楠.汉语自然语流中的音高变化.第七届全国人机语音通讯学术会议[C],2003年11月,厦门.
    [50]初敏.陈一宁.赵勇.李愈胜.语料库标注精度对合成语音自然度的影响[A].第七届中国语音学学术会议暨语音学前沿问题国际论坛论文集[C],2006年10月,p374-380,北京.
    [51]初敏.自然言语的韵律组织中的不确定性及其在语音合成中的应用.中文信息学报[J],2004年第4期.
    [52]初敏.吕士楠.一种高清晰度高自然度的汉语文语转换系统.声学学报[J],1996年4期.
    [53]初敏.高清晰度高自然度汉语文语转换系统的研究[D].北京:中国科学院声学所1995年6月.
    [54]崔刚.盛永梅.语料库中语料的标注.清华大学学报(哲学社会科学版)[J],2000年第1期.
    [55]邓丹.石峰.普通话韵律词内部下倾度的初步分析.南开语言学刊[J],2009年1期.
    [56]董宏辉.陶建华.浅析汉语韵律短语中的稳定结构[A].第七届中国语音学学术会议暨语音学沿问题国际论坛[C],2006年10月,北京.
    [57]额勒森其其格.蒙古语正字法的问题.内蒙古师范大学学报(蒙文版)[J],2011年3期.
    [58]飞龙.蒙古语语音识别系研究与优化.呼和浩特:内蒙古大学,2009年6月.
    [59]冯胜利.论汉语的“韵律词”.中国社会科学[J],1996年1期.
    [60]高·照日格图.不同词类的词汇用于人名时的音变现象.内蒙古社会科学(蒙文版)[J],1991年第2期.
    [61]高光来.孟和吉雅.姗丹.基于词汇的蒙古语文语转换的实验.内蒙古大学学报(自然科学版)[J],2000年1期.
    [62]哈斯其木格.蒙古语的复辅音问题.民族语文[J],2006年第3期.
    [63]哈斯其木格.基于EPG的蒙古语双辅音研究[A].《民族语文》创刊30周年学术研讨会[C],2009年8月,北京.
    [64]哈斯其木格.刘佳.蒙古语复辅音初探[A].第十届全国少数民族语言文字信息处理学术研讨会[C],2005年7月,p374-380,青海.
    [65]哈斯其木格.蒙古语复辅音问题.民族语文[J],2006年第3期.
    [66]哈斯其木格.蒙古语辅音送气前移实验研究[A].第八届中国语音学学术会议[C],2008年月,北京.
    [67]哈斯其乐.面向语音识别的蒙古声学模型的研究[D].呼和浩特:内蒙古大学,2008年6月.
    [68]贺林.初敏.吕士楠.钱瑶.冯勇强.汉语合成语料库的韵律层级标注研究[A].第五届全国现代语音学学术会议[C],2001年9月,北京.
    [69]何敏.高光来.赵斯琴.蒙古语文语转换系统的研究与实现.内蒙古大学学报(自然科学版)[J],2004年1期.
    [70]红梅.哈穆尼堪人所使用的蒙古语元音声学分析[D].呼和浩特:内蒙古大学,2009年6月.
    [71]胡伟湘.徐波.黄泰翼.汉语韵律边界的声学实验研究.中文信息学报[J],2002年1期.
    [72]胡红彦.哈斯其木格.呼和.蒙古语/1/辅音实验研究[A].第九届中国语音学学术会议[C],2010年5月,天津.
    [73]胡红彦.哈斯其木格.呼和.蒙古语/1/辅音实验研究[A].第九届中国语音学学术会议[C],2010年5月,天津.
    [74]黄载禄.姬丽按.规则合成无限词汇汉语语声的研究.声学学报[J],1990年第3期.
    [75]呼和.蒙古语辅音腭化问题研究.民族语文[J],2005年第2期.
    [76]呼和.关于蒙古语词末弱短元音.内蒙古大学学报(蒙文版)[J],1996年第3期.
    [77]呼和.关于蒙古语的音节问题.民族语文[J],1998年第4期.
    [78]呼和.哈斯其木格.面向语音合成的蒙古语韵律特征研究框架[A].全国第11届少数民族语言文字信息处理学术研讨会论文集[C],西双版纳:中国中文信息学会民族语言文字信息专委会2007年P271-279.
    [79]呼和.陶建华.格根塔娜.张淑芹.蒙古语单词自然节奏模式[A].第七届中国语音学学术会议暨语音学前沿问题国际论坛[C],2006年10月,北京.
    [80]呼和.陶建华.蒙古语和蒙古语的合成[A].第九届全国人机语音通讯学术会议[C],2007年10月,黄山.
    [81]呼和.蒙古语语音实验研究新进展[A].中国民族语言学会第10届学术讨论会[C],2010年8月,银川.
    [82]呼和.蒙古语词重音问题.民族语文[J],2007年第4期.
    [83]胡伟湘.徐波.黄泰翼.汉语韵律边界的声学实验研究.中文信息学报[J],2002年第1期.
    [84]贾惠彬.陶建华.朗读语气韵律可变性分析及韵律自动评价初探[A].第八届中国语音学学术会议暨庆贺吴宗济先生百岁华诞语音科学前沿问题国际研讨会[C],2008年4月,北京.
    [85]李子殷.合成无限词汇汉语语言的初步研究.声学学报[J],1981年5期.
    [86]李爱军.普通话轻重音的时长特性及其合成规则.语音研究报告[J],1992年.
    [87]李爱军.普通话韵律短语的时长特性分析.语音研究报告[J],1998年.
    [88]刘俐李.近八十年汉语韵律研究回望.语文研究[J],2007年第2期.
    [89]刘浩杰.杜利民.语音合成技术的发展与展望.微计算机应用[J],2007年7月.
    [90]刘亚斌.李爱军.朗读语料与自然口语的差异分析.中文信息学报[J],2001年1期.
    [91]孟和吉雅.田会利.敖其尔.基于词干词缀的有限条词的蒙古语语音合成系统的研究[A].第七届中文信息处理国际会议[C],2007年10月,武汉.
    [92]孟和吉雅.白音门德.敖其尔.田会利.蒙古文语音合成技术研究[A].第十一届全国少族语言文字信息技术研讨会[C],2007年2月,西双版纳.
    [93]娜仁高娃.郭尔罗斯蒙古话与科尔沁、巴林土语元音声学比较研究[D].呼和浩特:内蒙古大学,2008年6月.
    [94]努尔比娅.塔依尔.面向语音合成的维吾尔语韵律层级自动标注算法研究[D].乌鲁木齐:新疆大学,2010年6月.
    [95]努尔比娅·塔依尔.艾斯卡尔·肉孜.古丽娜尔·艾力.地里木拉提·吐尔逊.维吾尔语陈述句韵律层级停顿模型研究.计算机与现代化[J],2010年7期.
    [96]其布热.蒙古语乌珠穆沁土语元音声学分析[D].呼和浩特:内蒙古大学,2006年6月.
    [97]钱瑶初.初敏.潘悟云.普通话韵律单元边界的声学分析[A].新世纪的现代语音学—第五届现代语音学学术会议论文集[C],北京:清华大学出版社,2001年P184-187.
    [98]清格尔泰.确精扎布.关于蒙语辅音.内蒙古大学学报[J](蒙文版),1959年第1期.
    [99]确精扎布.关于蒙古语的词重音问题[A].确精扎布论文集[C],2008年9月,p80-91,北京.
    [100]山丹.蒙古语标准音声学分析[D].呼和浩特:内蒙古大学,2007年6月.
    [101]邵艳秋.赵永贞.韩纪庆.刘挺.汉语文语转换中韵律词自动切分的研究[A].第七届全国人机语音通讯学术会议[C],2003年11月,厦门.
    [102]孙竹.现代蒙古语的弱化元音,民族语文[J],1981年1期.
    [103]陶建华.蔡连红.赵晟.汉语语音合成中的文本分析与韵律处理[A].辉煌二十年——中国中文信息学会二十周年学术会议论文集[C].北京:清华大学出版社,2001年,P272-279.
    [104]田会利.基于词干词缀的有限条词的蒙古语语音合成系统的研究[D].呼和浩特:内蒙古大学,2007年6月.
    [105]图雅.卫拉特方言实验语音学研究[D].呼和浩特:内蒙古大学,2007年.
    [106]图雅.土尔扈特土语元音固有音高初探[A].第九届中国语音学学术会议[C],2010年5月,天津.
    [107]王天庆.李爱军.连续汉语语音识别语料库的设计[A].第六届全国现代语音学学术会议[C],2003年10月,天津.
    [108]王秀君.和应民.陈立伟.汉语多元音语音合成.应用科技[J],2006年2期.
    [109]王洪君.汉语的韵律词和韵律短语.中国语文[J],2000年6期.
    [110]王温佳.初敏.贺琳.普通话语句重音在双音节韵律词中的分布.语言科学[J],2004年5期.
    [111]王茂林.林茂灿.普通话自然话语中的下倾.语音研究报告[J],2003年.
    [112]王蓓.杨玉芳.吕士楠.语篇中大尺度信息单元边界的声学线索.声学学报[J],2005年第2期.
    [113]王蓓.吕士捕.杨玉芳.汉语语句中重读音节音高变化模式研究.声学学报[J],2002年3期.
    [114]吴义坚.王仁华.基于HMM的可训练中文语音合成.中文信息学报[J],2006年4期.
    [115]乌吉斯古楞.呼和.蒙古语陈述句和疑问句语调比较研究[A].中国民族语言学会第10届学术讨论会[C],2010年8月,银川.
    [116]熊子瑜.基频重设与语流间断[A].新世纪的现代语音学—第五届现代语音学学术会议论文集[C],北京:清华大学出版社,2001年,P197-201.
    [117]熊子瑜.韵律研究的前言和特点.中国社会科学院院报[J],2006年7月27日第003版.
    [118]徐俊.蔡莲红.面向情感转换的层次化韵律分析与建模.清华大学学报(自然科学版)[J],2009年1期.
    [119]徐英莹.张培仁.粤语语音合成系统语料库设计研究.计算机工程[J],2005年14期.
    [120]杨玉芳.语句韵律结构知觉.声学学报[J],1998年2期.
    [121]杨鉴.纳西语语音合成的初步研究.云南大学学报(自然科学版)[J],1995年1期.
    [122]杨玉芳.黄贤军.高路.韵律特征研究.心理科学进展[J],2006年4期.
    [123]杨顺安.合成普通话语句的时长协调规则.语音研究报告[J],1991年.
    [124]伊·达瓦.蒙古语连续语音识别在不同结构语言模型下精度的讨论[A].第十届全国人机语通讯学术会议暨国际语音语言处理研讨会[C],2009年8月,兰州.
    [125]伊·达瓦1.[日]大川茂树2.[日]白井克彦1.蒙古语多方言语音识别及共享识别模型探索.中央民族大学学报[J],2001年4期.
    [126]伊·达瓦.张玉洁.上园一知等.蒙古语语言-文字的自动化处理.中文信息学报[J],2006年4期.
    [127]伊达瓦.[日]大川茂树.[日]白井克彦.蒙古语主要方言的声学和音律特征分析分类.民族[J],2001年第1期.
    [128]伊达瓦1.[日]大川茂树2.[日]白井克彦.蒙古语多方言语音识别及共享识别模型探索.中央民族大学学报[J],2001年第4期.
    [129]于鸿洋.苟大举.贺德.杨家沅.连续汉语语音合成的研究.第一届全国语言识别学术报告与展示会[C],1990年6月,北京.
    [130]玉梅.喀尔喀方言与察哈尔土语元音声学分析[D].呼和浩特:内蒙古大学,2009年6月.
    [131]张力.薛惠锋.吴晓军.李慜.中文TTS系统中多音字的一种解决方案.计算机应用软件[J],2008年第2期.
    [132]祖漪清.阎润强.韵律环境对声调目标实现的影响[A].第八届中国语音学学术会议暨庆贺吴宗济先生百岁华诞语音科学前沿问题国际研讨会[C],2008年4月,北京.
    [1]Harnud, H, Basic study of Mongolian prosody, Publications of the department of phonetics, University of Helsinki series A45ISBN 952-10-1347-8, ISSN 0357-5217,Hakapaino Oy,Helsinku 2003.
    [2]白音门德.巴林土语研究[M].呼和浩特:内蒙古人民出版社,1997年.
    [3]蔡连红.黄德智.蔡锐.现代语音技术基础与应用,北京:清华大学出版社,2003年.
    [4]曹剑芬.现代语音研究与探索[M].北京:商务印书馆,2007年.
    [5]曹剑芬.现代语音基础知识[M].北京:人民教育出版社,1990年.
    [6]曹文.汉语焦点重音的韵律实现[M].北京:北京语言大学出版社,2010年.
    [7]邓丹.汉语韵律词研究[M].北京:北京大学出版社,2010年.
    [8]冯胜利.汉语的韵律、词法与句法[M].北京:北京大学出版社,2009年.
    [9]呼和.确精扎布.蒙古语语音声学分析[M].呼和浩特:内蒙古大学出版社,1999年.
    [10]呼和.蒙古语语音实验研究[M].辽阳:辽宁民族出版社,2009年.
    [11]江荻.孔江平主编.中国民族语言工程研究新进展[M].北京:社会科学文献出版社,2005年.
    [12]李凤杰.英语韵律结构层次[M].天津:天津大学出版社,2011年.
    [13]林煮.王理嘉.语音学教程[M].北京:北京大学出版社,1992年.
    [14]罗常培.王均.普通语音学纲要[M].北京:商务印书馆,2002年.
    [15]内蒙古大学蒙古学学院蒙古语文研究所.现代蒙古语[M].呼和浩特:内蒙古人民出版社,1964年.
    [16]诺尔金.蒙古语标准音—察哈尔土语[M].呼和浩特:内蒙古人民出版社,2001年.
    [17]诺尔金.蒙古语标准音—察哈尔土语[M].呼和浩特:内蒙古人民出版社,2001年.
    [18]清格尔泰.蒙古语语法[M].呼和浩特:内蒙古人民出版社,1991年.
    [19]舍罗布苍旺丹.现代蒙古语(蒙古文版)[M].呼和浩特:内蒙古人民出版社,1961年.
    [20]石峰.语音格局[M].北京:商务印书馆,2008年.
    [21]石峰.实验音系学探索[M].北京:北京大学出版社,2009年.
    [22]王洪君.汉语非线性音系学[M].北京:北京大学出版社,1999年.
    [23]吴宗济.林茂灿.实验语音学概要[M].北京:高等教育出版社,1989年.
    [24]叶军.汉语语句韵律的语法功能[M].上海:华东师范大学出版社,2001年.