[发明专利]一种基于DIVA神经网络模型的汉语元音发音方法有效
申请号: | 201210239129.9 | 申请日: | 2012-07-10 |
公开(公告)号: | CN102880906A | 公开(公告)日: | 2013-01-16 |
发明(设计)人: | 张少白;刘欣;徐磊;徐歆冰 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06F3/14 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 许方 |
地址: | 210003 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于DIVA神经网络模型的汉语元音发音方法,利用DIVA神经网络模型对汉语元音目标进行分类学习训练并产生汉语元音发音,利用主元音方法建立汉语元音音素单元集,并将汉语元音音素单元集中的音素转换为共振峰频率的形式后映射到DIVA神经网络模型中,再随机输入汉语元音,对该汉语元音进行训练和学习,直到所有的汉语元音都被学习过为止,最后通过扬声器将汉语元音输出。该方法训练过程中精度高,最终实现模拟人体发出汉语元音。 | ||
搜索关键词: | 一种 基于 diva 神经网络 模型 汉语 元音 发音 方法 | ||
【主权项】:
一种基于DIVA神经网络模型的汉语元音发音方法,其特征在于利用DIVA神经网络模型对汉语元音目标进行分类学习训练并产生汉语元音发音,包括以下步骤:步骤1、通过麦克风采集所有的汉语元音,并获取所有汉语元音的共振峰频率;步骤2、利用主元音方法建立汉语元音音素单元集,并将汉语元音音素单元集中的音素转换为共振峰频率的形式后映射到DIVA神经网络模型中,初始所有的汉语元音音素单元集中的音素单元为未激活状态;步骤3、随机输入一个汉语元音的共振峰频率,对该汉语元音进行训练和学习,具体为:判断汉语元音音素单元集中是否存在与该汉语元音的共振峰频率相同的音素单元,若存在,则激活映射到DIVA神经网络模型中的汉语元音音素单元中相应的音素单元;若不存在,则不能产生相应的发音,结束对该汉语元音的训练;步骤4、再次随机输入一个汉语元音的共振峰频率,判断此汉语元音是否已经在DIVA神经网络模型中学习过,若已经学习过,则跳过训练过程,直接通过扬声器发出该激活状态的音素单元所对应的元音;否则对该汉语元音进行训练和学习,具体为:判断汉语元音音素单元集中是否存在与该汉语元音的共振峰频率相同的音素单元,若存在,则激活映射到DIVA神经网络模型中的汉语元音音素集中相应的音素单元;若不存在,则不能产生相应的发音,结束对该汉语元音的训练;重复执行步骤4直至所有汉语元音都训练和学习完毕为止;步骤5、利用DIVA神经网络模型将训练完成的所有汉语元音通过扬声器输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210239129.9/,转载请声明来源钻瓜专利网。