[发明专利]一种基于姓氏的语音识别系统及方法在审
申请号: | 201711440127.5 | 申请日: | 2017-12-27 |
公开(公告)号: | CN108091325A | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 徐东群;庄永军 | 申请(专利权)人: | 深圳市三宝创新智能有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08;G10L15/18;G10L15/26 |
代理公司: | 深圳力拓知识产权代理有限公司 44313 | 代理人: | 龚健 |
地址: | 518055 广东省深圳市福田区华*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 姓氏 语音处理单元 语音识别系统 主控制单元 获取单元 模型单元 训练单元 语音 有效地实现 处理方式 系统计算 语音识别 识别率 准确率 混淆 汉字 | ||
1.一种基于姓氏的语音识别系统,包括主控制单元、语音获取单元、语音处理单元、姓氏模型单元和预训练单元:其特征在于,所述主控制单元分别连接语音获取单元、语音处理单元、姓氏模型单元和预训练单元。
2.根据权利要求1所示的一种基于姓氏的语音识别系统,其特征在于,所述语音获取单元为M6027麦克风。
3.根据权利要求1所示的一种基于姓氏的语音识别系统,其特征在于,所述语音处理单元分为声学模型特征提取模块、语言模型特征提取模块、混淆处理模块和单双姓氏处理模块。
4.一种基于姓氏的语音识别方法,其特征在于,包含以下步骤:
A、用户输入一串语音;
B、系统获取语音信号,通过声学模型对语音进行特征提取,在声学模型得出发音序列后,利用语言模型从候选文字序列中找出概率最大的字符串序列;
C、从汉字字符串序列中提取出表示姓氏的汉字,通过收集的全部汉字及其拼音字典,可将汉字转换为拼音,若其为多音字,只转换为其中某一个拼音;
D、如果该姓氏为单字姓氏,则将其拼音加入列表list,针对姓氏拼音做易混淆发音的处理,以及查找多音字的处理,并将结果全部保存到list中;
E、如果该姓氏为双字姓氏,则将两字姓氏中每个字的拼音单独取出进行易混淆发音的处理及查找多音,每个字都可得一个列表,将两个列表进行两两任意组合,找出这些拼音组合对应所有姓氏;
F、根据得到的拼音列表,可查找到每个拼音对应的姓氏汉字,列出说话人所表达的全部可能姓氏汉字;
G、最终获取对应姓氏汉字列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市三宝创新智能有限公司,未经深圳市三宝创新智能有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711440127.5/1.html,转载请声明来源钻瓜专利网。