[发明专利]一种针对地区语言使用偏好的语音识别优化系统及其方法无效
申请号: | 200810029904.1 | 申请日: | 2008-07-31 |
公开(公告)号: | CN101329868A | 公开(公告)日: | 2008-12-24 |
发明(设计)人: | 陈铮陶;林超 | 申请(专利权)人: | 林超 |
主分类号: | G10L15/28 | 分类号: | G10L15/28;G10L15/22 |
代理公司: | 广州市华学知识产权代理有限公司 | 代理人: | 李卫东 |
地址: | 510640广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 地区 语言 使用 偏好 语音 识别 优化 系统 及其 方法 | ||
技术领域
本发明电话语音识别技术,具体是指一种针对地区语言使用偏好的语音识别优化系统及其方法。
背景技术
近年来,语音识别技术已经取得了巨大的进展。目前世界上最先进的电话语音识别系统——Nuance8.5在针对中小词汇量的孤立词(Isolate Words)的识别率已经达到95%左右。95%的识别率在满足用户使用这一层面上来说也仅仅只是合格的标准,从产品的用户体验和服务质量的角度出发,可能会要求语音识别系统有更加精准识别效果。这样,语音识别系统的优化,有效地提高语音识别系统的识别率,也成为了许多科研工作者和语音识别引擎开发厂商的一个主攻的课题。
行业内对于语音识别的优化,往往着眼点都只在于识别算法的改进,然而这种识别优化的方法仍然有一定的局限性,例如,实际的识别率提升的空间比较有限,容易出现瓶颈;涉及到复杂的算法的话,CPU的占用率高、运算时间长,对于硬件设备的依赖太大。鉴于此,算法改进的语音识别优化方案在实际的行业应用中,成本较高、效益较低。
发明内容
本发明的目的就是为了解决和克服现有技术存在的问题和缺陷,提供针对地区语言使用偏好的语音识别优化系统,其经一定时间的运营后,通过统计所积累的词汇使用记录数据,按照不同地区用户对词汇选项使用偏好设置语法权重后,系统对小词汇量的孤立词的识别率能够提升至98%,能够有效地突破算法优化的瓶颈,而且更加适应于行业应用的需要。
本发明的另一目的是提供上述系统的针对地区语言使用偏好的语音识别优化方法。
本发明的目的通过下述技术方案实现:本针对地区语言使用偏好的语音识别优化系统,包括所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块、电话语音识别系统,所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块设置在计算机内;所述词汇表创建归类模块、语法模型初始化模块、电话语音识别系统、词汇使用记录模块、词汇数据库、语法权重计算与语法模型生成模块依次连接,且所述电话语音识别系统通过PSTN(Public Switched Telephone Network,公共交换电话网络)或者Internet(采用VoIP:Voice over Internet Protocol,互联网协议语音技术)与语音输入输出设备连接。
为更好地实现本发明,电话语音识别系统包括依次连接的IVR应用模块、自动语音识别(ASR)模块、语法包模块,自动语音识别模块与所述词汇使用记录模块连接,语法包模块与所述语法模型初始化模块连接,IVR应用模块通过PSTN或者Internet(采用VoIP)与语音输入输出设备连接。
所述语音输入输出设备包括固定电话、移动电话、IP电话。
采用上述针对地区语言使用偏好的语音识别优化系统的语音识别优化方法,其包括以下步骤:
(1)词汇表创建归类模块根据语音识别的归类条件,将词汇选项归入各个词汇分类中,建立词汇表数据库;
(2)语法模型初始化模块根据所述词汇表数据库中的词汇分类及词汇选项的相应数据,为每个省区的每一个词汇分类相应生成一个电话语音识别系统的语法包,所述语法包里包含着归属于此词汇分类的所有词汇选项;
(3)当用户使用电话语音识别系统时,电话语音识别系统的IVR应用模块可以根据用户呼入电话的号码判断出该号码所属的省区的信息,并连同用户所应答的语音信息、当前IVR节点所属的词汇分类信息一起推送到电话语音识别系统的自动语音识别模块,自动语音识别模块将根据省区的信息和词汇分类的信息调用相对应语法包,对电话的语音信息进行自动识别;
(4)当语法包中的某一词汇选项被成功识别后,自动语音识别模块将识别成功的词汇的信息推送到词汇使用记录模块,通过词汇使用记录模块在词汇数据库中增加一条词汇使用的记录,同时把省区以及该词汇选项所属的分类的信息写入该记录相应的字段中;
(5)语法权重计算与语法模型生成模块以省区为单位对词汇数据库的记录进行统计,计算出每个分类中各词汇选项在各自所属的分类中使用频率百分比, 根据这个百分比来计算出词汇选项的权重系数,并最终将带权重系数的词汇选项更新到各自的语法包中;
(6)当用户再次使用该电话语音识别系统时,自动语音识别模块将根据省区的信息和词汇分类的信息调取调整了权重参数的语法包,用户将可获得准确率更高的语音识别的效果,从而实现针对地区语言使用偏好的语音识别优化过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于林超,未经林超许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810029904.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:汽车玻璃升降器开关
- 下一篇:快速制备SiC纳米线的方法