[发明专利]一种针对地区语言使用偏好的语音识别优化系统及其方法无效

专利信息
申请号: 200810029904.1 申请日: 2008-07-31
公开(公告)号: CN101329868A 公开(公告)日: 2008-12-24
发明(设计)人: 陈铮陶;林超 申请(专利权)人: 林超
主分类号: G10L15/28 分类号: G10L15/28;G10L15/22
代理公司: 广州市华学知识产权代理有限公司 代理人: 李卫东
地址: 510640广东省广州*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 针对 地区 语言 使用 偏好 语音 识别 优化 系统 及其 方法
【说明书】:

技术领域

发明电话语音识别技术,具体是指一种针对地区语言使用偏好的语音识别优化系统及其方法。 

背景技术

近年来,语音识别技术已经取得了巨大的进展。目前世界上最先进的电话语音识别系统——Nuance8.5在针对中小词汇量的孤立词(Isolate Words)的识别率已经达到95%左右。95%的识别率在满足用户使用这一层面上来说也仅仅只是合格的标准,从产品的用户体验和服务质量的角度出发,可能会要求语音识别系统有更加精准识别效果。这样,语音识别系统的优化,有效地提高语音识别系统的识别率,也成为了许多科研工作者和语音识别引擎开发厂商的一个主攻的课题。 

行业内对于语音识别的优化,往往着眼点都只在于识别算法的改进,然而这种识别优化的方法仍然有一定的局限性,例如,实际的识别率提升的空间比较有限,容易出现瓶颈;涉及到复杂的算法的话,CPU的占用率高、运算时间长,对于硬件设备的依赖太大。鉴于此,算法改进的语音识别优化方案在实际的行业应用中,成本较高、效益较低。 

发明内容

本发明的目的就是为了解决和克服现有技术存在的问题和缺陷,提供针对地区语言使用偏好的语音识别优化系统,其经一定时间的运营后,通过统计所积累的词汇使用记录数据,按照不同地区用户对词汇选项使用偏好设置语法权重后,系统对小词汇量的孤立词的识别率能够提升至98%,能够有效地突破算法优化的瓶颈,而且更加适应于行业应用的需要。 

本发明的另一目的是提供上述系统的针对地区语言使用偏好的语音识别优化方法。 

本发明的目的通过下述技术方案实现:本针对地区语言使用偏好的语音识别优化系统,包括所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块、电话语音识别系统,所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块设置在计算机内;所述词汇表创建归类模块、语法模型初始化模块、电话语音识别系统、词汇使用记录模块、词汇数据库、语法权重计算与语法模型生成模块依次连接,且所述电话语音识别系统通过PSTN(Public Switched Telephone Network,公共交换电话网络)或者Internet(采用VoIP:Voice over Internet Protocol,互联网协议语音技术)与语音输入输出设备连接。

为更好地实现本发明,电话语音识别系统包括依次连接的IVR应用模块、自动语音识别(ASR)模块、语法包模块,自动语音识别模块与所述词汇使用记录模块连接,语法包模块与所述语法模型初始化模块连接,IVR应用模块通过PSTN或者Internet(采用VoIP)与语音输入输出设备连接。 

所述语音输入输出设备包括固定电话、移动电话、IP电话。 

采用上述针对地区语言使用偏好的语音识别优化系统的语音识别优化方法,其包括以下步骤: 

(1)词汇表创建归类模块根据语音识别的归类条件,将词汇选项归入各个词汇分类中,建立词汇表数据库; 

(2)语法模型初始化模块根据所述词汇表数据库中的词汇分类及词汇选项的相应数据,为每个省区的每一个词汇分类相应生成一个电话语音识别系统的语法包,所述语法包里包含着归属于此词汇分类的所有词汇选项; 

(3)当用户使用电话语音识别系统时,电话语音识别系统的IVR应用模块可以根据用户呼入电话的号码判断出该号码所属的省区的信息,并连同用户所应答的语音信息、当前IVR节点所属的词汇分类信息一起推送到电话语音识别系统的自动语音识别模块,自动语音识别模块将根据省区的信息和词汇分类的信息调用相对应语法包,对电话的语音信息进行自动识别; 

(4)当语法包中的某一词汇选项被成功识别后,自动语音识别模块将识别成功的词汇的信息推送到词汇使用记录模块,通过词汇使用记录模块在词汇数据库中增加一条词汇使用的记录,同时把省区以及该词汇选项所属的分类的信息写入该记录相应的字段中; 

(5)语法权重计算与语法模型生成模块以省区为单位对词汇数据库的记录进行统计,计算出每个分类中各词汇选项在各自所属的分类中使用频率百分比, 根据这个百分比来计算出词汇选项的权重系数,并最终将带权重系数的词汇选项更新到各自的语法包中; 

(6)当用户再次使用该电话语音识别系统时,自动语音识别模块将根据省区的信息和词汇分类的信息调取调整了权重参数的语法包,用户将可获得准确率更高的语音识别的效果,从而实现针对地区语言使用偏好的语音识别优化过程。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于林超,未经林超许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810029904.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top