[发明专利]一种基于分类标识的智能语音识别方法、装置及相关设备在审

专利信息
申请号: 202111682776.2 申请日: 2021-12-31
公开(公告)号: CN114242042A 公开(公告)日: 2022-03-25
发明(设计)人: 龚晟;李洁;杨震;彭晓春;张建雄;陈璐 申请(专利权)人: 天翼物联科技有限公司
主分类号: G10L15/02 分类号: G10L15/02;G10L15/05;G10L15/06;G10L15/22;G10L15/26
代理公司: 深圳市精英专利事务所 44242 代理人: 冯筠
地址: 210000 江苏省南*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 分类 标识 智能 语音 识别 方法 装置 相关 设备
【说明书】:

发明公开了基于分类标识的智能语音识别方法、装置及相关设备,方法包括对语音原始数据进行端点检测和特征提取,以获得语音特征数据;通过输入语音原始数据时所附带的行业属性标识识别语音原始数据的行业属性;将语音特征数据通过训练好的通用语音识别模型进行识别得到识别结果;判断识别结果中的置信度是否低于预设值;将置信度低于预设值的对应的文本输入对应的行业垂直模块中进行优化识别;根据识别结果中的置信度和优化后的置信度,选择置信度最大值所对应的文本作为最终的识别结果。通过在输入语音原始数据的时候附带行业属性标识,方便在后续调用对应的行业垂直模块进行优化识别;无需人工标注,由二次校验识别修正来维持较高的准确率。

技术领域

本发明涉及人工智能自然语言处理的语音识别、语义理解技术领域,尤其涉及一种基于分类标识的智能语音识别方法、装置及相关设备。

背景技术

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。通用语音识别系统一般工作原理与流程包括:端点检测、特征提取技术、模式匹配准则、模型训练技术等方面。首先通过特征提取技术、模式匹配技术,识别出特定的声学模型;然后通过模型训练形成一定的语言模型。在建模的过程中需要大量的语音数据库以及语言数据库(涉及语言学知识)形成对应的声学模型和语言模型;实现过程则是在声学模型和语言模型组成的空间进行快速寻优,实现对语音信号的文字转变。

语义理解技术,即对文本形式的信息表达进行针对的理解,理解以文本表达信息的准确含义,相应的系统可以根据理解结果进行后续动作操作执行。

无论是语音识别或是语义理解技术都需要事先训练相应的模型,或指定相应的应用领域,提炼识别及理解模型,才能保证识别及理解的准确程度。

而在实际案例或应用过程中,比如面向垂直领域或专业应用的场景(比如电信、金融、理财等)下,由于相关专业领域场景的语言内容一般未事先进行过训练,往往识别效果不佳,一般不能直接调用。

垂直领域/特定行业一般采取独立建设专有语音识别引擎系统的方式实现,其问题在于:

1.专业系统建模需要大量行业内语音数据进行人工标注,以及针对性模型训练和优化,投入成本大,训练周期长,适应性低,并无法快速部署。

2.大部分行业语料因行业秘密等因素不愿意进行开放和共享;导致重复建设。

发明内容

本发明的目的是提供一种基于分类标识的智能语音识别方法、装置及相关设备,旨在解决现有技术中,人工标注导致成本大和周期长的问题。

第一方面,本发明实施例提供了一种基于分类标识的智能语音识别方法,包括:

S101,对语音原始数据进行端点检测和特征提取,以获得语音特征数据;

S102,通过输入所述语音原始数据时所附带的行业属性标识识别所述语音原始数据的行业属性;

S103,将所述语音特征数据通过训练好的通用语音识别模型进行识别得到识别结果;

S104,判断所述识别结果中的置信度是否低于预设值,若是,则执行步骤S105,若否,则执行步骤S107;

S105,根据所述行业属性,将置信度低于预设值的对应的文本输入对应的行业垂直模块中进行优化识别,得到优化后的置信度;

S106,根据识别结果中的置信度和优化后的置信度,选择置信度最大值所对应的文本作为最终的识别结果;

S107,输出识别结果。

第二方面,本发明实施例提供了一种基于分类标识的智能语音识别装置,其特征在于,包括:

特征提取单元,用于对语音原始数据进行端点检测和特征提取,以获得语音特征数据;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼物联科技有限公司,未经天翼物联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111682776.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top