[发明专利]一种语音识别方法及系统在审
申请号: | 201810433565.7 | 申请日: | 2018-05-08 |
公开(公告)号: | CN108696768A | 公开(公告)日: | 2018-10-23 |
发明(设计)人: | 关广鹏;刘江 | 申请(专利权)人: | 北京恒信彩虹信息技术有限公司 |
主分类号: | H04N21/4415 | 分类号: | H04N21/4415;G10L17/22;G10L17/20 |
代理公司: | 北京卓特专利代理事务所(普通合伙) 11572 | 代理人: | 陈变花 |
地址: | 100097 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹 语音识别 语音 现场语音 技术效果 现场环境 语音处理 语音信息 语音指令 预先建立 保证 优选 剥离 采集 指令 说话 身份 申请 转化 | ||
本申请公开了一种语音识别方法及系统,语音识别方法的步骤为:采集多个现场语音数据;将每个现场语音数据的声纹与预先建立的语音声纹库中的声纹进行对比,找出相同的声纹;根据语音声纹库找出该声纹对应的身份。从而达到能够保证在现场环境嘈杂或者说话人数较多时,能够清楚的识别出特定人的语音,并有效保证识别精确度高,对确定的优选识别语音进行语音处理,提取、剥离转化为单个语音信息,生成语音指令,有效保证了需要执行指令的准确性的技术效果。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音识别方法及系统。
背景技术
现有技术方案中,当语音识别现场比较嘈杂或者同时说话的人数较多时,无法很好的识别想要识别的人的语音,识别精度很低,不能保证识别语音清晰和准确。另一种方案,语音识别时,需要进行深度算法,对于设备要求非常高,成本昂贵,且当现场嘈杂或多人同时说话时,同样不能区分设定人,且易受到嘈杂环境的影响,难以保证识别出的语音的清晰度和准确度。
发明内容
本发明的目的在于提供一种语音识别方法及系统,以达到能够保证在现场环境嘈杂或者说话人数较多时,能够清楚的识别出特定人的语音,并有效保证识别精确度高,对确定的优选识别语音进行语音处理,提取、剥离转化为单个语音信息,生成语音指令,有效保证了需要执行指令的准确性的技术效果。
为达到上述目的,本发明采用如下技术方案:
一种语音识别方法的步骤为:采集多个现场语音数据;将每个现场语音数据的声纹与预先建立的语音声纹库中的声纹进行对比,找出相同的声纹;根据语音声纹库找出该声纹对应的身份。
进一步的,根据身份确定语音识别优先级的排序,并优先识别优先级高的身份对应的现场语音数据。
进一步的,建立语音声纹库的方法具体为:设定特定人的身份;根据输入提示,该身份的特定人进行语音数据录入;将语音数据与对应身份进行绑定;根据身份设定语音识别的优先级顺序。
优选的,对优先识别语音数据的处理方法具体为:根据语音声纹库中身份的声纹将采集到的现场语音数据中的优先识别语音数据全部提取、剥离转化为单个语音信息;根据转化后的单个语音信息内容判断需要执行的语音内容,生成语音指令。
进一步的,语音指令至少包括播放视频、关闭视频。
进一步的,语音声纹库存储于云端数据库。
进一步的,语音数据通过语音采集装置采集。
进一步的,语音数据通过麦克风采集。
一种语音识别系统,包括机顶盒和分别与机顶盒连接的显示装置、语音采集装置和云端数据库,机顶盒用于执行语音识别方法,显示装置执行机顶盒发送的语音指令。
进一步的,语音采集装置为麦克风。
本发明的有益效果是:该语音识别方法通过建立语音声纹库,设定识别语音优先级顺序,能够保证在现场环境嘈杂或者说话人数较多时,能够清楚的识别出特定人的语音,并有效保证识别精确度高,对确定的优选识别语音进行语音处理,提取、剥离转化为单个语音信息,生成语音指令,有效保证了需要执行指令的准确性的技术效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为一种语音识别方法的流程图;
图2为一种语音识别系统的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京恒信彩虹信息技术有限公司,未经北京恒信彩虹信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810433565.7/2.html,转载请声明来源钻瓜专利网。