[发明专利]一种语音识别方法及系统在审

申请号：	201810433565.7	申请日：	2018-05-08
公开（公告）号：	CN108696768A	公开（公告）日：	2018-10-23
发明（设计）人：	关广鹏;刘江	申请（专利权）人：	北京恒信彩虹信息技术有限公司
主分类号：	H04N21/4415	分类号：	H04N21/4415;G10L17/22;G10L17/20
代理公司：	北京卓特专利代理事务所(普通合伙) 11572	代理人：	陈变花
地址：	100097 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声纹语音识别语音现场语音技术效果现场环境语音处理语音信息语音指令预先建立保证优选剥离采集指令说话身份申请转化
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种语音识别方法及系统，语音识别方法的步骤为：采集多个现场语音数据；将每个现场语音数据的声纹与预先建立的语音声纹库中的声纹进行对比，找出相同的声纹；根据语音声纹库找出该声纹对应的身份。从而达到能够保证在现场环境嘈杂或者说话人数较多时，能够清楚的识别出特定人的语音，并有效保证识别精确度高，对确定的优选识别语音进行语音处理，提取、剥离转化为单个语音信息，生成语音指令，有效保证了需要执行指令的准确性的技术效果。

技术领域

本发明涉及语音识别技术领域，尤其涉及一种语音识别方法及系统。

背景技术

现有技术方案中，当语音识别现场比较嘈杂或者同时说话的人数较多时，无法很好的识别想要识别的人的语音，识别精度很低，不能保证识别语音清晰和准确。另一种方案，语音识别时，需要进行深度算法，对于设备要求非常高，成本昂贵，且当现场嘈杂或多人同时说话时，同样不能区分设定人，且易受到嘈杂环境的影响，难以保证识别出的语音的清晰度和准确度。

发明内容

本发明的目的在于提供一种语音识别方法及系统，以达到能够保证在现场环境嘈杂或者说话人数较多时，能够清楚的识别出特定人的语音，并有效保证识别精确度高，对确定的优选识别语音进行语音处理，提取、剥离转化为单个语音信息，生成语音指令，有效保证了需要执行指令的准确性的技术效果。

为达到上述目的，本发明采用如下技术方案：

一种语音识别方法的步骤为：采集多个现场语音数据；将每个现场语音数据的声纹与预先建立的语音声纹库中的声纹进行对比，找出相同的声纹；根据语音声纹库找出该声纹对应的身份。

进一步的，根据身份确定语音识别优先级的排序，并优先识别优先级高的身份对应的现场语音数据。

进一步的，建立语音声纹库的方法具体为：设定特定人的身份；根据输入提示，该身份的特定人进行语音数据录入；将语音数据与对应身份进行绑定；根据身份设定语音识别的优先级顺序。

优选的，对优先识别语音数据的处理方法具体为：根据语音声纹库中身份的声纹将采集到的现场语音数据中的优先识别语音数据全部提取、剥离转化为单个语音信息；根据转化后的单个语音信息内容判断需要执行的语音内容，生成语音指令。

进一步的，语音指令至少包括播放视频、关闭视频。

进一步的，语音声纹库存储于云端数据库。

进一步的，语音数据通过语音采集装置采集。

进一步的，语音数据通过麦克风采集。

一种语音识别系统，包括机顶盒和分别与机顶盒连接的显示装置、语音采集装置和云端数据库，机顶盒用于执行语音识别方法，显示装置执行机顶盒发送的语音指令。

进一步的，语音采集装置为麦克风。

本发明的有益效果是：该语音识别方法通过建立语音声纹库，设定识别语音优先级顺序，能够保证在现场环境嘈杂或者说话人数较多时，能够清楚的识别出特定人的语音，并有效保证识别精确度高，对确定的优选识别语音进行语音处理，提取、剥离转化为单个语音信息，生成语音指令，有效保证了需要执行指令的准确性的技术效果。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为一种语音识别方法的流程图；

图2为一种语音识别系统的结构示意图。

具体实施方式

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京恒信彩虹信息技术有限公司，未经北京恒信彩虹信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810433565.7/2.html，转载请声明来源钻瓜专利网。

上一篇：弹幕播放方法、装置、计算机可读存储介质和终端
下一篇：一种全局消息提示方法及装置

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视
H04N21-00 可选的内容分发，例如交互式电视，VOD〔视频点播〕
H04N21-20 .专门适用于内容分发的专用服务器，例如：VOD服务器；其操作
H04N21-40 .专门适用于接收内容或者与内容交互的客户端设备，如STB[机顶盒]；相关操作
H04N21-60 .用于在服务器和客户端之间或者在远程客户端之间的视频分配的网络结构或者处理
H04N21-80 .通过内容产生器独立于分配过程实现的内容或附加数据的生成或处理；内容本身
H04N21-81 ..其单媒体部件

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种语音识别方法及系统在审

专利文献下载