[发明专利]一种提高远场语音识别率的方法、系统及可读存储介质在审

申请号：	201910262894.4	申请日：	2019-04-02
公开（公告）号：	CN110085258A	公开（公告）日：	2019-08-02
发明（设计）人：	陈文杰	申请（专利权）人：	深圳TCL新技术有限公司
主分类号：	G10L25/51	分类号：	G10L25/51;G10L21/0216;G10L15/26;G01S13/88;G01S5/06
代理公司：	深圳市君胜知识产权代理事务所(普通合伙) 44268	代理人：	王永文;刘文求
地址：	518000 广东省深圳市南山区***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声源拾音目标声源语音识别雷达远场波束特征信息智能电视干扰源可读存储介质存储介质方向定位技术检测角度跟踪精准定位前方物体实时调整实时定位实时扫描位置参数移动波达判定指向激活跟踪保证
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种提高远场语音识别率的方法、系统及存储介质。智能电视通过雷达实时扫描智能电视前方，获取前方物体的位置、移动及特征信息，通过波达方向定位技术检测和定位发出“激活词”的声源的方位，并通过雷达获取的特征信息判定声源是否为人，如果声源是人，则通过MIC阵列形成一个指向声源方向的窄的拾音波束进行拾音，通过雷达实时定位声源，拾音波束根据雷达提供的声源的位置参数实时调整角度跟踪声源，保证了拾音的稳定性。与现有技术干扰源和目标声源区分难，定位不精确，无法在目标声源移动时拾音相比较，本发明可以精准定位以及区分干扰源与目标声源，并能对目标声源进行跟踪，提高了远场语音识别率。

技术领域

本发明涉及一种智能电视技术，尤其涉及一种提高远场语音识别率的方法、系统及可读存储介质。

背景技术

随着智能电视技术的发展，AI逐渐成为电视产品的标配，实现语音交互也就成为AI智能电视发展的方向。目前市场上的AI智能电视，很多都支持语音交互功能。所谓远场语音，顾名思义就是在较远的地方（比如5米以外），AI智能电视等智能设备也可以听得清、听得懂用户的语音指令，是融合了AI语音搜索的一项改变用户体验的创新性交互功能，在远场语音交互中，如何在复杂的客厅环境中，用语音轻松唤醒操控智能电视设备成为极为重要的用户体验。远场语音识别需要前后端结合去完成：在前端，使用麦克风阵列，通过声源定位及自适应波束形成做语音增强，完成远场拾音，并解决噪声、混响、回声等带来的影响；在后端，也就是后台识别引擎，通过软硬件的复杂结合，让远场语音实现人机交互，让用户远距离实现与智能电视的“对话”。目前智能电视远场语音技术中，在多声源的情况下要有效拾取目标声音的声音，同时避免其他声源的声音干扰，通常采用的技术有：声源定位技术、波束成形技术、盲源分离技术等等。而这些技术，目前都存在着一些局限性：比如声源定位技术，当干扰源和目标声源在同一方向发声时，系统无法区分干扰源和目标声源；另外声源定位到某一方位后，波束成形的角度是固定的，如果目标声源发生移动，目标声源就可能会移出原本定位到的区域，从而导致无法有效拾音；再如盲源分离技术主要是通过声压大小来判定目标声源和干扰源，但目标声源的声音可能比干扰源的声音大，也有可能是比干扰源的声音小，所以无法很准确的区分目标声源和干扰源。综上所述，由于目前已有的技术的局限性，远场语音在某些条件下的效果并不是很理想，用户体验差。

因此，现有技术还有待于改进和发展。

发明内容

鉴于上述现有技术的不足之处，本发明为解决现有技术缺陷和不足，提出了一种提高远场语音识别率的方法，通过在智能电视上融合雷达的定位技术和波达方向定位技术（DOA），对各个声源信息进行收集、处理及判断，精准定位和区分干扰源与目标声源，结合内置远场语音波束成形功能，形成一个角度较小的拾音波束，只指向目标声源并拾取目标声源的声音，达到精准拾音的目的，由于雷达定位的实时性，进而实时调整波束的角度来跟踪和拾取目标声源的声音，解决了目标声源位置发生移动时无法拾音问题。

本发明解决技术问题所采用的技术方案如下：

一种提高远场语音识别率的方法，用于实现对目标声源的精准定位和有效拾音，提高在复杂坏境下的远场语音识别率，包括如下步骤：

A、通过雷达实时扫描智能电视正前方，获取前方物体的位置、移动及特征信息；

B、通过波达方向定位技术检测和定位发出“激活词”的声源的方位，通过雷达获取的所述特征信息判定所述声源是否为人；

C、如判断所述声源为人，则形成一个指向所述声源方向的窄拾音波束进行拾音；

D、通过雷达实时定位，拾音波束跟踪所述声源拾音。

作为进一步的改进技术方案，上述步骤A是通过雷达定位功能实时扫描智能电视正前方所有物体，利用不同的物体所具有的特征不一样的特性，以获取所述智能电视正前方所有物体的位置、移动及特征信息。

作为进一步的改进技术方案，上述步骤B具体包括如下步骤：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳TCL新技术有限公司，未经深圳TCL新技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910262894.4/2.html，转载请声明来源钻瓜专利网。