[发明专利]一种提高远场语音识别率的方法、系统及可读存储介质在审
| 申请号: | 201910262894.4 | 申请日: | 2019-04-02 |
| 公开(公告)号: | CN110085258A | 公开(公告)日: | 2019-08-02 |
| 发明(设计)人: | 陈文杰 | 申请(专利权)人: | 深圳TCL新技术有限公司 |
| 主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L21/0216;G10L15/26;G01S13/88;G01S5/06 |
| 代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文;刘文求 |
| 地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声源 拾音 目标声源 语音识别 雷达 远场 波束 特征信息 智能电视 干扰源 可读存储介质 存储介质 方向定位 技术检测 角度跟踪 精准定位 前方物体 实时调整 实时定位 实时扫描 位置参数 移动 波达 判定 指向 激活 跟踪 保证 | ||
本发明提供了一种提高远场语音识别率的方法、系统及存储介质。智能电视通过雷达实时扫描智能电视前方,获取前方物体的位置、移动及特征信息,通过波达方向定位技术检测和定位发出“激活词”的声源的方位,并通过雷达获取的特征信息判定声源是否为人,如果声源是人,则通过MIC阵列形成一个指向声源方向的窄的拾音波束进行拾音,通过雷达实时定位声源,拾音波束根据雷达提供的声源的位置参数实时调整角度跟踪声源,保证了拾音的稳定性。与现有技术干扰源和目标声源区分难,定位不精确,无法在目标声源移动时拾音相比较,本发明可以精准定位以及区分干扰源与目标声源,并能对目标声源进行跟踪,提高了远场语音识别率。
技术领域
本发明涉及一种智能电视技术,尤其涉及一种提高远场语音识别率的方法、系统及可读存储介质。
背景技术
随着智能电视技术的发展,AI逐渐成为电视产品的标配,实现语音交互也就成为AI智能电视发展的方向。目前市场上的AI智能电视,很多都支持语音交互功能。所谓远场语音,顾名思义就是在较远的地方(比如5米以外),AI智能电视等智能设备也可以听得清、听得懂用户的语音指令,是融合了AI语音搜索的一项改变用户体验的创新性交互功能,在远场语音交互中,如何在复杂的客厅环境中,用语音轻松唤醒操控智能电视设备成为极为重要的用户体验。远场语音识别需要前后端结合去完成:在前端,使用麦克风阵列,通过声源定位及自适应波束形成做语音增强,完成远场拾音,并解决噪声、混响、回声等带来的影响;在后端,也就是后台识别引擎,通过软硬件的复杂结合,让远场语音实现人机交互,让用户远距离实现与智能电视的“对话”。目前智能电视远场语音技术中,在多声源的情况下要有效拾取目标声音的声音,同时避免其他声源的声音干扰,通常采用的技术有:声源定位技术、波束成形技术、盲源分离技术等等。而这些技术,目前都存在着一些局限性:比如声源定位技术,当干扰源和目标声源在同一方向发声时,系统无法区分干扰源和目标声源;另外声源定位到某一方位后,波束成形的角度是固定的,如果目标声源发生移动,目标声源就可能会移出原本定位到的区域,从而导致无法有效拾音;再如盲源分离技术主要是通过声压大小来判定目标声源和干扰源,但目标声源的声音可能比干扰源的声音大,也有可能是比干扰源的声音小,所以无法很准确的区分目标声源和干扰源。综上所述,由于目前已有的技术的局限性,远场语音在某些条件下的效果并不是很理想,用户体验差。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足之处,本发明为解决现有技术缺陷和不足,提出了一种提高远场语音识别率的方法,通过在智能电视上融合雷达的定位技术和波达方向定位技术(DOA),对各个声源信息进行收集、处理及判断,精准定位和区分干扰源与目标声源,结合内置远场语音波束成形功能,形成一个角度较小的拾音波束,只指向目标声源并拾取目标声源的声音,达到精准拾音的目的,由于雷达定位的实时性,进而实时调整波束的角度来跟踪和拾取目标声源的声音,解决了目标声源位置发生移动时无法拾音问题。
本发明解决技术问题所采用的技术方案如下:
一种提高远场语音识别率的方法,用于实现对目标声源的精准定位和有效拾音,提高在复杂坏境下的远场语音识别率,包括如下步骤:
A、通过雷达实时扫描智能电视正前方,获取前方物体的位置、移动及特征信息;
B、通过波达方向定位技术检测和定位发出“激活词”的声源的方位,通过雷达获取的所述特征信息判定所述声源是否为人;
C、如判断所述声源为人,则形成一个指向所述声源方向的窄拾音波束进行拾音;
D、通过雷达实时定位,拾音波束跟踪所述声源拾音。
作为进一步的改进技术方案,上述步骤A是通过雷达定位功能实时扫描智能电视正前方所有物体,利用不同的物体所具有的特征不一样的特性,以获取所述智能电视正前方所有物体的位置、移动及特征信息。
作为进一步的改进技术方案,上述步骤B具体包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳TCL新技术有限公司,未经深圳TCL新技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910262894.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于国学经典学习的韵律自动评价系统
- 下一篇:音频比对方法、装置和设备





