[发明专利]一种提高远场语音识别率的方法、系统及可读存储介质在审
| 申请号: | 201910262894.4 | 申请日: | 2019-04-02 |
| 公开(公告)号: | CN110085258A | 公开(公告)日: | 2019-08-02 |
| 发明(设计)人: | 陈文杰 | 申请(专利权)人: | 深圳TCL新技术有限公司 |
| 主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L21/0216;G10L15/26;G01S13/88;G01S5/06 |
| 代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文;刘文求 |
| 地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声源 拾音 目标声源 语音识别 雷达 远场 波束 特征信息 智能电视 干扰源 可读存储介质 存储介质 方向定位 技术检测 角度跟踪 精准定位 前方物体 实时调整 实时定位 实时扫描 位置参数 移动 波达 判定 指向 激活 跟踪 保证 | ||
1.一种提高远场语音识别率的方法,用于实现对目标声源的精准定位和有效拾音,提高在复杂坏境下的远场语音识别率,其特征在于,包括如下步骤:
A、通过雷达实时扫描智能电视正前方,获取前方物体的位置、移动及特征信息;
B、通过波达方向定位技术检测和定位发出“激活词”的声源的方位,通过雷达获取的所述特征信息判定所述声源是否为人;
C、如判断所述声源为人,则形成一个指向所述声源方向的窄拾音波束进行拾音;
D、通过雷达实时定位,拾音波束跟踪所述声源拾音。
2.根据权利要求1所述的一种提高远场语音识别率的方法,其特征在于,所述步骤A是通过雷达定位功能实时扫描智能电视正前方所有物体,利用不同的物体所具有的特征不一样的特性,以获取所述智能电视正前方所有物体的位置、移动及特征信息。
3.根据权利要求1所述的一种提高远场语音识别率的方法,其特征在于,所述步骤B具体包括如下步骤:
智能电视正前方存在多种声源时,利用波达方向定位检测最先说出“激活词”的声源的方向;
定位所述“激活词”声源的方位;
智能电视对定位的所述声源根据雷达扫描获取特征信息,判断所述声源是否为人,否则重新检测判断。
4.根据权利要求3所述的一种提高远场语音识别率的方法,其特征在于,所述步骤C具体包括如下步骤:
如判断所述声源为人,则将最先说出“激活词”的声源设置为目标声源;
智能电视系统通过MIC阵列形成一个指向所述声源方向的较窄的拾音波束,对所述声源进行拾音。
5.根据权利要求4所述的一种提高远场语音识别率的方法,其特征在于,所述步骤D具体包括如下步骤:
雷达实时定位所述声源的位置,获取所述声源的位置数据;
拾音波束根据获取的所述位置数据实时调整角度来跟踪和拾取所述声源的声音,直到完成对智能电视的操控或退出识别状态。
6.一种提高远场语音识别率的系统,用于实现对目标声源的精准定位和有效拾音,提高在复杂坏境下的远场语音识别率,其特征在于,所述系统包括:雷达定位模块、声源定位及声源类别识别模块、拾音模块和拾音波束跟踪模块;
所述雷达定位模块用于实时扫描智能电视正前方,获取前方物体的位置、移动及特征信息;
所述声源定位及声源类别识别模块用于检测和定位发出“激活词”的声源的方位,判定所述声源是否为人;
所述拾音模块用于拾取所述声源的声音;
所述拾音波束跟踪模块用于根据雷达获取的所述声源的实时定位,拾音波束实时跟踪所述声源。
7.根据权利要求6所述的一种提高远场语音识别率的系统,其特征在于,所述雷达定位模块具体是通过雷达定位功能实时扫描智能电视正前方所有物体,利用不同的物体所具有的特征不一样的特性,以获取智能电视正前方所有物体的位置、移动及特征信息。
8.根据权利要求6所述的一种提高远场语音识别率的系统,其特征在于,所述声源定位及声源类别识别模块具体用于检测和定位发出“激活词”的声源的方位,判定所述声源是否为人,智能电视正前方存在多种声源时,通过识别“激活词”,利用波达方向定位技术检测最先说出“激活词”的声源的方向,定位所述声源的方位,智能电视对定位的所述声源根据雷达扫描获取的特征信息,判断所述声源是否为人,否则重新检测判断。
9.根据权利要求6所述的一种提高远场语音识别率的系统,其特征在于,所述拾音模块具体用于拾取所述声源的声音,如果所述声源通过声源定位及声源类别识别模块识别为人,将所述最先说出“激活词”的声源设置为目标声源,智能电视系统通过MIC阵列形成一个指向所述声源方向的较窄的拾音波束,对所述声源进行拾音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳TCL新技术有限公司,未经深圳TCL新技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910262894.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于国学经典学习的韵律自动评价系统
- 下一篇:音频比对方法、装置和设备





