[发明专利]一种提高远场语音识别率的方法、系统及可读存储介质在审
| 申请号: | 201910262894.4 | 申请日: | 2019-04-02 |
| 公开(公告)号: | CN110085258A | 公开(公告)日: | 2019-08-02 |
| 发明(设计)人: | 陈文杰 | 申请(专利权)人: | 深圳TCL新技术有限公司 |
| 主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L21/0216;G10L15/26;G01S13/88;G01S5/06 |
| 代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文;刘文求 |
| 地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供了一种提高远场语音识别率的方法、系统及存储介质。智能电视通过雷达实时扫描智能电视前方,获取前方物体的位置、移动及特征信息,通过波达方向定位技术检测和定位发出“激活词”的声源的方位,并通过雷达获取的特征信息判定声源是否为人,如果声源是人,则通过MIC阵列形成一个指向声源方向的窄的拾音波束进行拾音,通过雷达实时定位声源,拾音波束根据雷达提供的声源的位置参数实时调整角度跟踪声源,保证了拾音的稳定性。与现有技术干扰源和目标声源区分难,定位不精确,无法在目标声源移动时拾音相比较,本发明可以精准定位以及区分干扰源与目标声源,并能对目标声源进行跟踪,提高了远场语音识别率。 | ||
| 搜索关键词: | 声源 拾音 目标声源 语音识别 雷达 远场 波束 特征信息 智能电视 干扰源 可读存储介质 存储介质 方向定位 技术检测 角度跟踪 精准定位 前方物体 实时调整 实时定位 实时扫描 位置参数 移动 波达 判定 指向 激活 跟踪 保证 | ||
【主权项】:
1.一种提高远场语音识别率的方法,用于实现对目标声源的精准定位和有效拾音,提高在复杂坏境下的远场语音识别率,其特征在于,包括如下步骤:A、通过雷达实时扫描智能电视正前方,获取前方物体的位置、移动及特征信息;B、通过波达方向定位技术检测和定位发出“激活词”的声源的方位,通过雷达获取的所述特征信息判定所述声源是否为人;C、如判断所述声源为人,则形成一个指向所述声源方向的窄拾音波束进行拾音;D、通过雷达实时定位,拾音波束跟踪所述声源拾音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳TCL新技术有限公司,未经深圳TCL新技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910262894.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于国学经典学习的韵律自动评价系统
- 下一篇:音频比对方法、装置和设备





