[发明专利]语音方位识别方法和装置及系统、家居控制器在审
| 申请号: | 201610803006.1 | 申请日: | 2016-09-05 |
| 公开(公告)号: | CN107799118A | 公开(公告)日: | 2018-03-13 |
| 发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 深圳光启合众科技有限公司 |
| 主分类号: | G10L15/26 | 分类号: | G10L15/26;G01S5/18 |
| 代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 韩建伟,张永明 |
| 地址: | 518000 广东省深圳市南山区南*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 方位 识别 方法 装置 系统 家居 控制器 | ||
技术领域
本发明涉及语音领域,具体而言,涉及一种语音方位识别方法和装置及系统、家居控制器。
背景技术
目前,随着社会的发展以及人们物质生活条件的逐渐提高,人们对设备的智能化提出了各种要求,需要设备对具有特定口令的语音进行识别。在设备对具有特定口令的语音进行识别的过程中,可以实现对该特定口令的口令信息进行识别。除此之外,人们也需要了解到具有特定口令的语音的方位,需要设备对该语音的方位进行定位。但是,现存的各种设备,比如,智能机器人、智能家居控制器在无法实现对具有特定口令的语音的方位进行判定,并不能像人一样地对具有特定口令的语音的声源进行追溯,并判断声源的具体空间位置。另外,在对语音识别的过程中,对无意义的声音也一样会响应,对外界的无效音频无法区分。
针对相关技术中不能对语音的方位进行识别的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种语音方位识别方法和装置及系统、家居控制器,以至少解决相关技术中不能对语音的方位进行识别的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种语音方位识别方法。该语音方位识别方法包括:对目标声源发出的语音进行处理,得到音频数据;对音频数据按照预设算法执行计算,得到语音位置信息,其中,语音位置信息为目标声源所在位置的信息;获取音频数据的特征数据,其中,特征数据为语音的口令信息对应的数据;判断特征数据是否与预设特征数据相匹配;如果判断出特征数据与预设特征数据相匹配,输出语音位置信息;如果判断出特征数据与预设特征数据不匹配,则不输出。
进一步地,判断特征数据是否与预设特征数据相匹配包括:判断特征数据是否为口令库中存储的口令信息的数据并生成匹配结果;如果匹配结果是特征数据为口令库中存储的口令信息的数据,确定特征数据与预设特征数据相匹配;如果匹配结果是特征数据不为口令库中存储的口令信息的数据,确定特征数据与预设特征数据不匹配。
进一步地,获取音频数据的特征数据包括:通过音频分析设备接收来自语音输入对音频数据执行预处理,得到预处理结果,并从预处理结果中提取特征数据。
进一步地,如果判断出特征数据与预设特征数据相匹配,输出语音位置信息和语音的口令信息。
进一步地,对音频数据按照预设算法执行计算,得到语音位置信息包括:对音频数据按照声源定位算法执行计算,得到目标声源的距离和目标声源的空间角度坐标,其中,声源定位算法为通过目标声源的信息计算目标声源所在位置的信息的算法,如果判断出特征数据与预设特征数据相匹配,输出语音位置信息包括:如果判断出特征数据与预设特征数据相匹配,输出目标声源的距离和目标声源的空间角度坐标。
进一步地,对目标声源发出的语音进行处理得到的音频数据包括:采集目标声源发出的语音对应的电压信号,通过语音输入设备对电压信号执行放大处理,得到放大电压信号,通过语音输入设备对放大电压信号执行滤波,得到音频数据。
为了实现上述目的,根据本发明的另一方面,还提供了一种语音方位识别装置。该语音方位识别装置包括:第一获取单元,用于对目标声源发出的语音进行处理得到的音频数据;计算单元,用于对音频数据按照预设算法执行计算,得到语音位置信息,其中,语音位置信息为目标声源所在位置的信息;第二获取单元,用于获取音频数据的特征数据,其中,特征数据为语音的口令信息对应的数据;判断单元,用于判断特征数据是否与预设特征数据相匹配;输出单元,用于在判断出特征数据与预设特征数据相匹配时,输出语音位置信息,在判断出特征数据与预设特征数据不匹配时,则不输出。
进一步地,该判断单元包括:处理模块,用于判断特征数据是否为口令库中存储的口令信息的数据并生成匹配结果;第一确定模块,用于当匹配结果是特征数据为口令库中存储的口令信息的数据时,确定特征数据与预设特征数据相匹配;第二确定模块,用于当匹配结果是特征数据不为口令库中存储的口令信息的数据时,确定特征数据与预设特征数据不匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳光启合众科技有限公司,未经深圳光启合众科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610803006.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多轮交互并行语义理解方法和装置
- 下一篇:音频制作方法、装置及系统





