[发明专利]一种基于语音的动物识别方法及装置有效

专利信息
申请号: 201310043802.6 申请日: 2013-02-05
公开(公告)号: CN103117061A 公开(公告)日: 2013-05-22
发明(设计)人: 曾元清;刘立森 申请(专利权)人: 广东欧珀移动通信有限公司
主分类号: G10L17/26 分类号: G10L17/26
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 罗晓林;李志强
地址: 523860 广东省东莞市长安*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 语音 动物 识别 方法 装置
【说明书】:

技术领域

发明涉及具有语音识别功能的移动终端,尤其涉及一种基于语音的动物识别方法及装置。

背景技术

人类有人类的语言, 而且可以听其声知其人,原因是每个人语音中的音调,音色等一些语音的特征参数是难以改变的。动物也有动物的语言,不同的动物所发出的叫声也是不同的,每个物种、每个物种的不同个体均有其独特的叫声特征,例如通过人耳即可轻松地区别出猫的叫声和狗的叫声。对于人们所熟悉的物种叫声往往可以通过人耳轻松地识别该物种,但是对于不熟悉的物种就难以识别,而且人耳听力有限,容易受到主观认知的影响。

当人们处在野外环境中,有时需要警惕周围野生动物的出没,需要掌握周围的动物物种及其数量分布,达到趋利避害的目的。另外,出于野外观测或野生动物监测保护的目的,经常地也需要随时关注周围的动物物种。在这些情况下,动物的叫声是识别物种、追寻动物踪迹的重要线索之一。因而提供一种能通过其叫声识别动物的方法和便携式装置具有现实的意义和实际的需求。

发明内容

为了克服上述所指的现有技术中的不足之处,本发明提供一种基于语音的动物识别方法及装置,以实现利用手机等移动终端监听用户周围动物的叫声,识别周围的动物物种及其数量分布。

本发明是通过以下技术方案实现的: 

一种基于语音的动物识别方法,应用于移动终端,其步骤包括:

a、采集若干动物物种的语音样本,提取各语音样本的声波特征参数建立声纹模型,构成一声纹数据库;

b、获取待分析的动物语音信号,利用单声道语音分离技术从所述动物语音信号中分离出至少一个源信号;

c、提取各源信号的声纹,并与声纹数据库中各动物物种的声纹模型进行匹配;

d、记录匹配成功的源信号所对应的动物物种。 

进一步地,所述所述步骤a采集若干动物物种的语音样本包括:采集至少一类动物物种的动物语音样本;采集从属于一类动物物种的至少一品种的动物语音样本。

所述步骤d中的匹配成功是指源信号的声纹与声纹数据库中一动物物种的声纹模型的相似值在预设的阀值范围以内。

所述步骤d之后,还包括:分别统计对应同一类动物物种的经匹配成功的源信号数目;在移动终端的显示装置上显示统计结果。

所述声波特征参数包括线性预测倒谱系数、Mel 频率倒谱系数、基于小波分析的特征参数中的一种或两种以上,所述声纹数据库中的声纹模型及源信号的声纹为宽带声纹、窄带声纹、振幅声纹、等高线声纹、时间波谱声纹、断面声纹中的一种或两种以上。

所述单声道语音分离技术基于计算场景分析方法、非负矩阵分解算法、带稀疏限制性条件的非负矩阵分解算法中一种或两种以上的组合。

本发明还公开了一种基于语音的动物识别装置,包括:

数据库单元,用于采集若干动物物种的语音样本,提取各语音样本的声波特征参数建立声纹模型,构成一声纹数据库;

语音分离单元,用于获取待分析的动物语音信号,利用单声道语音分离技术从所述动物语音信号中分离出至少一个源信号;

匹配单元,用于提取各源信号的声纹,并与声纹数据库中各动物物种的声纹模型进行匹配;

记录单元,用于记录匹配成功的源信号所对应的动物物种,所述匹配成功是指源信号的声纹与声纹数据库中一动物物种的声纹模型的相似值在预设的阀值范围以内。 

进一步地,所述所述数据库单元用于采集若干动物物种的语音样本包括:用于采集至少一类动物物种的动物语音样本;用于采集从属于一类动物物种的至少一品种的动物语音样本。

本发明的基于语音的动物识别装置还包括:一统计单元,用于分别统计对应同一类动物物种的经匹配成功的源信号数目;一显示单元,用于显示统计结果。

与现有技术相比,通过本发明可实现利用手机等移动终端监听用户周围动物的叫声,可以通过语音频谱分析的方法,提取出动物叫声的声波特征参数与数据库模型匹配,作为识别不同动物物种和数量的依据,从而掌握周围的动物物种及其数量分布,尤其在野外可以达到趋利避害的目的,而且操作体验具有娱乐趣味性。

附图说明

附图1为本发明实施例的智能手机的基于语音的动物识别方法的实现流程示意图。

具体实施方式

为了便于本领域技术人员的理解,下面结合附图对本发明作进一步的描述。

一种基于语音的动物识别方法,应用于移动终端,其步骤包括:

a、采集若干动物物种的语音样本,提取各语音样本的声波特征参数建立声纹模型,构成一声纹数据库;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东欧珀移动通信有限公司,未经广东欧珀移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310043802.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top