[发明专利]基于多预置点的深度鸟类识别算法有效
| 申请号: | 201910327366.2 | 申请日: | 2019-04-23 |
| 公开(公告)号: | CN110059641B | 公开(公告)日: | 2023-02-03 |
| 发明(设计)人: | 唐灿;曹晓莉;唐亮贵 | 申请(专利权)人: | 重庆工商大学 |
| 主分类号: | G06V20/60 | 分类号: | G06V20/60;G06N3/006;G06N20/00 |
| 代理公司: | 重庆为信知识产权代理事务所(普通合伙) 50216 | 代理人: | 余锦曦 |
| 地址: | 400067 *** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 预置 深度 鸟类 识别 算法 | ||
1.一种基于多预置点的深度鸟类识别算法,用于鸟类识别系统,所述鸟类识别系统包括至少两个可编程的摄像头,摄像头连接有AI服务器,其特征在于,包括如下步骤:
步骤A:为每一个摄像头建立预置点;预置点设置有对应的时间点;预置点对应的视界不相交;
步骤B:处理所有摄像头的预置点以及视界,如果两个摄像头的预置点在同一时间点的视界相交,删除其中一个摄像头的相交的视界及其对应的预置点;
步骤C:根据步骤B处理后的摄像头的预置点、时间点和视界,启动摄像头运行到预置点拍摄鸟类照片;
步骤D:采用深度识别算法识别鸟类照片中鸟类的种群及其对应数量;
步骤E:对深度识别算法获取的鸟类的种群及其数量进行统计;
所述步骤A包括:
步骤A1:建立摄像头组成的摄像头集合,摄像头集合用C表示,C=(C1,C2,…,Ci,…Cn),i=1~n,其中Ci表示摄像头集合C中的第i个摄像头;
建立对应的预置点总集合,预置点总集合用P表示,P=(PC1,PC2,…,PCi,…PCn);其中PCi表示摄像头Ci对应的预置点分集合;
建立对应的时间点总集合,时间点总集合用T0表示,T0=(TC1,TC2,…,TCi,…TCn),其中TCi表示摄像头Ci对应的时间点分集合;
建立对应的视界总集合,视界总集合用V表示,V=(VC1,VC2,…,VCi,…VCn),其中VCi表示摄像头Ci对应的视界分集合;
步骤A2:按如下方法为摄像头Ci设置预置点及预置点对应的视界;
为摄像头Ci设置a个预置点,用PCitm表示其中的一个预置点,用tm表示预置点PCitm对应的时间点,1≤m≤a,用VCitm表示预置点PCitm对应的视界;摄像头Ci的所有预置点PCitm的视界VCitm互不相交;将预置点PCitm存入该摄像头Ci对应的预置点分集合PCi中,将视界VCitm存入该摄像头Ci对应的视界分集合VCi;将时间点tm存入该摄像头Ci对应的时间点分集合TCi中;
所述步骤B包括:
步骤B1:将时间点总集合T0中的时间点排序,去掉重复的时间点;得到时间点新集合,时间点新集合用T表示,T=(T1,T2,…,Tp,…Ts);Tp表示时间点新集合T中的其中一个时间点;p=1~s;Ts表示时间点新集合T中的第s个时间点;时间点新集合T中共有s个时间点;
步骤B2:按如下方法处理视界总集合V和预置点总集合P,依次从时间点新集合T中取出时间点Tp,依次获取摄像头Ci,i=1~n;再获取摄像头Cj;摄像头Cj表示摄像头集合C中的第j个摄像头,j=1~n且j≠i;分别查找摄像头Ci和摄像头Cj在时间点Tp的视界VCiTp和视界VCjTp;如果视界VCiTp和视界VCjTp都存在且有相交,则删除视界VCjTp,并删除其对应的预置点PCjTp;
所述步骤A2通过如下的方法使摄像头Ci的所有预置点PCitm的视界VCitm互不相交;
步骤A21:按照设定的视角为摄像头Ci设置b个预置点;
步骤A22:判断第二个预置点PCit2的视界VCit2与第一个预置点PCit1的视界VCit1是否相交;如果相交,将第二个预置点PCit2的视界VCit2向远离第一个预置点PCit1的视界VCit1的方向每次转动Z度,Z由用户设定,直到不相交为止;
按照上述方法调摄像头Ci的所有预置点PCitm的视界VCitm;
步骤A23:判断第b个预置点PCitb的视界VCitb与预置点PCit1的视界VCit1是否相交;如果不相交,则a等于b,如果相交,删除第b个预置点PCitb及其对应的视界VCitb;则a等于b-1;
采用机器学习算法判断摄像头Ci的第二个预置点PCit2的视界VCit2与第一个预置点PCit1的视界VCit1是否相交;
该机器学习算法包括如下步骤:
步骤A221:使用AKAZE算法对视界VCit2、视界VCit1获取的照片提取特征点,取得特征点的方向、位置和大小信息;
步骤A222:使用SVD降维算法对特征点的方向、位置和大小信息进行投影降维处理;
步骤A223:使用FLANN based Matcher算法计算视界VCit2、视界VCit1的照片的特征点降维处理后的匹配个数和不匹配个数;
步骤A224:如果不匹配个数大于等于N倍匹配个数,N由经验值确定,则认为不匹配;否则,认为匹配;旋转此视界VCit2;
关于视界相关的处理过程,使用了机器学习算法来实现,其步骤如下:
步骤3:输入两个相交或不相交的视界照片,输出是否相交;
步骤3.1对两张图片,我们分别使用AKAZE算法提取特征点;AKAZE算法利用非线性扩散滤波的优势获取低计算要求的特征,引入快速显示扩散数学框架FED来快速求解偏微分方程,并同时引入一个高效的改进局部差分二进制描述符M-LDB;其输出为一个六元组:
[angle,class_id,octave,pt,response,size]
其中:
angle:角度,表示关键点的方向;
class_id:当要对图片进行分类时使用;
octave:代表是从金字塔哪一层提取得到的数据;
pt:关键点的坐标;
response:响应程度,代表着该关键点是该点角点的程度;
size:该点直径的大小;
步骤3.2:取得多个特征点的方向、位置和大小信息;由于可能存在特征维度过大的问题,为加快速度,我们使用了SVD降维算法:
标准的SVD降维算法公式表示如下:
M=UΣVT
假设M∈Rm×n,则U∈Rm×k,Σ∈Rk×k,V∈Rn×k、M∈Rm×n,其中k=min(m,n),U、Vk=min(m,n),U、V是正交单位矩阵,Σ是对角矩阵;采用相同的特征矩阵,对它们进行投影降维;
步骤3.3:然后,使用FLANN based Matcher来进行特征点匹配算法;用下面的方式定义最近邻搜索NNS问题:在一个度量空间X给定一组点Pt=pt1,pt2,…,ptn,这些点必须通过以下方式进行预处理,给第一个新的查询点q属于X,快速在P中找到距离q最近的点,即最近邻搜索问题;
步骤3.4:结果筛选:过滤掉0.75以下的匹配值,这个数值是对多张风景区照片对比后的合适值;并给出对应的不匹配特征点;
如果不匹配点数大于等于8倍匹配点数,则认为不匹配;否则,认为匹配,放弃或旋转此视界。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆工商大学,未经重庆工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910327366.2/1.html,转载请声明来源钻瓜专利网。





