[发明专利]一种基于python深度学习算法的视觉识别方法在审
申请号: | 202110196154.2 | 申请日: | 2021-02-22 |
公开(公告)号: | CN112925507A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 史晓凌;卞珂珂;李立琴;刘伟华 | 申请(专利权)人: | 北京智通云联科技有限公司 |
主分类号: | G06F8/20 | 分类号: | G06F8/20;G06F8/38;G06F9/445;G06F9/448;G06N3/04;G06N3/08 |
代理公司: | 北京八月瓜知识产权代理有限公司 11543 | 代理人: | 李斌 |
地址: | 100020 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 python 深度 学习 算法 视觉 识别 方法 | ||
本发明公开一种基于python深度学习算法的视觉识别方法,后台使用python深度学习算法,构建神经网络,完成视觉识别任务;中间层使用c++加载python运行环境,通过dll打包的方式提供对于python的运行环境管理及调用接口;前台使用.net的界面框架,构建结果显示、配置管理界面,本发明首先是将图像识别与结果展示分离,可以针对业务变更灵活地调整识别程序或软件界面;同时,由于python神经网络进行图像识别,可以完成复杂的视觉识别任务,如瑕疵检测、喷码识别等;然后,由于使用c++的d l l动态链接库托管python代码,可以被.net内存式调用,避免了通信延时。最后,基于.net的界面框架,可以构建出美观易用的软件界面,大幅降低客户的学习和使用成本。
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于python深度学习算法的视觉识别方法、存储控制器、电子设备及存储介质。
背景技术
视觉识别软件,即使用计算机数字图像处理技术,对采集图像进行识别并通过用户界面展示识别结果的专业软件;
Python是一种高级编程语言,相比其他语言,其在算法实现等具有较大优势。例如,完成同一个任务,C语言需要写1000行代码,C#需要写100行代码,而Python只需要写20行代码。并且,Python拥有众多的开源函数库;
在工业视觉领域,目前的视觉识别软件具有安全运行、准确率高等特点,但存在如下问题:
对检测场景的标准化要求较高。基于传统图像处理的视觉识别软件适配于标准化的识别场景,比如饮料液位检测、包装瑕疵检测等。这样导致无法完成更普遍的复杂检测需求,比如饮料异物检测、包装喷码检测等。
图像的识别延时较高。基于python神经网络的图像识别软件,往往需要在异构的识别程序与界面程序间做通信衔接,由于工业图像体积较大,图像通信会带来数十至数百毫秒的通信延时,会导致结果返回滞后,影响后续工艺执行。
展示界面美观性、易用性较低。基于python图形界面的视觉软件,虽然解决了图像传输延时的问题,但由于界面组件较为固定,导致界面风格及软件功能单一,客户学习成本高导致使用意愿降低。
总之,传统的视觉识别软件只能在识别场景、识别延时、界面美观易用中取舍,已有方案均无法适应高速、复杂的工业视觉识别场景。
发明内容
本发明的目的在于提供涉及一种基于python深度学习算法的视觉识别方法、存储控制器、电子设备及存储介质,能够完成复杂场景下的视觉检测识别任务。
第一方面,本发明实施例提供了一种基于python深度学习算法的视觉识别方法,通过软件实现,所述方法包括:
后台使用python深度学习算法,构建神经网络,完成视觉识别任务;
中间层使用c++加载python运行环境,通过dll打包的方式提供对于python的运行环境管理及调用接口;
前台使用.net的界面框架,构建结果显示、配置管理界面。
进一步地基于python深度学习算法的视觉识别软件架构,包括:
实现层,通过代码构建软件功能模块;
交互层,通过内存传值的方式完成加载调用;
应用层,负责采集产品图片,并进行识别结果显示。
可选地,所述实现层包括;
图形界面模块,基于.net构建软件界面供用户交互使用;
C++程序模块,使用C++加载python环境,并通过dll打包提供服务接口;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智通云联科技有限公司,未经北京智通云联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110196154.2/2.html,转载请声明来源钻瓜专利网。