[发明专利]一种化学结构式的智能识别方法在审
| 申请号: | 201711407771.2 | 申请日: | 2017-12-22 |
| 公开(公告)号: | CN108062529A | 公开(公告)日: | 2018-05-22 |
| 发明(设计)人: | 邓光辉;裴剑锋;来鲁华;徐优俊;胡启万;孙潭霖;谢兆同;陈宇;孙美建;王力恒;晋峰;李巧;朱华军;邓超辉;许艳 | 申请(专利权)人: | 上海鹰谷信息科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/44;G06K9/46 |
| 代理公司: | 上海骁象知识产权代理有限公司 31315 | 代理人: | 赵俊寅 |
| 地址: | 201203 上海市浦东新区中国(上海)自由贸易试验区*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 化学 结构式 智能 识别 方法 | ||
本发明公开了一种化学结构式的智能识别方法,本发明将右键选中的图片信息,或者截屏软件提供的图片像素信息,或者手动绘制的结构图片信息结合化学分子图片的固有特征进行图片预处理,然后识别出图片中每个原子的坐标、原子的元素名称或者与原子连接的化学基团名称、不同化学键的类型以及电荷同位素等信息,最后汇总提取的信息生成数据文件,最后在结构式编辑器中将分子的结构绘制并展现出来。
技术领域
本发明涉及一种化学结构式的智能识别方法。属于化学技术领域。
背景技术
目前的化学结构式编辑器,只能通过软件基础功能进行搭建,实现完整分子式的绘制,并且无法从图像中获得相关结构信息,也无法实现手绘,耗时耗力,工作效率有限,无法及时获得图片中化合物信息。
另外,化学相关文献数据几乎都是图片格式,传统的结构式编辑区无法直接读取其中内容,效率及其低下。
因此,优化化学结构式文献阅读和移动端结构式绘制体验是当前的一个技术难点,其直接关系到化学研究者的工作效率。
发明内容
本发明的目的是为克服上述现有技术的不足,提供一种化学结构式的智能识别方法。
为实现上述目的,本发明采用下述技术方案:
一种化学结构式的智能识别方法,包括以下步骤:
将含有化学结构式的图片数据转化为字符串并发送到后台;
后台接收到字符串后转换为图片,经过识别接口进行识别;
将识别出来的数据返回给结构式编辑器最终得到相应分子的二维结构,并显示出来。
作为优选的技术方案之一,包括以下步骤:
将含有化学结构式的图片数据转化为base64格式字符串通过http协议发送到后台;
后台接收到base64格式字符串后转换为图片,经过api识别接口识别为int格式的数据;
将int格式数据通过http协议返回给结构式编辑器最终得到相应分子的二维结构,并显示出来。
作为优选的技术方案之一,获取含有化学结构式的图片,将图片信息结合化学分子图片的固有特征进行图片预处理,然后识别出图片中每个原子的坐标、原子的元素名称或者与原子连接的化学基团名称、不同化学键的类型以及电荷同位素等信息,最后汇总提取的信息生成数据文件,最后在结构式编辑器中将分子的结构绘制并展现出来。
作为进一步优选的技术方案之一,所述数据文件包括分子MDL molfile文件和SMILES文件。
作为优选的技术方案之一,通过结构式编辑器将识别接口识别出来的数据解析转化得到相应分子的二维结构,并在结构式编辑器中显示;具体方法是:
1)灰度和二值化;
2)图片中粗线细化;
3)矢量化和键/节点检测;
4)识别。
作为进一步优选的技术方案之一,所述结构式编辑器为InDraw客户端。
作为进一步优选的技术方案之一,步骤1)和步骤2)均通过opencv3工具包实现。
作为进一步优选的技术方案之一,步骤2)为采用粗线细化算法将图片中的粗线细化(文献“A Fast Parallel Algorithm for Thinning Digital Patterns,Communications of the ACM,March 1984,Volume 27,Number 3,236-239”)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海鹰谷信息科技有限公司,未经上海鹰谷信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711407771.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种节杆菌菌株及其应用
- 下一篇:一种节水装置





