[发明专利]基于目标检测的研报解析方法、装置、设备和存储介质在审
| 申请号: | 202110380917.9 | 申请日: | 2021-04-09 |
| 公开(公告)号: | CN112990091A | 公开(公告)日: | 2021-06-18 |
| 发明(设计)人: | 朱召文;李宜博;李鹏 | 申请(专利权)人: | 数库(上海)科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 上海十蕙一兰知识产权代理有限公司 31331 | 代理人: | 刘秋兰 |
| 地址: | 201112 上海市闵行*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 目标 检测 解析 方法 装置 设备 存储 介质 | ||
1.一种基于目标检测的研报解析方法,其特征在于,包括:
获取研报文件,通过预设的目标检测模型对所述研报文件进行目标检测,得到目标检测结果;
解析所述研报文件,获取所述研报文件内每一页中的字符信息,根据所述目标检测结果,将位于同一个目标内的字符进行合并,得到结构化信息;
汇总所述研报文件内每一页的结构化信息,生成所述研报文件的结构化数据。
2.如权利要求1所述的基于目标检测的研报解析方法,其特征在于,所述获取研报文件,通过预设的目标检测模型对所述研报文件进行目标检测,得到目标检测结果之前,包括对所述目标检测模型进行训练,训练过程包括:
获取多份研报文件,根据所述研报文件的版面结构,将所述研报文件中的数据块划分为不同的类别;
将所述研报文件内每一页的页面均转换为图片,得到多份图片文件;
根据所述类别标注所述图片文件内的图片,生成用来训练所述目标检测模型的训练数据;
根据标注好的所述训练数据,利用目标检测算法训练所述目标检测模型,通过选定不同的特征提取网络,训练出适用于研报文件的目标检测模型。
3.如权利要求2所述的基于目标检测的研报解析方法,其特征在于,所述类别包括研报标题、特殊结构、统计图、结构图、表格、图表标题、图表注释、页眉、页脚、正文或正文标题中的至少一种或组合。
4.如权利要求2所述的基于目标检测的研报解析方法,其特征在于,所述目标检测算法包括SSD目标检测算法、YOLO目标检测算法或Faster-rcnn目标检测算法中的一种。
5.如权利要求2至4中任意一项所述的基于目标检测的研报解析方法,其特征在于,对所述目标检测模型进行训练,还包括:
获取新的多份研报文件,将新的所述研报文件内每一页的页面均转换为图片,得到多份图片文件;
根据所述类别标注所述图片文件内的图片,生成用来训练所述目标检测模型的新的训练数据;
根据标注好的新的所述训练数据,利用目标检测算法重新训练所述目标检测模型,得到重新训练后的目标检测模型。
6.如权利要求1所述的基于目标检测的研报解析方法,其特征在于,所述获取研报文件,通过预设的目标检测模型对所述研报文件进行目标检测,得到目标检测结果,包括:
获取所述研报文件,将所述研报文件内每一页的页面转换为图片,得到图片文件,调用所述目标检测模型,将所述图片文件输入所述目标检测模型,得到所述目标检测结果。
7.如权利要求1所述的基于目标检测的研报解析方法,其特征在于,所述目标检测结果包括目标、所述目标在所述图片中的坐标位置和目标类别;
所述结构化信息为具有目标类别的结构化信息。
8.如权利要求1所述的基于目标检测的研报解析方法,其特征在于,所述汇总所述研报文件内每一页的结构化信息,生成所述研报文件的结构化数据,包括:
汇总所述研报文件内每一页的结构化信息,对所述结构化信息按照预设的排序规则进行排序,生成所述研报文件的结构化数据。
9.如权利要求8所述的基于目标检测的研报解析方法,其特征在于,所述预设的排序规则为按照所述结构化信息在所述研报文件出现顺序。
10.一种基于目标检测的研报解析装置,其特征在于,包括:
确定目标检测结果模块,用于获取研报文件,通过预设的目标检测模型对所述研报文件进行目标检测,得到目标检测结果;
解析模块,用于解析所述研报文件,获取所述研报文件内每一页中的字符信息,根据所述目标检测结果,将位于同一个目标内的字符进行合并,得到结构化信息;
生成数据模块,用于汇总所述研报文件内每一页的结构化信息,生成所述研报文件的结构化数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于数库(上海)科技有限公司,未经数库(上海)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110380917.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:折叠式学习姿势矫正器
- 下一篇:一种智能烙馍摆放机和智能烙馍机





