[发明专利]专利自动分类方法、装置、电子设备及存储介质有效
申请号: | 202110167373.8 | 申请日: | 2021-02-05 |
公开(公告)号: | CN112948581B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 徐童;方林涛;张乐;武晗;周丁;陈恩红 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/383;G06F40/30;G06N3/08;G06Q50/18 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘乐 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 专利 自动 分类 方法 装置 电子设备 存储 介质 | ||
本发明提供一种专利自动分类方法、装置、电子设备及存储介质,引入多视角学习和网络表示学习相关领域的方法,可以更为准确地建模专利的类别与诸如文本信息、受让人信息和发明人信息等元特征间的关系,能够显著提升对于专利分类的准确率。
技术领域
本发明涉及数据挖掘技术领域,更具体地说,涉及一种专利自动分类方法、装置、电子设备及存储介质。
背景技术
专利自动分类对于提高大规模专利管理和服务的效率具有重要意义。通常情况下,一个专利审查员会根据其具有的领域知识手工将每个专利手动分为多个类别。然而,近年来专利申请迅速增长,传统的手动操作费力费时,几乎无法满足需求。因此,迫切需要自动专利分类工具来支持相关服务。
传统上,相关技术将专利分类视作文本分类问题,即给定一个专利问题,判断其归属的类别。然而,专利文献的复杂性使得传统的文本分类方法无法很好的运用:首先,专利文献页面冗长,结构比较复杂,使得提取其中有效的特征比较困难;其次,专利分类体系的层次化结构比较复杂,类别标签集巨大,给选择合适类别带来了困难。
因此,如何准确对专利进行分类,成为现阶段亟需解决的问题。
发明内容
有鉴于此,为解决上述问题,本发明提供一种专利自动分类方法、装置、电子设备及存储介质,技术方案如下:
一种专利自动分类方法,所述方法包括:
获取目标专利的基础信息,所述基础信息包括文本信息、受让人信息和发明人信息;
调用预先基于多视角学习和网络表示学习所生成的分类模型;
将所述目标专利的文本信息、受让人信息和发明人信息输入至所述分类模型中,以获取所述分类模型所输出的所述目标专利的类别。
优选的,所述分类模型的生成过程,包括:
获取专利数据库单一视角的视图网络,所述视图网络包括语义视图网络、受让人视图网络和合作视图网络,所述语义视图网络表征所述专利数据库中专利与单词间的关系,所述受让人视图网络表征所述专利数据库中专利与受让人间的关系,所述合作视图网络表征所述专利数据库中专利与发明人间的关系;
分别学习所述语义视图网络、所述受让人视图网络和所述合作视图网络各自的节点表示;
对所述语义视图网络、所述受让人视图网络和所述合作视图网络各自的节点表示进行融合得到低维的专利表示;
将所述专利表示输入至多层前馈神经网络中,并通过对所述多层前馈神经网络进行基于梯度的训练得到所述分类模型。
优选的,所述获取专利数据库单一视角的视图网络,包括:
收集所述专利数据库中专利的基础信息;
剔除所述专利数据库中基础信息不包含受让人信息或者发明人信息的专利,得到有效专利;
对于所述有效专利,对其基础信息中的文本信息进行停用词去除得到有效文本信息;
根据所述有效专利的有效文本信息、受让人信息和发明人信息识别单一视角下的节点和边,并对所识别到的节点和边执行构建操作得到相应的视图网络。
优选的,所述对所述语义视图网络、所述受让人视图网络和所述合作视图网络各自的节点表示进行融合得到低维的专利表示之前,所述方法还包括:
分别对所述语义视图网络、所述受让人视图网络和所述合作视图网络各自的节点表示进行增强。
优选的,所述将所述专利表示输入至多层前馈神经网络中之前,所述方法还包括:
基于所述语义视图网络、所述受让人视图网络和所述合作视图网络各自的节点表示,对所述专利表示进行对齐约束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110167373.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:HZO基铁电器件及其制作方法
- 下一篇:一种垃圾及生物质气化炉和装置