[发明专利]面向TRIZ发明原理的中文专利分类方法、系统及储存介质在审
申请号: | 201910413039.9 | 申请日: | 2019-05-17 |
公开(公告)号: | CN110162631A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 黄芸茵;常会友 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 黄启文 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 专利文本 词向量 训练数据 向量空间 专利分类 低维 投射 去除 分类 中文 词语 预处理 训练数据集 储存介质 分类结果 数据构建 意义符号 停用词 分词 构建 标注 输出 | ||
本发明涉及一种面向TRIZ发明原理的中文专利分类方法,包括以下内容:获取专利文本数据构建训练数据集,对训练数据集中的专利文本进行基于TRIZ发明原理的标注;对训练数据集中的专利文本进行去除无意义符号、去除非中文、分词、去除停用词的预处理,然后将得到的词语投射到低维的向量空间,得到词向量表示;构建Bi‑LSTM模型,将训练数据集中的专利文本的词向量表示输入至Bi‑LSTM模型中对其进行训练;获取待分类的专利文本,将待分类的专利文本的词语投射到低维的向量空间,得到词向量表示,将词向量表示输入至Bi‑LSTM模型中,Bi‑LSTM模型输出待分类的专利文本的分类结果。
技术领域
本发明涉及专利文本分类技术领域,更具体地,涉及一种面向TRIZ发明原理的中文专利分类方法、系统及储存介质。
背景技术
专利作为技术创新和科学研究最重要的表现形式之一,包含着大量的技术信息,是衡量一个国家或企业科技创新能力的重要指标,也是其核心竞争力的直接体现。对已有专利文本进行研究不仅可以得到一个国家、地区或企业的技术发展动态和水平,挖掘其技术发展路径和发展规律,还可以指导未来科技创新的方向,对智能制造转型升级技术路径分析至关重要,同时可以为企业决策提供可靠支持,缩短创新周期,降低研发费用。
专利分类作为专利文本研究的基础性工作,在专利检索、专利聚类、专利挖掘等信息利用方面起着重要的作用。但传统的专利分类存在以下问题:
第一,传统专利分类多依据国际专利分类法IPC和美国专利分类法USPC,二者多是以专利所涉及的领域、应用范围、功能用途等划分。这种分类方法有利于专利的管理和查找,但其无法揭示专利所解决的技术问题和解决问题所使用的技术原理,研究者想要从海量的专利文本中找到有用的技术信息需要耗费大量的人力物力,对于专利信息的有效利用具有很大的局限性,不便于研究人员进行技术路径的研究,也难以实现技术手段向其他领域的推广,不利于进行高效率的技术创新。因此,基于技术原理的专利分类方法有很大需求空间。
第二,传统的专利分类都由专利局各个领域的专家手工分类完成,耗时耗力,基于计算机技术的专利自动分类方法的研究具有很大的发展空间。
TRIZ理论是制造业领域的一个重要理论,为专利分类提供了新的研究思路。在基于TRIZ的分类标准下,专利以解决技术问题所使用的科学原理而划分,研究人员能够一目了然地掌握专利文本所蕴含的技术信息、所解决的技术问题和解决技术问题使用的发明原理,为便捷地进行技术路径的研究奠定了基础,大大提高了专利的应用率和企业寻找核心技术的效率,同时研究结果具有普遍借鉴意义,缩短了发明周期,使解决发明问题更具有可预见性。但是,目前国内关于TRIZ理论在专利研究方面的应用尚在探索阶段,没有形成统一、权威的研究方法和研究结果。
发明内容
本发明的发明目的在于提供一种面向TRIZ发明原理的中文专利分类方法,其利用TRIZ发明原理对专利文本进行分类,弥补了现有技术的空白,应用该项技术可以快速有效地对专利文本按TRIZ发明原理进行分类,便于企业寻找核心技术。
为实现以上发明目的,采用的技术方案是:
一种面向TRIZ发明原理的中文专利分类方法,包括以下内容:
获取专利文本数据构建训练数据集,对训练数据集中的专利文本进行基于TRIZ发明原理的标注;
将训练数据集中的专利文本的词语投射到低维的向量空间,得到词向量表示;
构建Bi-LSTM模型,将训练数据集中的专利文本的词向量表示输入至Bi-LSTM模型中对其进行训练;
获取待分类的专利文本,将待分类的专利文本的词语投射到低维的向量空间,得到词向量表示,将词向量表示输入至Bi-LSTM模型中,Bi-LSTM模型输出待分类的专利文本的分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910413039.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文本去重的方法、装置及设备
- 下一篇:一种新闻专题事件发现的方法