[发明专利]一种基于知识发现的技术竞争及专利预警分析方法在审
申请号: | 201710064192.6 | 申请日: | 2017-02-04 |
公开(公告)号: | CN106897392A | 公开(公告)日: | 2017-06-27 |
发明(设计)人: | 柳先辉;陈宇飞;王新梅;洪晶;赵卫东 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/18 |
代理公司: | 上海科律专利代理事务所(特殊普通合伙)31290 | 代理人: | 叶凤 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 发现 技术 竞争 专利 预警 分析 方法 | ||
技术领域
本发明涉及专利信息处理的相关技术领域,具体是一种技术竞争及专利预警分析方法。
背景技术
当今社会处于一个创新型的时代,互联网日益普及,高新技术发展迅猛。企业如何在激烈的技术竞争环境中保持领先,提升企业的整体创新力水平是关键。而在一定意义上,企业的专利水平代表了企业的整体创新力水平。所以企业可以通过对现有的专利进行分析,实现技术竞争以及专利预警。
目前流行的技术竞争及专利预警分析方法,大多采用人工操作,费时费力。基本流程是人工设定检索式,在数据库中检索出所需要的专题数据库,手工对其进行分析,再将分析结果手动汇总到图表中。这类方法存在以下缺陷(1)用户友好性差:对检索式准确度要求高,检索式过于精确,检索到的专利数据少,遗漏度高;检索式过于宽松,检索到的专利数据庞大,计算量大,难以实现人工量化分析。(2)分析手段效果差:人工对查找到的专利信息进行统计与技术分析,不但费时费力,而且分析手段落后,未挖掘出专利数据的深层信息。(3)分析结果可视化差:将分析结果手动汇总到图表,以文字表格的形式,无法对专利信息做出综合评价。
发明内容
为了解决以上问题,本发明提供一种基于知识发现的智能化专利分析方法,并提供给用户可视化程度高的分析结果。
本发明一种基于知识发现的技术竞争及专利预警分析方法,简述为:通过对知识产权数据库和领域知识的抽取分析,建立专题数据库,形成相应的数据集,并在此基础上,利用向量空间、神经网络、数理统计等数据挖掘和知识发现工具,揭示出蕴含在数据背后的深层信息,并对分析得到的结果进行智能化分析,向用户提供可视化报表,最终实现专利预警、专利技术热点和空白点分析、技术生命周期分析。
针对传统专利分析中,用户友好性差,对检索式准确度要求高的问题,本发明在数据挖掘步骤中,提出一种基于改进神经网络的聚类方法,用户可以放宽对检索式的准确度限制。用户可以设定宽松的检索式,检索出大量相关度低的专利文件,对其进行神经网络聚类建立分类器,再输入用户待预警的文件,取出其所在的那一类专利数据做进一步分析。
本发明需要保护的技术方案表征为:一种基于知识发现的技术竞争及专利预警分析方法,其特征在于,具体步骤包括:(1)数据提取阶段:根据用户输入的检索式,建立专题数据库;(2)数据预处理阶段:对专题数据库的专利文本进行预处理,形成特征词-专利权重矩阵;(3)数据挖掘阶段:对形成的专利文本向量,应用SOM神经网络方法和GMM混合高斯模型相结合的方法进行聚类,得到聚类结果;(4)结果解释分析阶段:对每一类专利文件进行分析,具体包括专利预警、专利技术热点和空白点分析、或技术生命周期分析,以及它们的综合运用。
步骤1数据提取阶段,建立专题数据库,对知识产权数据库和产业领域知识进行抽取分析,得到专利专题数据库。
步骤2数据预处理阶段,其步骤包括:
这里采用的是向量空间模型(VSM),基本思想是将特征词从专利文件中抽取出来,不考虑专利文件结构和词序语义。首先提取专利的标题和摘要,再进行中文分词、词性标注、合并同义词、去停用词(如图2所示)。专利文件由特征词组成的一个特征向量表示,记作Vi=(di1,di2,...,dim),其中di1表示第一个特征词在专利文件i中的权重。对于n个专利文件,形成一个m×n专利特征矩阵D,D=[dij]m×n。由于专利文本和特征词数量大,而在某个确定的专利文件中出现的特征词有限,所以这里dij的计算采用TF-IDF方法,其中fij表示第i个特征词出现在第j个专利文件中的频度,pi表示含有第i个特征词的专利文件数量。
步骤3数据挖掘阶段:对形成的专利特征矩阵,应用SOM神经网络方法和GMM混合高斯模型相结合的方法进行聚类,得到聚类结果,聚类得到的专利集合对应着不同主题的专利文件。
步骤3.1对专利向量文本进行SOM自组织学习训练,得到输出结点向量集Y。SOM神经网络方法的优点在于,将高维向量映射为低维向量时保持向量内部拓扑结构不变的特性。在这里,我们使用SOM将高维的专利文本数据映射到二维平面空间。如图3所示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710064192.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文件存储方法及装置
- 下一篇:图书管理方法及用户终端