[发明专利]一种专利方案的挖掘系统及挖掘方法有效
申请号: | 201510249493.7 | 申请日: | 2015-05-15 |
公开(公告)号: | CN104809106A | 公开(公告)日: | 2015-07-29 |
发明(设计)人: | 郑舫挺;周磊;刘海涵;郑航坚 | 申请(专利权)人: | 合肥汇众知识产权管理有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 安徽汇朴律师事务所 34116 | 代理人: | 胡敏 |
地址: | 230001 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 专利 方案 挖掘 系统 方法 | ||
1.一种专利方案的挖掘系统,包括用户输入单元,用于提交用户技术方案的文本信息;
专利数据库,用于存储所有已公开专利文献的文本化数据,以及每条专利文献的技术关键词、技术领域,相近技术领域及标准化语句文档;
语言判断模块,用于判断文本语言种类;
语义分析单元,用于对文本信息进行分词解析、对分词解析的结果进行词性标记和依存文法解析;
语句转换单元,用于把依存文法解析的结果转换成标准化语句文档;
关键词提取模块,用于从分词结果中提取技术关键词;
文本比较单元,用于标准化语句文档之间的文本比对;
报告生成单元,用于生成挖掘报告。
2.采用如权利要求1所述挖掘系统的一种专利方案的挖掘方法,包括以下步骤:
A)用户输入技术方案文本信息;
B)语义分析单元根据语言判断模块判断输入文本信息的语言种类,使用相应的语言的科技分词引擎对文本信息进行分词解析,得到包含n个分词s的文本队列Q(s1,s2,…,sn);然后,按语言读写顺序对n个分词s进行词性标记,然后,根据各分词s的词性、搭配和驱动关系,将整个队列Q做依存文法解析,得到含有依存文法标记的文本队列P;
C)语句转换单元以文本队列P中的断句标点符号为标记,把文本队列P分割为多个语句,并根据相应的语言的句式结构对每个语句进行线性文本描写转换,使得每个语句都转换成标准化语句,然后将转换后的每个语句按顺序连接,得到包含v条标准化语句Sent的用户技术方案的标准化语句文档D[Sent1,Sent2,…,Sentv];
D)通过关键词提取模块将文本队列P中的标记为介词、副词、助词以及其他非技术词语的分词s滤除,同时查询其他分词在已公开利文献数据库中的出现频率,并根据出现频率的高低从其他分词中找出技术关键词集合A[sk1,sk2,…,skl];
E)通过检索技术关键词集合A中每个技术关键词sk在已公开专利文献数据库中出现的频率和个数,选择技术关键词出现频率最高和出现个数最多的技术领域作为该用户技术方案的相同或最接近的技术领域,同时获取该技术领域的关联技术领域;
F)将相同或最接近的技术领域以及关联技术领域中所有已公开专利文献的权利要求按步骤B)~C)进行处理,得到相同或最接近的技术领域以及关联技术领域中所有已公开专利文献的权利要求标准化语句文档元素集合Gstd[Dp1,Dp2,Dp3…,Dpm],并存储于数据库中;
G)以标准化语句为最小比较单位,在文本比较单元中将标准化语句文档D与元素集合Gstd中的所有元素逐一进行文本比较,并记录每个元素含有与标准化语句文档D中的相同标准化语句的数量,以相同标准化语句的数最多的元素作为最接近的标准技术文档Dpx;然后,按照以下步骤判断技术方案的可专利性:
G1)若标准化语句文档D与最接近的标准技术文档Dpx不存在文本差异,则判定技术方案无专利性,报告生成单元生成挖掘报告;否则转步骤G2),
G2)若标准化语句文档D中含有最接近的标准技术文档Dpx中不存在的至少1个标准化语句Sentx,则查找元素集合Gstd中其他元素Dp中是否存在该标准化语句Sentx,如存在,则判定技术方案无专利性,同时报告生成单元生成挖掘报告,反之,则判定技术方案有专利性并通过报告生成单元生成挖掘报告,同时将标准化语句文档D作为标准专利文档输出;若最接近的标准技术文档Dpx含有标准化语句文档D中所有标准化语句,且还含有其他标准化语句,则判定技术方案有专利性并通过报告生成单元生成报告,并将标准化语句文档D作为标准专利文档输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥汇众知识产权管理有限公司,未经合肥汇众知识产权管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510249493.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息监测分析系统
- 下一篇:一种人机对话的语义分析方法及系统