[发明专利]工程关键词提取方法及装置在审

专利信息
申请号: 201711245444.1 申请日: 2017-11-30
公开(公告)号: CN108038100A 公开(公告)日: 2018-05-15
发明(设计)人: 张森;杨晓欢;曾勇华 申请(专利权)人: 四川隧唐科技股份有限公司
主分类号: G06F17/27 分类号: G06F17/27;G06F17/30
代理公司: 北京超凡志成知识产权代理事务所(普通合伙) 11371 代理人: 赵志远
地址: 610000 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 工程 关键词 提取 方法 装置
【说明书】:

发明实施例提供了一种工程关键词提取方法及装置,涉及数据处理领域。方法包括:从工程文本中确定出每个具有词性的工程关键词,获得包括多个具有词性的工程关键词的多个工程关键词集合;从多个工程关键词集合中确定出至少一个特征词组;将每个特征词组中的至少一个工程关键词均与预设工程关键词数据库匹配,将匹配度最高的一特征词组作为目标特征词组,将目标特征词组中的待提取的工程关键词作为目标工程关键词提取。通过词性去确定特征词组,再从各特征词组中确定出匹配度最高的特征词组,连续执行确定操作使得目标工程关键词提取的误差率被有效的减小,进而能够准确的提取出目标工程关键词,使得工程关键词在实际应用中的适用性得到提升。

技术领域

本发明涉及数据处理领域,具体而言,涉及一种工程关键词提取方法及装置。

背景技术

在工程领域中,我们往往需要对工程文本进行处理,例如招标文件,从而提取出文件里面的关键词,以通过关键词来使得工程人员快速的获得工程文本中自己需要获得的信息。

目前,对关键词的提取大多是通过机械分词法来实现的。即文件里面的关键词与数据库中的关键词进行匹配,从而将文件里面匹配的关键词作为目标关键词提取出来。该方法虽然操作简单、方便、易于应用,但其提取的误差率很高,严重降低了该方法的适用性。

发明内容

有鉴于此,本发明的目的在于提供一种工程关键词提取方法及装置,以有效改善上述缺陷。

本发明的实施例通过如下方式实现:

第一方面,本发明实施例提供了一种工程关键词提取方法。所述方法包括:从工程文本中确定出每个具有词性的工程关键词,获得包括多个具有词性的工程关键词的多个工程关键词集合;从所述多个工程关键词集合中确定出至少一个特征词组,所述至少一个特征词组中每个特征词组均包括根据每个工程关键词的词性确定出:一待提取的工程关键词和与所述待提取的工程关键词的词性相同而词名不同的至少一个工程关键词;将所述每个特征词组中的所述至少一个工程关键词均与预设工程关键词数据库匹配,将匹配度最高的一特征词组作为目标特征词组,将所述目标特征词组中的所述待提取的工程关键词作为目标工程关键词提取。

第二方面,本发明实施例提供了一种工程关键词提取装置。所述装置包括:第一获得模块,用于从工程文本中确定出每个具有词性的工程关键词,获得包括多个具有词性的工程关键词的多个工程关键词集合。第二获得模块,用于从所述多个工程关键词集合中确定出至少一个特征词组,所述至少一个特征词组中每个特征词组均包括根据每个工程关键词的词性确定出:一待提取的工程关键词和与所述待提取的工程关键词的词性相同而词名不同的至少一个工程关键词。提取模块,用于将所述每个特征词组中的所述至少一个工程关键词均与预设工程关键词数据库匹配,将匹配度最高的一特征词组作为目标特征词组,将所述目标特征词组中的所述待提取的工程关键词作为目标工程关键词提取。

本发明实施例的有益效果是:

通过工程文本中确定出多个具有词性的工程关键词的多个工程关键词集合,再通过从多个工程关键词集合中确定出至少一个特征词组,以及再通过将每个特征词组中的至少一个工程关键词均与预设工程关键词数据库匹配,从而将匹配度最高的一特征词组作为目标特征词组,并将目标特征词组中的待提取的工程关键词作为目标工程关键词提取。因此,通过词性去确定特征词组,再从各特征词组中确定出匹配度最高的特征词组,连续执行确定操作使得目标工程关键词提取的误差率被有效的减小,进而能够准确的提取出目标工程关键词,使得工程关键词在实际应用中的适用性得到提升。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川隧唐科技股份有限公司,未经四川隧唐科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711245444.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top