[发明专利]一种关键词自动抽取方法有效
申请号: | 201810611476.7 | 申请日: | 2018-06-13 |
公开(公告)号: | CN108920456B | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 吕学强;董志安 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/216 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关键词 自动 抽取 方法 | ||
本发明涉及一种关键词自动抽取方法,包括:抽取技术标准中的通用词,抽取候选关键词,针对候选关键词过滤通用词后,综合位置特征、词共现特征以及上下文语义特征计算候选关键词权重得分,根据候选关键词权重得分范围计算动态阈值,利用动态阈值确定结果关键词。本发明提供的关键词自动抽取方法,融合位置特征、词共现特征以及上下文语义特征抽取关键词,综合考虑文档内部位置以及上下文语义特征对关键词的权重影响,达到了更高的正确率和召回率,提高了3GPP技术标准检索质量,降低了人工成本,可以很好地满足实际应用的需要。
技术领域
本发明属于关键词自动抽取技术领域,具体涉及一种面向3GPP技术标准的关键词自动抽取方法。
背景技术
移动通信技术的蓬勃发展给人类社会带来了划时代的变革。作为通信领域前沿技术的规范制定者,第三代合作伙伴计划(The 3rd Generation Partnership Project,简称3GPP)致力于推广基于演进的全球移动通信(GSM)核心网络(包括WCDMA、TD-SCDMAE、EDGE等)的3G标准。
近年来,大型通信科技公司之间关于专利侵权诉讼纠纷的案例屡见不鲜,发明专利权的稳定性受到前所未有的挑战。3GPP技术标准在通信专利审查工作中扮演着无法替代的重要角色。
3GPP技术标准是通信领域专利审查工作中特有的一类科技型非专利文献,通常作为对比文件来衡量通信领域申请专利的创造性和新颖性。
典型的3GPP技术标准Cover中主要包含标准号、发布号、文档标题以及版本号信息,Forword部分解释版本号,Scope部分声明应用范围,Reference部分给出参考文献列表,Definitions and abbreviations部分列出文档的重要定义及缩写,Topic body分章节具体介绍技术背景及细节,Annex主要涉及版本改变历史。
此外,3GPP技术标准与专利文献之间还存在相互引用的关联关系,其与专利文献间的区别如表1所示。
表1专利文献与3GPP技术标准区别
从表1中可以看出,3GPP技术标准具有自身独特的组织结构和类型。实际专利审查中主要关注的是技术规范(Technical Specification,TS)、技术报告(Technical Report,TR)以及会议文件。其中,技术规范和技术报告集中描述了技术相关规定、原理、仿真以及实验结果,会议文件主要记录各工作组具体的会议信息。相对而言,技术规范和技术报告内容格式相近,且承载的核心技术信息较为丰富,蕴藏着更大的挖掘价值。
在实际专利审查中,3GPP技术标准的检索主要依据审查员手工选取的关键词展开。检索结果的好坏往往依赖于关键词的质量,这种传统方式不仅耗时耗力,而且很难保证对比文件的命中率。相比专利文献,3GPP技术标准具有覆盖面广、信息量大、格式不规整以及可读性弱的特点,这些特点直接决定了3GPP技术标准较专利文献在自动抽取关键词方面具有更高的难度。因此,提高3GPP技术标准关键词的自动抽取效果不仅有助于提升通信专利审查效率,而且对维护专利授权稳定性具有重大意义。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810611476.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汉语自动生成文本的自动评价方法
- 下一篇:地址识别方法和装置及存储介质