[发明专利]基于专利数据的专家挖掘方法、系统、存储介质及电子终端在审
申请号: | 201910015925.6 | 申请日: | 2019-01-08 |
公开(公告)号: | CN109740947A | 公开(公告)日: | 2019-05-10 |
发明(设计)人: | 刘晋元;朱悦;黄鹏;徐旻昕;王茜;胡寅骏 | 申请(专利权)人: | 上海市研发公共服务平台管理中心 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/18 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 高彦 |
地址: | 200235 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 专利数据 子领域 存储介质 电子终端 分类模型 目标领域 专利领域 挖掘 人工智能技术 价值评价 人工标注 信息挖掘 专家信息 专利IPC 分类 构建 漏检 贴合 关联 分析 全球 | ||
本发明提供基于专利数据的专家挖掘方法、系统、存储介质及电子终端,其具体包括:构建目标领域的专利池;建立用于对所述专利池中的各项专利按照目标领域的子领域进行分类的专利领域分类模型;对基于所述专利领域分类模型所获的各子领域中的各项专利进行价值评价,并根据评价结果信息挖掘该子领域中与被评价专利相关联的专家。本发明基于人工智能技术对专利数据进行分析和挖掘,从而能够高效获得特定领域全球科技专家信息,大量减少人工标注成本,大幅降低目标专利漏检的可能性,且解决专利IPC分类不够贴合行业的问题。
技术领域
本发明涉及数据挖掘领域,特别是涉及基于专利数据的专家挖掘方法、系统、存储介质及电子终端。
背景技术
人才作为国家发展的核心竞争力,一直以来都是世界各国竞相争夺的焦点。人才挖掘作为数据挖掘在业务方向上的一个分支,也具有属于统计学、机器学习、数据库、人工智能等技术学科交叉的特点,特别是对于科技专家类人才的挖掘,更是需要人工智能技术予以辅助。
用于挖掘科技专家的数据来源非常广泛,例如科技文献数据、专利数据或者获奖信息等等。其中,专利数据因其能够体现出科技专家的创新能力与知识财产保护意识而被广受青睐。
但是,现有技术就如何利用专利数据挖掘科技人才这方面做的还不够智能,导致无法有效、准确且快速地完成科技专家的挖掘任务。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供基于专利数据的专家挖掘方法、系统、存储介质及电子终端,用于解决现有技术中专利IPC分类不够贴合行业,无法有效挖掘专家的问题。
为实现上述目的及其他相关目的,本发明提供一种基于专利数据的专家挖掘方法,其包括:S1:构建目标领域的专利池;S2:建立用于对所述专利池中的各项专利按照目标领域的子领域进行分类的专利领域分类模型;S3:对基于所述专利领域分类模型所获的各子领域中的各项专利进行价值评价,并根据评价结果信息挖掘该子领域中与被评价专利相关联的专家。
于本发明的一实施例中,步骤S1包括:S11:扩展适用于所述目标领域的目标领域检索词以形成检索词集合;S12:利用所述检索词集合中的检索词进行专利检索,以构建目标领域的专利池。
于本发明的一实施例中,在执行步骤S12之前,先执行:滤除所述检索词集合中的噪声数据,以获得滤除噪音数据后的检索词集合。
于本发明的一实施例中,步骤S11包括:基于词嵌入算法将基于所述目标领域检索词检索得到的专利文本转换为词向量;计算各词向量与所述目标领域检索词之间的相似度,并将其中符合相似度要求的词向量所对应的词汇放入所述检索词集合中。
于本发明的一实施例中,步骤S11包括:利用外部语义资源获取所述目标领域检索词的关联词;所述关联词包括上位词和/或下位词。
于本发明的一实施例中,步骤S13包括:利用滤除噪音数据后的检索词集合中的检索词进行专利摘要检索;按照专利号将检索结果中隶属于同一专利的多个专利版本中与所构建的专利池关联度不符合要求的专利版本排除。
于本发明的一实施例中,步骤S2包括:S21:通过专利IPC分类号对专利池中的各专利做初步分类;S22:从初步分类结果中抽取多个种子专利;S23:按照预设分支方向对所述种子专利进行标注,并利用词嵌入算法将种子专利的专利摘要转换为相应的专利向量;S24:利用标注结果和专利向量并基于监督学习算法建立专利领域分类模型。
于本发明的一实施例中,步骤S3包括:对各子领域中的各项专利进行价值评价以获得每一项专利相应的价值分值;S32:计算该子领域中隶属于同一专家的多项专利的价值分值平均值,该计算结果值用作挖掘该子领域中专家的衡量标准;S33:基于匹配算法将名称表述方式不同的专利申请人进行标准化处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海市研发公共服务平台管理中心,未经上海市研发公共服务平台管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910015925.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理