[发明专利]基于专利数据的专家挖掘方法、系统、存储介质及电子终端在审
| 申请号: | 201910015925.6 | 申请日: | 2019-01-08 |
| 公开(公告)号: | CN109740947A | 公开(公告)日: | 2019-05-10 |
| 发明(设计)人: | 刘晋元;朱悦;黄鹏;徐旻昕;王茜;胡寅骏 | 申请(专利权)人: | 上海市研发公共服务平台管理中心 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/18 |
| 代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 高彦 |
| 地址: | 200235 上海*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 专利数据 子领域 存储介质 电子终端 分类模型 目标领域 专利领域 挖掘 人工智能技术 价值评价 人工标注 信息挖掘 专家信息 专利IPC 分类 构建 漏检 贴合 关联 分析 全球 | ||
1.一种基于专利数据的专家挖掘方法,其特征在于,包括:
S1:构建目标领域的专利池;
S2:建立用于对所述专利池中的各项专利按照目标领域的子领域进行分类的专利领域分类模型;
S3:对基于所述专利领域分类模型所获的各子领域中的各项专利进行价值评价,并根据评价结果信息挖掘该子领域中与被评价专利相关联的专家。
2.根据权利要求1所述的基于专利数据的专家挖掘方法,其特征在于,步骤S1包括:
S11:扩展适用于所述目标领域的目标领域检索词以形成检索词集合;
S12:利用所述检索词集合中的检索词进行专利检索,以构建目标领域的专利池。
3.根据权利要求2所述的基于专利数据的专家挖掘方法,其特征在于,在执行步骤S12之前,先执行:
滤除所述检索词集合中的噪声数据,以获得滤除噪音数据后的检索词集合。
4.根据权利要求2所述的基于专利数据的专家挖掘方法,其特征在于,步骤S11包括:
基于词嵌入算法将基于所述目标领域检索词检索得到的专利文本转换为词向量;
计算各词向量与所述目标领域检索词之间的相似度,并将其中符合相似度要求的词向量所对应的词汇放入所述检索词集合中。
5.根据权利要求2所述的基于专利数据的专家挖掘方法,其特征在于,步骤S11包括:
利用外部语义资源获取所述目标领域检索词的关联词;所述关联词包括上位词和/或下位词。
6.根据权利要求3所述的基于专利数据的专家挖掘方法,其特征在于,包括:
利用滤除噪音数据后的检索词集合中的检索词进行专利摘要检索;
按照专利号将检索结果中隶属于同一专利的多个专利版本中与所构建的专利池关联度不符合要求的专利版本排除。
7.根据权利要求1所述的基于专利数据的专家挖掘方法,其特征在于,步骤S2包括:
S21:通过专利IPC分类号对专利池中的各专利做初步分类;
S22:从初步分类结果中抽取多个种子专利;
S23:按照预设分支方向对所述种子专利进行标注,并利用词嵌入算法将种子专利的专利摘要转换为相应的专利向量;
S24:利用标注结果和专利向量并基于监督学习算法建立专利领域分类模型。
8.根据权利要求1所述的基于专利数据的专家挖掘方法,其特征在于,步骤S3包括:
S31:对各子领域中的各项专利进行价值评价以获得每一项专利相应的价值分值;
S32:计算该子领域中隶属于同一专家的多项专利的价值分值平均值,该计算结果值用作挖掘该子领域中专家的衡量标准;
S33:基于匹配算法将名称表述方式不同的专利申请人进行标准化处理。
9.根据权利要求8所述的基于专利数据的专家挖掘方法,其特征在于,步骤S31包括:
基于Patent Rank算法对中文专利进行价值评价;其中,所述价值评价包括法律价值评价、技术价值评价或经济价值评价中的任一种或多种组合。
10.根据权利要求8所述的基于专利数据的专家挖掘方法,其特征在于,步骤S31包括:
利用引证与被引证得分以及多国申请数量得分,计算英文专利的价值分值;所述英文专利的价值分值被表示为:S(p)=k·PR(p)+(1-k)·F(p);
其中,PR(p)表示引证与被引证获得的得分,k表示调整权重的参数;F(p)表示多国申请数量得分,其被表示为基于参数f(c)来进行分段的且与参数b(c)相关的分段函数;其中,参数f(c)表示多国专利局专利申请国数,参数b(c)表示多国专利局是否申请别国专利。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海市研发公共服务平台管理中心,未经上海市研发公共服务平台管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910015925.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





