[发明专利]一种知识图谱的生成方法、装置、计算机存储介质及终端在审
| 申请号: | 202010361971.4 | 申请日: | 2020-04-30 |
| 公开(公告)号: | CN111563170A | 公开(公告)日: | 2020-08-21 |
| 发明(设计)人: | 邓礼志;于皓;张杰;袁杰;罗华刚;李犇 | 申请(专利权)人: | 北京明略软件系统有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35 |
| 代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王康;龙洪 |
| 地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 知识 图谱 生成 方法 装置 计算机 存储 介质 终端 | ||
1.一种知识图谱的生成方法,包括:
对收藏夹中的每一条网页文本,获取网页文本中包含的实体信息;
建立实体信息中的实体与本体、及实体之间的链接,获得用于展示收藏夹的图谱;
其中,所述本体包括以下关键信息之一:标题和网页文本内容;所述实体包括以下一项或任意组合:除作为所述本体的其余所述关键信息、收藏时间、分类信息和关键字信息。
2.根据权利要求1所述的生成方法,其特征在于,所述实体信息包括所述关键信息和/或收藏时间时,所述获取网页文本中包含的实体信息,包括:
对所述收藏夹中的每一条网页文本分别进行特征提取,获得所述关键信息和/或所述收藏时间。
3.根据权利要求1所述的生成方法,其特征在于,所述实体信息包括分类信息时,所述获取网页文本中包含的实体信息,包括:
对所述收藏夹中的每一条网页文本进行分类,获得所述分类信息。
4.根据权利要求1所述的生成方法,其特征在于,所述实体信息包括关键字信息时,所述获取网页文本中包含的实体信息,包括:
对所述收藏夹中的每一条网页文本包含的网页文本内容分别进行关键字提取,获得所述关键字信息。
5.根据权利要求2~4任一项所述的生成方法,其特征在于,所述建立实体信息中的实体与本体、及实体之间的链接,包括:
对所述收藏夹的每一个网页文本,将每一个所述实体分别与所述本体通过边建立链接;
获取的所述收藏夹的不同网页文本的所述实体相同时,合并不同网页文本的链接中的相同实体。
6.根据权利要求5所述的生成方法,其特征在于,所述获得用于展示收藏夹的图谱之后,所述方法还包括:
接收到检索式为具体实体的检索,显示与所述具体实体建立的预设度数的链接;和/或,
所述实体信息中包含收藏时间,且接收到检索式为时间区间信息的检索,按照先后顺序显示收藏时间处于所述时间区间内的所有链接。
7.一种计算机存储介质,所述计算机存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1~6中任一项所述的知识图谱的生成方法。
8.一种终端,包括:存储器和处理器,所述存储器中保存有计算机程序;其中,
处理器被配置为执行存储器中的计算机程序;
所述计算机程序被所述处理器执行时实现如权利要求1~6中任一项所述的知识图谱的生成方法。
9.一种知识图谱的生成装置,包括:获取单元和图谱单元;其中,
获取单元设置为:对收藏夹中的各网页文本,获取网页文本中包含的实体信息;
图谱单元设置为:建立实体信息中的实体与本体、及实体之间的链接,获得用于展示收藏夹的图谱;
其中,所述本体包括以下关键信息之一:标题和网页文本内容;所述实体包括以下一项或任意组合:除作为所述本体的其余所述关键信息、收藏时间、分类信息和关键字信息。
10.根据权利要求9所述的生成装置,其特征在于,所述图谱单元是设置为:
对所述收藏夹的每一个网页文本,将每一个所述实体分别与所述本体通过边建立链接;
获取的所述收藏夹的不同网页文本的所述实体相同时,合并不同网页文本的链接中的相同实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010361971.4/1.html,转载请声明来源钻瓜专利网。





