[发明专利]一种基于文物知识图谱的智能语义检索方法有效
| 申请号: | 202010290760.6 | 申请日: | 2020-04-14 |
| 公开(公告)号: | CN111522910B | 公开(公告)日: | 2022-05-31 |
| 发明(设计)人: | 田若言;林怀忠 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06F40/242;G06F40/295;G06F40/30 |
| 代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 曹兆霞 |
| 地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 文物 知识 图谱 智能 语义 检索 方法 | ||
本发明公开了一种基于文物知识图谱的智能语义检索方法,包括以下步骤:(1)检索语句的实体映射:利用实体识别模型识别用户检索语句的识别实体,并通过同义词典对识别实体进行描述归一化后,在文物知识图谱中对识别实体进行定位,即确定在文物知识图谱中与识别实体对应的对应实体;(2)检索语句的关系映射:根据对应实体的实体类型,采用与该实体类型对应的关系映射模型对对应实体进行用户检索意图的知识图谱关系映射,确定映射关系;(3)根据所述对应实体和所述映射关系生成满足知识图谱查询模式语句,并用此查询模式语句来进行文物知识图谱的检索。该智能语义检索方法相比于关键字匹配检索,能更加满足用户检索需求。
技术领域
本发明涉及自然语言处理、语义解析和信息抽取等技术领域,具体来说涉及一种基于文物知识图谱的智能语义检索方法。
背景技术
随着信息技术的飞速发展,互联网中的信息量也呈爆炸指数的增长。互联网中充斥着的海量数据,为大数据分析提供了一个天然的数据基础,也为用户提供了一个丰富广泛的信息查询源。在大量的数据中,人们往往需要借助搜索引擎的帮助来检索自己需要的信息,然而目前搜索引擎的检索效果并不好,会返回给用户大量的相关结果,用户仍需在查询结果中进行进一步的筛选,无法满足用户日益提高的标准和智能化检索的请求。而对于文物这类面向专业知识的检索更是如此,由于文物领域的专业性和特殊性,搜索引擎往往无法给出用户满意的检索结果,因此研究一种满足用户要需求的智能检索方法迫在眉睫。
如百度、Google等传统搜索引擎仍以关键字匹配、PageRank和倒排索引等经典方法作为其检索依据,即在网络文档中进行关键词匹配,以关键词共同命中数作为倒排索引的依据返回给用户。已有的一些优化主要针对用户输入端,即对用户输入的检索语句进行分词等自然语言处理方法,将一条文本语句解析成多个用户查询意图关键词,再进行联合查询。这样的解析方法主要为浅层语义解析,去除了用户输入中的停用词等无用查询内容,增加了用户查询的准确率。但这样的方法并没有对用户输入的检索语句进行深层的语义分析,无法理解用户的查询意图,查询方法也较为刻板。
在智能语义检索的研究领域中,知识图谱其中一种解决方法。知识图谱是一种适用于进行智能语义检索的信息组织形式,它表现为一个特殊的语义网络,用图的形式来描述现实世界中实体以及实体之间的关系,图中的节点表示一个实体,节点之间的边表示两个实体之间的关系。知识图谱用实体,实体,关系这样的三元组形式将大量的、离散的信息用结构化的方式组织起来,将自然语言表达的信息映射到具有一定规则模式的知识图谱中,让文物与文物、文物知识与其他补充描述性知识信息进行关联,使得文物不再是一个个信息孤岛,为用户在文物方面的智能语义检索提供了数据结构基础和查询途径。智能语义检索不再拘泥于用户检索请求的字面本身,不再严格地执行关键字匹配操作,而是结合自然语言处理领域中的命名实体识别和关系检测技术,使用深度学习方法,理解用户的搜索意图,从而准备、全面地返回给用户最符合其心理要求的检索结果。
发明内容
针对上述问题,本发明提供了一种基于文物知识图谱的智能语义检索方法,通过实体映射过程,识别出用户检索请求文本中的文物领域信息实体,将实体连接至文物知识图谱中,再通过关系映射,预测出检索文本在知识图谱中所对应的关系,完成文物知识的智能语义检索。
本发明的技术方案为:
一种基于文物知识图谱的智能语义检索方法,包括以下步骤:
(1)检索语句的实体映射:利用实体识别模型识别用户检索语句的识别实体,并通过同义词典对识别实体进行描述归一化后,在文物知识图谱中对识别实体进行定位,即确定在文物知识图谱中与识别实体对应的对应实体;
(2)检索语句的关系映射:根据对应实体的实体类型,采用与该实体类型对应的关系映射模型对对应实体进行用户检索意图的知识图谱关系映射,确定映射关系;
(3)根据所述对应实体和所述映射关系生成满足知识图谱查询模式语句,并用此查询模式语句来进行文物知识图谱的检索。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010290760.6/2.html,转载请声明来源钻瓜专利网。





