[发明专利]一种基于文本图谱的智能搜索引擎的检索方法在审
申请号: | 202110005543.2 | 申请日: | 2021-01-05 |
公开(公告)号: | CN113204696A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 王绪刚 | 申请(专利权)人: | 北京欧拉认知智能科技有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/332;G06F16/36 |
代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 林聪源 |
地址: | 100086 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 图谱 智能 搜索引擎 检索 方法 | ||
1.一种基于文本图谱的智能搜索引擎的检索方法,其特征在于,包括:
获取数据信息存储至分布式系统集群中,并构建文本图谱;
根据用户输入的搜索语句,建立节点查询语句;
根据所述节点查询语句在所述文本图谱中匹配三元组;
若匹配成功,则将匹配到的所述三元组中的实体作为搜索结果返回客户;
若匹配不成功,则对所述搜索语句进行分词,获取检索词;
利用余弦相似度公式计算所述分布式系统集群中与所述检索词相关性最高的实体并返回用户。
2.根据权利要求1所述的检索方法,其特征在于:所述数据信息包括期刊、论文、专利、百科、词典信息,国家官网、企业官网信息以及各专业、职业信息。
3.根据权利要求1所述的检索方法,其特征在于,所述构建文本图谱,包括:
从所述分布式系统集群中提取三元组;
根据三元组构建文本图谱;
将文本图谱保存至数据库中。
4.根据权利要求1所述的检索方法,其特征在于:所述根据用户输入的搜索语句,建立节点查询语句,包括:
根据用户输入的搜索语句进行实体识别和关系解析;
根据得到的所述实体和关系建立节点查询语句。
5.根据权利要求1所述的检索方法,其特征在于,所述余弦相似度公式为:
其中,
Ai表示搜索语句钟获取到检索词的分向量;
Bi表示分布式系统集群中实体的分向量;
n表示检索词及分布式系统集群中实体的分向量数。
6.根据权利要求1所述的检索方法,其特征在于,所述利用余弦相似度公式计算所述分布式系统集群中与所述检索词相关性最高的实体并返回用户,包括:
利用余弦相似度公式将所述检索词与所述分布式系统集群中的实体逐一进行相关性计算;
将计算结果中最大余弦值对应的实体返回用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京欧拉认知智能科技有限公司,未经北京欧拉认知智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110005543.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法、数据处理装置以及存储介质
- 下一篇:离合器装置及混合动力模块