[发明专利]基于知识图谱的推荐方法、装置、设备及介质有效
| 申请号: | 202010253452.6 | 申请日: | 2020-04-02 |
| 公开(公告)号: | CN111488462B | 公开(公告)日: | 2023-09-19 |
| 发明(设计)人: | 周岩;王鑫;田国良 | 申请(专利权)人: | 中国移动通信集团江苏有限公司;中国移动通信集团有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/9535 |
| 代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 彭琼 |
| 地址: | 210029 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 知识 图谱 推荐 方法 装置 设备 介质 | ||
本发明实施例提供一种基于知识图谱的推荐方法、装置、设备及介质。该方法包括:获取第一文本数据;基于第一文本数据构建知识图谱,基于知识图谱的三元组数据对第一模型进行训练,得到分布式表示模型,第一模型是将预设的关系偏移量添加至翻译嵌入TransE模型得到的,对第一文本数据中每条文本数据进行关键词提取,得到每条文本数据的第一关键词集,获取第二文本数据,对第二文本数据进行关键词提取,得到第二文本数据的第二关键词集,基于分布式表示模型将每个第一关键词集和第二关键词集分别映射到向量空间,基于向量空间确定针对第二文本数据的推荐结果。基于该分布式表示模型融合知识图谱进行推荐,能够提高推荐结果的准确性。
技术领域
本发明涉及知识图谱技术领域,尤其涉及一种基于知识图谱的推荐方法、装置、设备和计算机可读存储介质。
背景技术
随着互联网技术和产业的迅速发展,接入互联网的服务器数量和网页数量也呈指数级上升。用户面临着海量的信息,使得信息的利用率反而降低,因此,推荐系统和推荐算法备受青睐。
目前,运营商可以根据现有的问题处理库数据,利用词袋模型推荐算法,对用户投诉问题进行相关解决方案的推荐。
但是,基于传统的推荐算法,仅根据词汇的文字匹配进行数据搜索,推荐结果发散性不足,无法匹配一些类似语义下的解决方案,推荐的准确性有待进一步提升。
发明内容
本发明实施例提供了一种基于知识图谱的推荐方法、装置、设备和计算机可读存储介质,能够为搜索样本提供更多的语义关系,深层次地发现用户敢兴趣内容,提高推荐结果的准确性。
第一方面,本发明实施例提供一种知识图谱的分布式表示模型训练方法,该方法包括:获取第一文本数据;基于第一文本数据构建知识图谱;基于知识图谱的三元组数据对第一模型进行训练,得到分布式表示模型;其中,第一模型是将预设的关系偏移量添加至翻译嵌入(Translating Embedding,TransE)模型中并进行调整而得到的。
在第一方面的一些可实现方式中,第一文本数据包括业务规则文本数据和/或工单文本数据。
在第一方面的一些可实现方式中,关系偏移量使用周期性衰减震荡函数表示。
第二方面,本发明实施例提供一种基于知识图谱的推荐方法,该方法包括:获取知识图谱,其中,知识图谱基于第一文本数据构建,第一文本数据包括多条文本数据;提取知识图谱的三元组数据中的实体词汇文本和关系词汇文本,得到第一词汇集;基于第一词汇集对第一文本数据中每条文本数据进行关键词提取,得到第一文本数据中每条文本数据的第一关键词集;获取第二文本数据,并基于第一词汇集对第二文本数据进行关键词提取,得到第二文本数据的第二关键词集;基于分布式表示模型将每个第一关键词集和第二关键词集分别映射到向量空间;基于向量空间确定针对第二文本数据的推荐结果,其中,分布式表示模型基于第一方面或者第一方面任一可实现方式中所述的知识图谱的分布式表示模型训练方法得到。
在第二方面的一些可实现方式中,基于分布式表示模型将每个第一关键词集和第二关键词集分别映射到向量空间,包括:将每个第一关键词集和第二关键词集输入到分布式表示模型进行映射,得到每个第一关键词集在向量空间的第一向量结果和第二关键词集在向量空间的第二向量结果。
在第二方面的一些可实现方式中,基于向量空间确定针对第二文本数据的推荐结果,包括:基于每个第一向量结果和第二向量结果进行词移距离计算,得到第一文本数据中每条文本数据与第二文本数据之间的损失值,根据每个损失值确定针对第二文本数据的推荐结果。
在第二方面的一些可实现方式中,该方法还包括:确定第一文本数据中每条文本数据的第一主题词,以及第二文本数据的至少一个第二主题词;基于至少一个第二主题词中每个第二主题词的词频数,确定每个第二主题词的主题因子;根据每个损失值确定针对第二文本数据的推荐结果,包括:根据每个损失值、第一文本数据中每条文本数据的第一主题词和每个第二主题词的主题因子,确定针对第二文本数据的推荐结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团江苏有限公司;中国移动通信集团有限公司,未经中国移动通信集团江苏有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010253452.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:双节点高可用的分布式存储系统
- 下一篇:一种柔性触摸屏及其制作方法





