[发明专利]一种用户知识数据的处理方法、装置、设备及存储介质在审
| 申请号: | 202111254555.5 | 申请日: | 2021-10-27 |
| 公开(公告)号: | CN113987178A | 公开(公告)日: | 2022-01-28 |
| 发明(设计)人: | 李明琦 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06N3/04;G06N3/08 |
| 代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 项京;马敬 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用户 知识 数据 处理 方法 装置 设备 存储 介质 | ||
1.一种用户知识数据的处理方法,包括:
获得目标用户对应的多个待处理知识数据;
针对每个待处理知识数据,提取该待处理知识数据的多个标签,得到与目标用户对应的多个目标标签;
基于所述多个目标标签,生成包含各个目标标签之间的关联关系的知识图谱;
基于各个待处理知识数据的内容,对各个待处理知识数据进行分类,得到每个待处理知识数据的内容类型;
针对每种内容类型的待处理知识数据,基于该种内容类型的待处理知识数据的内容和标签,以及所述知识图谱中各个目标标签之间的关联关系,生成与该内容类型对应的知识文档。
2.根据权利要求1所述的方法,其中,
所述获得目标用户对应的多个待处理知识数据的步骤,包括:
获得目标用户在浏览数据过程中标注过的第一知识数据;或从目标用户浏览的历史数据中获得的用户搜索和/或推荐的第二知识数据,以及与第二知识数据关联的第三知识数据,作为待处理知识数据。
3.根据权利要求1所述的方法,其中,
所述针对每个待处理知识数据,提取该数据内容的多个标签,得到与目标用户对应的多个目标标签的步骤,包括:
将从所述目标用户对应的多个待处理知识数据中提取出的多个标签,作为第一标签;
获得与目标用户具有社会关联关系的其他用户所对应的多个标签,作为第二标签;
将所述第一标签和第二标签,作为与目标用户对应的多个目标标签。
4.根据权利要求1所述的方法,其中,
所述多个目标标签至少包括:主题标签、实体标签和话题标签。
5.根据权利要求4所述的方法,其中,
所述主题标签,采用如下步骤提取:
针对每个待处理知识数据的内容,采用预设的主题分类模型,对内容进行主题词提取,将提取出的主题词,作为该待处理知识数据的主题标签。
6.根据权利要求4所述的方法,其中,
所述话题标签,采用如下步骤提取:
将每个待处理知识数据的内容,分别与预设的固定话题标签进行语义相关度计算,将语义相关度大于预设阈值的每个固定话题标签,分别作为该待处理知识数据的一个话题标签;和/或
基于预设的提取算法,对每个待处理知识数据的内容进行关键词提取,将提取出的至少一个关键词作为该待处理知识数据的至少一个话题标签。
7.根据权利要求4所述的方法,其中,
所述实体标签,采用如下步骤提取:
对每个待处理知识数据的内容,进行语义分析和句法分析,基于句法结构,提取出每个待处理知识数据的内容中各个句子的实体,得到每个待处理知识数据的内容的实体标签。
8.根据权利要求1所述的方法,其中,
所述基于所述多个目标标签,生成包含各个目标标签之间的关联关系的知识图谱的步骤,包括:
基于主题标签、实体标签和话题标签的来源,确定实体标签与主题标签之间的关联关系,以及实体标签与话题标签之间的关联关系;
基于不同主题标签之间的相似度、主题标签与话题标签的相似度以及不同话题标签之间的相似度,确定不同主题标签之间的关联关系、主题标签与各个话题标签之间的关联关系以及不同话题标签之间的关联关系。
9.根据权利要求4所述的方法,其中,
所述多个目标标签还包括:观点标签和/或情感特征标签。
10.根据权利要求1所述的方法,其中,
所述内容类型,包括:概念类型、结构类型、辩证类型或深度思考类型中的一种或多种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111254555.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型生物降解诱虫板及其制备方法
- 下一篇:一种台面可扩展调节的展示台
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





