[发明专利]一种热词的推荐方法、装置、电子设备及存储介质在审
申请号: | 201910874059.6 | 申请日: | 2019-09-17 |
公开(公告)号: | CN110765348A | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 李洋 | 申请(专利权)人: | 五八有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/332 |
代理公司: | 11363 北京弘权知识产权代理事务所(普通合伙) | 代理人: | 逯长明;许伟群 |
地址: | 300450 天津市滨海新区经济技术开*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 热词 帖子 词库 主题词库 关联 构建 匹配 画像 存储介质 电子设备 父子关系 标签词 关联性 热度 搜索 筛选 申请 | ||
1.一种热词的推荐方法,其特征在于,包括以下步骤:
获取主题词库和多个帖子;
在多个所述帖子中筛选出高评分帖子;
根据所述主题词库中每个主题词的父子关系,构建树形主题词库;
将所述高评分帖子与树形主题词库进行关联,得到树形热词库;
获取用户的用户画像,所述用户画像用于提供所述用户的多个标签词;
将每个所述标签词分别与树形热词库中的热词进行匹配,确定与所述标签词匹配的热词作为推荐热词;
将所述推荐热词推荐给用户。
2.根据权利要求1所述的方法,其特征在于,所述在多个帖子中筛选出高评分帖子,包括:
对每个所述帖子进行打分,得到每个帖子的排序系数;
选取所述排序系数大于预设分数阈值的帖子为高评分帖子。
3.根据权利要求1所述的方法,其特征在于,所述将高评分帖子与树形主题词库进行关联,得到树形热词库,包括:
获取所述帖子的索引,所述索引包括多个关键词;
将所述关键词与树形主题词库中的主题词进行匹配;
根据匹配的关键词与主题词建立关联关系,合并所述高评分帖子和树形主题词库,得到树形热词库。
4.根据权利要求1所述的方法,其特征在于,所述将每个标签词分别与树形热词库中的热词进行匹配,确定与所述标签词匹配的热词作为推荐热词,包括:
将每个所述标签词分别与树形热词库中子节点对应的热词进行匹配;
如果存在所述标签词与子节点对应的热词相同时,将匹配相同的热词作为推荐热词。
5.根据权利要求4所述的方法,其特征在于,还包括:
统计所述用户画像提供的标签词的数量,以及,根据所述标签词与子节点对应的热词进行匹配确定的推荐热词的数量;
如果所述推荐热词的数量少于标签词的数量,将标签词与树形热词库中兄弟节点对应的热词进行匹配,直至所述推荐热词的数量与标签词的数量相等时匹配结束,所述兄弟节点指的是子节点的兄弟节点。
6.根据权利要求5所述的方法,其特征在于,还包括:
如果所述标签词与树形热词库中所有兄弟节点对应的热词均匹配后,所述推荐热词的数量仍小于标签词的数量,则结束匹配过程。
7.一种热词的推荐装置,其特征在于,包括:
信息获取模块,用于获取主题词库和多个帖子;
筛选模块,用于在多个所述帖子中筛选出高评分帖子;
树形主题词库构建模块,用于根据所述主题词库中每个主题词的父子关系,构建树形主题词库;
树形热词库构建模块,用于将所述高评分帖子与树形主题词库进行关联,得到树形热词库;
用户画像获取模块,用于获取用户的用户画像,所述用户画像用于提供所述用户的多个标签词;
推荐热词确定模块,用于将每个所述标签词分别与树形热词库中的热词进行匹配,确定与所述标签词匹配的热词作为推荐热词;
推荐模块,用于将所述推荐热词推荐给用户。
8.根据权利要求7所述的装置,其特征在于,所述筛选模块,包括:
打分单元,用于对每个所述帖子进行打分,得到每个帖子的排序系数;
选取单元,用于选取所述排序系数大于预设分数阈值的帖子为高评分帖子。
9.根据权利要求7所述的装置,其特征在于,所述树形热词库构建模块,包括:
索引获取单元,用于获取所述帖子的索引,所述索引包括多个关键词;
第一匹配单元,用于将所述关键词与树形主题词库中的主题词进行匹配;
树形热词库构建单元,用于根据匹配的关键词与主题词建立关联关系,合并所述高评分帖子和树形主题词库,得到树形热词库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五八有限公司,未经五八有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910874059.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种设备数据查询方法、装置及系统
- 下一篇:一种自动排序权重操作方法