[发明专利]热词生成方法、装置、服务器及存储介质在审
| 申请号: | 202010712756.4 | 申请日: | 2020-07-22 |
| 公开(公告)号: | CN112000865A | 公开(公告)日: | 2020-11-27 |
| 发明(设计)人: | 金峙廷 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
| 主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9538 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 李娜 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 生成 方法 装置 服务器 存储 介质 | ||
本公开关于一种热词生成方法、装置、服务器及存储介质,该方法包括:确定每个信息主题对应的目标用户数量;根据每个信息主题对应的目标用户数量,确定热词榜单中每个信息主题待展示的热词数量;根据每个信息主题中目标用户的历史行为信息和待展示的热词数量,生成每个信息主题待展示的目标热词;确定所述目标热词在所述热词榜单中的展示位置。本公开由于在确定热词榜单中的目标热词时,结合了信息主题的目标用户数量来为每个信息主题分配待展示的热词数量,从而使得较多的信息主题的热词展示在热词榜单中,避免了只展示某一类型的信息主题,提高了热词的准确性,而且可以覆盖较多的用户,提高了热词的用户覆盖度。
技术领域
本公开涉及互联网技术领域,尤其涉及一种热词生成方法、装置、服务器及存储介质。
背景技术
相关技术中,在生成热词时主要是将点击率较高的内容提炼为热词,容易导致某一类型的信息对应的热词较多,从而导致展示的热词只能面向某一部分的用户,展示的热词不准确,覆盖的用户不全面。
发明内容
本公开提供一种热词生成方法、装置、服务器及存储介质,以至少解决相关技术中生成的热词不准确、覆盖用户不全面的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种热词生成方法,包括:
确定每个信息主题对应的目标用户数量;
根据每个信息主题对应的目标用户数量,确定热词榜单中每个信息主题待展示的热词数量;
根据每个信息主题中目标用户的历史行为信息和待展示的热词数量,生成每个信息主题待展示的目标热词;
确定所述目标热词在所述热词榜单中的展示位置。
可选的,所述根据每个信息主题中目标用户的历史行为信息和待展示的热词数量,生成每个信息主题待展示的目标热词,包括:
根据每个信息主题中目标用户的历史行为信息,生成每个信息主题对应的热词;
根据每个信息主题对应热词的使用频次,从每个信息主题对应的热词中确定出待展示的热词数量预设倍数的热词,作为每个信息主题对应的候选热词;
从每个信息主题对应的候选热词中选取所述热词数量的候选热词,作为每个信息主题待展示的目标热词。
可选的,在所述根据每个信息主题中目标用户的历史行为信息,生成每个信息主题对应的热词之前,还包括:
根据每个信息主题中每个目标用户的使用频次,将每个信息主题中的目标用户分为活跃用户和非活跃用户;
所述根据每个信息主题中目标用户的历史行为信息,生成每个信息主题对应的热词,包括:
根据每个信息主题中活跃用户的历史行为信息,生成每个信息主题对应的热词。
可选的,在所述确定所述目标热词在所述热词榜单中的展示位置之后,还包括:
在当前调节时间区间内,确定所述热词榜单中每个信息主题的目标热词对应的非活跃用户的使用频次;
根据每个信息主题中非活跃用户对目标热词的使用频次和非活跃用户的数量,确定每个信息主题中目标热词的引流率;
若一个信息主题中目标热词的引流率小于引流率阈值,则从该信息主题对应的候选热词中选取一个所述目标热词之外的候选热词,并使用选取到的候选热词替换所述热词榜单中的目标热词。
可选的,所述根据每个信息主题中每个目标用户的使用频次,将每个信息主题中的目标用户分为活跃用户和非活跃用户,包括:
若一个信息主题中一个目标用户的使用频次小于该信息主题对应的频次阈值,则将该目标用户作为该信息主题的非活跃用户;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010712756.4/2.html,转载请声明来源钻瓜专利网。





