[发明专利]一种推送文本的确定方法、装置、计算机设备和介质在审
| 申请号: | 202010020236.7 | 申请日: | 2020-01-09 |
| 公开(公告)号: | CN111209480A | 公开(公告)日: | 2020-05-29 |
| 发明(设计)人: | 吴明平;梁新敏;陈羲;吴明辉 | 申请(专利权)人: | 上海风秩科技有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/33;G06F16/34 |
| 代理公司: | 北京超成律师事务所 11646 | 代理人: | 吴迪 |
| 地址: | 200333 上海市普陀*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 推送 文本 确定 方法 装置 计算机 设备 介质 | ||
本发明公开了一种推送文本的确定方法、装置、计算机设备和介质,所述方法包括:获取候选文本和目标用户的历史浏览文本;分别生成所述候选文本的第一摘要和所述历史浏览文本的第二摘要;根据所述第一摘要和所述第二摘要的词频相似度,确定所述候选文本与所述历史浏览文本的相似度;若相似度超过预设阈值,则确定所述候选文本为向所述目标用户推送的文本。本申请实施例,通过获取到的候选文本的第一摘要和历史浏览文本的第二摘要,计算候选文本与历史浏览文本之间的相似度,能够准确的确定出候选文本能否直接向目标用户进行推送,提高了向目标用户推送文本的准确度。
技术领域
本申请涉及数据分析领域,尤其涉及一种推送文本的确定方法、装置、计算机设备和介质。
背景技术
随着互联网的高速发展与科技水平的日益提高,为了用户体验,在一些互联网平台中会主动向用户推送一些文本,以最大的程度去满足用户的需求。
一般在向用户推送文本的时候,基本上是通过遍历待推送文本的标签,在待推送文本中筛选出与用户标签相匹配的文本,将筛选出的文本推送给用户,但是在这种推送文本的方式中,待推送文本的标签基本上是人为标注的,可能会存在标注错误,或标注不全面的情况,进而,导致向用户推送的文本是不准确的。
发明内容
有鉴于此,本申请的目的在于提供了一种推送文本的确定方法、装置、计算机设备和介质,以解决现有技术中如何提高向用户推送文本的准确性的问题。
第一方面,本申请实施例提供给了一种推送文本的确定方法,包括:
获取候选文本和目标用户的历史浏览文本;
分别生成所述候选文本的第一摘要和所述历史浏览文本的第二摘要;
根据所述第一摘要和所述第二摘要的词频相似度,确定所述候选文本与所述历史浏览文本的相似度;
若相似度超过预设阈值,则确定所述候选文本为向所述目标用户推送的文本。
可选的,还包括:
对所述候选文本进行分句处理,得到至少一个自然语句;
针对每一个自然语句,计算该自然语句与其他自然语句的词频相似度;
针对每一个自然语句,根据该自然语句与其他自然语句的词频相似度,确定该自然语句的重要程度;
根据每一个自然语句的重要程度,确定出所述候选文本所对应的第一摘要。
可选的,所述候选文本包括以下文本中的任意一种或多种:未被播放过的广告文案和已经发布在互联网平台中的文本。
可选的,若相似度超过预设阈值,则确定所述候选文本为向所述目标用户推送的文本,包括:
若相似度超过预设阈值,则根据所述候选文本的相似度和所述候选文本的发布时间,计算所述候选文本的推荐价值;
若所述推荐价值超过预设推荐价值,则确定所述候选文本为向所述目标用户推送的文本。
可选的,所述候选文本的相似度与所述推荐价值成正相关性;所述候选文本的发布时间与所述推荐价值成正相关性。
可选的,根据所述第一摘要和所述第二摘要的词频相似度,确定所述候选文本与所述历史浏览文本的相似度,包括:
根据所述第一摘要确定所述第一摘要所对应的第一特征向量;
根据所述第二摘要确定所述第二摘要所对应的第二特征向量;
根据所述第一特征向量和所述第二特征向量,计算所述候选文本与所述历史浏览文本的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海风秩科技有限公司,未经上海风秩科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010020236.7/2.html,转载请声明来源钻瓜专利网。





