[发明专利]文章召回方法及系统、文章推荐方法及系统有效
申请号: | 202110220837.7 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112948678B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 翟丁丁;林苏 | 申请(专利权)人: | 北京房江湖科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35;G06F16/26;G06F16/2458 |
代理公司: | 北京润平知识产权代理有限公司 11283 | 代理人: | 肖冰滨;王晓晓 |
地址: | 101309 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文章 召回 方法 系统 推荐 | ||
本发明涉及数据挖掘技术领域,公开一种文章召回方法、文章推荐方法及其系统。文章按照预设属性被预先划分为:多个一级分类;及每个一级分类下的多个二级分类。文章召回方法包括:根据每个二级分类下的文章数量、文章标签的平均量及文章点击率,确定每个二级分类的重要度;根据重要度、多样性比例参数及待推荐文章的目标数目,确定待召回的重要度排名前第一数目的二级分类及每个二级分类下的待召回文章的第二数目;根据多个一级分类所对应的预设属性的预设权重及文章与用户画像之间的匹配度集合,召回所述重要度排名前第一数目的二级分类中的每一者下的匹配得分排名前第二数目的文章。本发明中的召回策略同时实现召回文章的多样性与准确性。
技术领域
本发明涉及数据挖掘技术领域,具体地涉及一种文章召回方法、文章召回系统、文章推荐方法及文章推荐系统。
背景技术
目前,在导购推荐领域中存在很多提高导购文章多样性的方法。在不同的业务场景中,会有各种各样的业务规则和解决方案。主要的解决方案包括:老专家规则法:根据经验,人工设定每个类别下返回的比例,通过线上实验找到合适的集合;机器学习模型预测方法:建立一个学习模型,并构造相关特征,然后通过模型预测什么样的集合是最优的;多样性度量法:通过构造embedding(嵌入)向量表达不同组合的多样性。以上方法都被广泛地应用到文章推荐系统中。然而,在房源导购场景中,房源本身具有购买价格高、频率低、用户的访问频率和留存率较低等特点。若使用经验方法进行粗粒度推荐,很难去吸引用户并且留住用户。若使用机器学习模型预测方法会有更优的推荐效果,但是该方法开发成本较高。
发明内容
本发明的目的是提供一种文章召回方法、文章推荐方法、文章召回系统及文章推荐系统,其通过加权二级分类打散与用户画像结合的推荐方式,使得推荐策略同时考虑了文章的多样性与准确性,从而能够帮助用户更好的定位自己的需求,提升用户体验,减少成本。
为了实现上述目的,本发明一方面提供一种文章召回方法,所述文章按照预设属性被预先划分为:多个一级分类;以及每个一级分类下的多个二级分类,所述文章召回方法包括:根据每个二级分类下的文章数量、文章标签的平均数量及文章点击率,确定所述每个二级分类的重要度;根据所述每个二级分类的重要度、多样性比例参数及待推荐文章的目标数目,确定待召回的重要度排名前第一数目的二级分类及所述重要度排名前第一数目的二级分类中的每一者下的待召回文章的第二数目;以及响应于用户的查询动作,根据所述多个一级分类所对应的预设属性所占的预设权重及所述重要度排名前第一数目的二级分类中的每一者下的文章与所述用户的用户画像之间的匹配度集合,召回所述重要度排名前第一数目的二级分类中的每一者下的匹配得分排名前第二数目的文章。
优选地,所述确定所述每个二级分类的重要度包括:根据所述每个二级分类下的文章数量与文章标签的平均数量,确定所述每个二级分类下的文章丰富度;以及根据所述每个二级分类下的文章丰富度与文章点击率,确定所述每个二级分类的重要度。
优选地,所述根据所述每个二级分类下的文章丰富度与文章点击率,确定所述每个二级分类的重要度包括:根据所述每个二级分类下的文章丰富度与文章点击率的乘积,确定所述每个二级分类的重要度。
优选地,所述文章点击率由所述每个二级分类下的文章点击量、文章曝光量及曝光量阈值确定。
优选地,所述文章点击率由所述每个二级分类下的文章点击量、文章曝光量及曝光量阈值确定包括:在所述文章曝光量大于或等于所述曝光量阈值的情况下,所述文章点击率为所述文章点击量与所述文章曝光量的比值;或者在所述文章曝光量小于所述曝光量阈值的情况下,所述文章点击率为所述文章点击量与所述曝光量阈值的比值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京房江湖科技有限公司,未经北京房江湖科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110220837.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种三碟烯卡宾钯吡啶配合物及其应用
- 下一篇:音频识别方法、设备和存储介质