[发明专利]根据用户兴趣点/关注点进行个性化推荐的方法和系统有效
申请号: | 201310304671.2 | 申请日: | 2013-07-19 |
公开(公告)号: | CN103399883B | 公开(公告)日: | 2017-02-08 |
发明(设计)人: | 徐倩;向伟;陈明星;詹金波;黄硕 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京铭硕知识产权代理有限公司11286 | 代理人: | 王艳娇,戴嵩玮 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 根据 用户 兴趣 关注点 进行 个性化 推荐 方法 系统 | ||
技术领域
本发明涉及网络通信,更具体地讲,涉及一种根据用户兴趣点进行个性化推荐的方法和系统。
背景技术
随着电子信息技术的发展,网络已经改变了人们的生活方式。例如,人们可以利用网络获取自己感兴趣的书籍、电影、音乐、商品等,因此网络带给了人们高效快捷的生活。人们已经习惯利用计算机、手机等具有上网功能的设备,通过浏览自己感兴趣的网页进行学习、娱乐、购物等来满足自身多方位的需求。
一般,用户通过在网络的搜索引擎输入关键字来找到感兴趣的网页。然而通过这种搜索引擎的搜索,会呈现给用户非常多的网页,因此给用户找到自己期望的内容带来困难。
发明内容
本发明目的是实现从用户在多个产品线上的行为记录,挖掘用户的关注需求点来弥补单一产品线用户行为的稀疏性,从多个维度充分地了解和刻画用户,从而给用户提供更好的个性化的搜索和推荐服务。
本发明的目的在于提供一种根据用户兴趣点进行个性化推荐的方法和系统。
根据本发明的一方面,提供了一种根据用户兴趣点/关注点进行个性化推荐的方法,该方法包括:(a)整合用户在多个产品线上的在预定时间段内的用户行为日志;(b)针对用户在预定时间段内的行为日志进行会话划分;(c)对划分的会话的用户行为日志进行同类需求行为信息整合并且挖掘用户关注点/兴趣点;(d)根据挖掘出的用户兴趣点/关注点通过推荐排序模型展示针对用户兴趣点/关注点的个性化推荐。
步骤(b)可包括以下子步骤:针对用户在预定时间段内的行为日志进行块划分;通过使用分类器来判断划分的块集合所在的会话。
所述块划分可基于以下规则中的至少一个来执行:规则1:时间完全相同的连续日志归为同一个块;规则2:如果连续的2条日志时间间隔大于一定时间,则归为不同的块;规则3:如果连续日志的产品线为特定产品线,则将之归为同一个块;规则4:对比当前日志中抽取的文本信息和上一条日志中抽取的文本信息是否相同,如果相同则归为同一个块,否则为新的一个块的开始。
判断划分的块集合所在的会话的步骤可包括:通过遍历划分的块集合,对于给定当前块,首先判断是否和上一个块同属于一个会话中;如果是,则将该块归入前一个块所在的会话;否则利用回溯策略,判断往前看预定时间内的所有块中是否有与当前块同属于一个会话的块,如果有,则将当前块归入找到的块所在的会话中,否则将当前块归入新的会话中。
步骤(c)可包括以下子步骤:通过提取划分的会话中的特定字段来计算目标数据;利用主题分类技术来计算每个目标的主题,并将每个主题分类相同的目标归并在一起以形成多个目标集合;对每个目标集合进行分词以建立术语共现图;通过应用图聚类算法来识别用户兴趣点/关注点。
展示针对用户兴趣点/关注点的个性化推荐的步骤可包括:当用户在搜索引擎中进行搜索时,基于用户输入的搜索词将符合用户兴趣点/关注点的个性化推荐显示在搜索结果的前面。
展示针对用户兴趣点/关注点的个性化推荐的步骤可包括:在用户浏览网页时,在除浏览的网页的主要区块的其余区块中显示符合用户兴趣点/关注点的个性化推荐。
根据本发明的另一方面,提供了一种根据用户兴趣点/关注点进行个性化推荐的系统,该系统包括:整合数据源模块,用于整合用户在多个产品线上的在预定时间段内的用户行为日志;会话划分模块,用于针对用户在预定时间段内的行为日志进行会话划分;关注点/兴趣点挖掘模块,用于对划分的会话的用户行为日志进行同类需求行为信息整合并且挖掘用户关注点/兴趣点;个性化推荐模块,用于根据挖掘出的用户兴趣点/关注点通过推荐排序模型展示针对用户兴趣点/关注点的个性化推荐。
会话划分模块可包括:块划分子模块,用于针对用户在预定时间段内的行为日志进行块划分;会话划分子模块,用于通过使用分类器来判断划分的块集合所在的会话。
块划分子模块可基于以下规则中的至少一个来执行块划分:规则1:时间完全相同的连续日志归为同一个块;规则2:如果连续的2条日志时间间隔大于一定时间,则归为不同的块;规则3:如果连续日志的产品线为特定产品线,则将之归为同一个块;规则4:对比当前日志中抽取的文本信息和上一条日志中抽取的文本信息是否相同,如果相同则归为同一个块,否则为新的一个块的开始。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310304671.2/2.html,转载请声明来源钻瓜专利网。