[发明专利]一种基于用户行为的信息推荐方法无效
申请号: | 201310747338.9 | 申请日: | 2013-12-31 |
公开(公告)号: | CN103678710A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 蒋昌俊;陈闳中;闫春钢;丁志军;王鹏伟;何源;陈雨忱 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海天协和诚知识产权代理事务所 31216 | 代理人: | 叶凤 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 行为 信息 推荐 方法 | ||
技术领域
本发明涉及为使用搜索引擎的用户进行相关内容的推荐,具体涉及推荐用户感兴趣的内容并在一定程度上通过用户的上网行为影响搜索结果的排序。
背景技术
随着互联网的快速发展,人们正处于一个信息爆炸的时代。相对于过去的信息匮乏,面对现阶段海量的信息数据,对信息的筛选和过滤成为了衡量一个系统好坏的重要指标。同时,一个具有良好用户体验的系统,会将海量信息进行筛选和过滤,并将用户最感兴趣的信息展现在用户面前。在一定程度上,这大大增加了系统工作的效率,另一方面也节省了用户筛选信息的时间。搜索引擎的出现在一定程度上解决了信息筛选问题,但仅仅是搜索引擎是不够的。虽然搜索引擎可以帮助用户在输入关键词之后对海量信息进行筛选,从而在搜索结果中找寻所需的内容。以Google、Baidu为代表的搜索引擎已为人们熟知 ,它们都具有基于关键字、通用性较强等特点。但当用户无法准确描述自己的需求时,搜索引擎的搜索效果将受到很大影响,而用户将自己的需求和意图转化成关键词的过程本身就是一个并不轻松的过程。因此,推荐系统在一定程度上具有良好的引导和帮助用户找到所需内容的作用,使得用户在使用搜索系统的过程中具有良好的体验。
同时,记录不同用户的搜索行为,并根据不同用户的行为进行推荐将在一定程度上使得推荐内容更能满足不同用户的需求。不同的用户行为不仅仅影响了推荐内容,也会影响搜索结果的排名。例如两个不同的用户都输入“旅游”一词进行搜索,但一位是想搜索探险类的旅游,而另一位是想搜索休闲类的旅游,根据这两位不同的用户搜索引擎会根据用户的行为进行不同的推荐,否则会返回相同的结果让用户自行选择需要的内容,在一定程度上使得用户的体验感下降。
发明内容
本发明针对以上存在的问题,在已有的搜索引擎中添加相应的推荐算法,为用户推荐感兴趣的信息供用户进行选择,并在一定程度上影响搜索结果的排名,使得排名更符合不同用户的兴趣。
本发明给出的技术技术方案:
一种基于用户行为的信息推荐方法,其特征在于,方法步骤为:
步骤(1)数据来源,具体为:
通过网络爬虫爬取了网络上的网页信息,并使用最大块密度算法抽取了网页中的正文,使用IKAnalyzer进行分词,使用聚类算法将词进行聚类,最终通过形成了多个类,同时在每个类中都有一个中心词用于较好地刻画这个类,如此网络中的海量词语就形成了一个索引网。
步骤(2)用户行为处理,具体为:
当用户使用搜索引擎进行搜索时,系统会自动为该用户分配一个唯一的用户号。当用户登录后,系统会自动把用户的搜索内容和与搜索结果的交互情况记录下来,并存入数据库中。所述数据库使用了一维向量来刻画用户的搜索行为。当用户登录系统之后,输入关键字进行搜索,那么就使用向量<ID,word,num,class>(ID表示用户ID,word表示关键词,num表示搜索该关键词的次数,class表示该关键词所属的类)来记录用户的搜索行为。当呈现了搜索结果之后,如果用户点击了相应的搜索内容,则同样记录用户点击行为,即使用向量<ID, class, count>(ID表示用户ID,class表示点击内容所属的类,count表示点击该类的次数)来表示。
步骤(3)进行推荐,具体为:
推荐算法是以现有数据为基础,采用基于内容推荐的算法为用户进行推荐。在每个搜索结果的呈现中都会展示这个结果属于哪个类,那么就可以在此基础上推荐这个类中的相应内容和与这个类有关的类。在已构建的词关联网上,根据用户行为建立的数据表,按照某个类中num(用户点击次数)的大小选取前K个进行推荐。而类之间的推荐则根据count(这个类被某个用户所选择的次数)的大小取前M个进行推荐。
与现有的搜索引擎相比,添加了推荐算法在很大程度上满足了不同用户的不同搜索需求,同时也为用户呈现了更多的适应于用户兴趣的信息供用户选择,为用户的不确定搜索和搜索更多所需内容提供了方便。本发明技术方案创新点体现在:
1) 记录用户的行为将相应的数据存入数据库中,并将用户行为与推荐内容进行结合,根据用户行为提供给用户偏爱的某一类的相关推荐词。
2) 根据用户行为和已记录的数据,影响搜索结果的排序,将用户偏爱的结果排在搜索结果的前面,在一定程度上为用户使用搜索引擎带来便利也根据个性化。
附图说明
图1 词关联网;
图2 推荐系统流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310747338.9/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置