[发明专利]一种推送资讯信息的方法及系统有效
| 申请号: | 201310175119.8 | 申请日: | 2013-05-13 |
| 公开(公告)号: | CN103294778B | 公开(公告)日: | 2019-07-23 |
| 发明(设计)人: | 黄超;刘其文;饶俊阳 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F17/21 |
| 代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 推送 资讯 信息 方法 系统 | ||
本发明提供了一种推送资讯信息的方法,包括:依据预先生成的相关标签及对应的相关强度,在标签的推荐列表中加入所述相关标签的资讯信息,并对所述推荐列表中的资讯信息进行排序,将排序后得到的推荐列表推送给用户;本发明还提供一种推送资讯信息的系统。根据本发明提供的技术方案,能够提高推荐列表中资讯信息的多样性,满足用户的推荐需求。
【技术领域】
本发明涉及互联网应用领域,尤其涉及一种推送资讯信息的方法及系统。
【背景技术】
资讯信息是一种用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯信息主要包括新闻、动态信息、技术信息、政策、评论和学术论文等,资讯信息的时效范围远远大于新闻的时效范围。目前,资讯信息都有对应的标签(tag),tag是一种比分类更具体、更准确,是可以概括资讯信息主要内容的关键词;在多种场景下为了理解tag的含义,并多样性的将tag相关的资讯信息推荐给用户,需要挖掘tag之间的关系,即tag之间的相关强度。
目前,向用户推荐资讯信息的技术中存在以下缺陷:
1、仅将tag相关的资讯信息推荐给用户,导致推荐内容过于单一,且资讯信息的数量较少,同质化比较严重。
2、tag之间的关联关系都是人工依据百科等资源,并结合自身知识进行手动关联得到的,导致tag关系网络受限于个人知识和资源,因此tag关系网络的规模比较小,不利于向用户多样性的推荐资讯信息;例如,非物理专业的用户并不知道“猫”与“薛定谔”存在关联关系。
3、由于知识的有限性,tag关系网络中必然存在一部分的错误关系,从而导致了资讯信息的错误推荐。
4、tag关系网络中有百万个tag,如果进行大规模的tag更新,则需要人工进行所有tag之间关联关系的检查和更新,因此目前无法大规模的进行自动更新。
5、依据百科等资源确定tag之间的关联关系时,会根据资源中tag的共现次数,如果两个tag在文本集合中共现次数较多,则认为这两个tag之间具有较强的关联关系,从而构成tag关系网络;一旦文本集合存在偏差,例如娱乐相关的文本偏多或理论相关的文本偏多等,将直接导致tag之间的关联关系存在偏向。
【发明内容】
本发明提供了一种推送资讯信息的方法及系统,能够提高推荐列表中资讯信息的多样性,满足用户的推荐需求。
本发明的具体技术方案如下:
根据本发明一优选实施例,一种推送资讯信息的方法,包括:
依据预先生成的相关标签及对应的相关强度,在标签的推荐列表中加入所述相关标签的资讯信息,并对所述推荐列表中的资讯信息进行排序,将排序后得到的推荐列表推送给用户。
上述方法中,生成相关标签及对应的相关强度的方法为:
依据标签及对应的相关文本向量,获取包含所述相关文本向量中共现词的标签,计算获取的标签与所述相关文本向量对应的标签的相关强度,将获取的标签中相关强度大于预设相关阈值的标签作为所述相关文本向量对应的标签的相关标签。
上述方法中,生成标签的相关文本向量的方法为:
在互联网网页中抓取包含所述标签的文本,对抓取的文本进行文本切词,统计分词的出现次数,将出现次数大于预设频次阈值的分词作为所述标签的共现词;或从搜索引擎获得所述标签的搜索结果,对排序靠前的搜索结果的文本进行文本切词,统计分词的出现次数,将出现次数大于预设频次阈值的分词作为所述标签的共现词;
从相关强度数据库中获得所述标签与共现词的相关强度,或从搜索引擎中获得标签和共现词组成的查询词的搜索结果,依据搜索结果计算所述标签和共现词的相关强度;
利用共现词及对应的相关强度生成相关文本向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310175119.8/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





