[发明专利]网络信息的挖掘方法和装置在审

专利信息
申请号: 201210321780.0 申请日: 2012-09-03
公开(公告)号: CN103678320A 公开(公告)日: 2014-03-26
发明(设计)人: 杨小锐;肖镜辉;周晓波;司天歌;刘玉国 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 广州华进联合专利商标代理有限公司 44224 代理人: 何平;曾旻辉
地址: 518044 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 网络 信息 挖掘 方法 装置
【说明书】:

技术领域

发明涉及数据处理技术,特别是涉及一种网络信息的挖掘方法和装置。

背景技术

随着互联网的发展,通过互联网传播的网络信息呈爆炸性增长,用户从海量的网络信息中获取到期望的网络信息的难度越来越大,无法准确地提供需要的网络信息,因此,网络服务器常常会对当前热门的网络信息进行推送,以方便用户获取当前热门的网络信息。

例如,通常以导航页面的形式提供多种多样的网络信息,该网络信息可为热门网站。具体的,一些热门网站被罗列于导航页面中,用户可在导航页面对罗列的热门网站进行选择,进而实现热门网站的访问。

然而,在通过导航页面实现的网络信息推送形式中,每一次推送的网络信息都是相同的,不具备针对性,无法贴近每一用户所对应的网络信息获取意图。

发明内容

基于此,有必要针对无法贴近每一用户所对应的网络信息获取意图的问题,提供一种能提高针对性的网络信息的挖掘方法。

此外,还有必要提供一种能提高针对性的网络信息的挖掘装置。

一种网络信息的挖掘方法,包括如下步骤:

获取通过浏览器上传得到的浏览器数据;

通过分类模型对上传的浏览器数据进行分类,得到所述浏览器数据所属的类别;

获取与所述类别相关的网络信息,将所述获取的网络信息推送到所述浏览器。

一种网络信息的挖掘装置,包括:

数据获取模块,用于获取通过浏览器上传得到的浏览器数据;

分类模块,用于通过分类模型对上传的浏览器数据进行分类,得到所述浏览器数据所属的类别;

推送模块,用于获取与所述类别相关的网络信息,将所述获取的网络信息推送到所述浏览器。

上述网络信息的挖掘方法和装置,获取浏览器上传得到的浏览器数据,通过分类模型对上传的浏览器数据进行分类得到相应的类别,进而根据得到的类别获取相关的网络信息,进而将网络信息的推送至浏览器,由于浏览器数据是用户在运行浏览器和触发各种操作时产生的,因此,浏览器数据能够反应出用户意图,进而使得基于浏览器数据为相应的用户提供符合该用户的网络信息获取意图的网络信息,从而提高了针对性。

附图说明

图1为一个实施例中网络信息的挖掘方法的流程图;

图2为另一个实施例中网络信息的挖掘方法的流程图;

图3为一个实施例中对存储的浏览器数据和类别进行开方检验得到该类别对应的特征,并通过特征得到该类别的特征集合以及相应的特征向量的方法流程图;

图4为一个实施例中在与类别相对应的浏览器数据中查找与类别的特征相匹配的词,并根据查找结果生成特征集合的特征向量的方法流程图;

图5为一个实施例中通过分类模型对上传的浏览器数据进行分类,得到浏览器数据所属的类别的方法流程图;

图6为另一个实施例中通过分类模型对上传的浏览器数据进行分类,得到浏览器数据所属的类别的方法流程图;

图7为一个实施例中网络信息的挖掘方法的应用示意图;

图8为一个实施例中网络信息的挖掘装置的结构示意图;

图9为另一个实施例中网络信息的挖掘装置的结构示意图;

图10为一个实施例中处理模块的结构示意图;

图11为一个实施例中向量生成单元的结构示意图;

图12为一个实施例中分类模块的结构示意图;

图13为另一个实施例中分类模块的结构示意图;

图14为另一个实施例中分类模块的结构示意图。

具体实施方式

如图1所示,在一个实施例中,一种网络信息的挖掘方法,包括如下步骤:

步骤S110,获取通过浏览器上传得到的浏览器数据。

本实施例中,浏览器数据是浏览器运行过程中产生的数据,记录了浏览历史记录、下载历史记录、缓存等信息,例如,浏览器数据可以是用户通过浏览器访问的网页以及该网页的网络地址。

浏览器在运行过程中将收集产生的浏览器数据,并通过互联网络将收集到的浏览器数据上传到后台的网络服务器中,并存储。

步骤S130,通过分类模型对上传的浏览器数据进行分类,得到浏览器数据所属的类别。

本实施例中,分类模型用于对上传的各种浏览器数据进行分类,以提到浏览器数据所属的类别。例如,上传的浏览器数据为用户访问的篮球网页以及该网页的网络地址,则通过分类模型可以获知这一浏览器数据是属于体育这一类别的。在优选的实施例中,分类模型为朴素贝叶斯分类模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210321780.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top