[发明专利]网络信息的挖掘方法和装置在审
申请号: | 201210321780.0 | 申请日: | 2012-09-03 |
公开(公告)号: | CN103678320A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 杨小锐;肖镜辉;周晓波;司天歌;刘玉国 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 何平;曾旻辉 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 信息 挖掘 方法 装置 | ||
技术领域
本发明涉及数据处理技术,特别是涉及一种网络信息的挖掘方法和装置。
背景技术
随着互联网的发展,通过互联网传播的网络信息呈爆炸性增长,用户从海量的网络信息中获取到期望的网络信息的难度越来越大,无法准确地提供需要的网络信息,因此,网络服务器常常会对当前热门的网络信息进行推送,以方便用户获取当前热门的网络信息。
例如,通常以导航页面的形式提供多种多样的网络信息,该网络信息可为热门网站。具体的,一些热门网站被罗列于导航页面中,用户可在导航页面对罗列的热门网站进行选择,进而实现热门网站的访问。
然而,在通过导航页面实现的网络信息推送形式中,每一次推送的网络信息都是相同的,不具备针对性,无法贴近每一用户所对应的网络信息获取意图。
发明内容
基于此,有必要针对无法贴近每一用户所对应的网络信息获取意图的问题,提供一种能提高针对性的网络信息的挖掘方法。
此外,还有必要提供一种能提高针对性的网络信息的挖掘装置。
一种网络信息的挖掘方法,包括如下步骤:
获取通过浏览器上传得到的浏览器数据;
通过分类模型对上传的浏览器数据进行分类,得到所述浏览器数据所属的类别;
获取与所述类别相关的网络信息,将所述获取的网络信息推送到所述浏览器。
一种网络信息的挖掘装置,包括:
数据获取模块,用于获取通过浏览器上传得到的浏览器数据;
分类模块,用于通过分类模型对上传的浏览器数据进行分类,得到所述浏览器数据所属的类别;
推送模块,用于获取与所述类别相关的网络信息,将所述获取的网络信息推送到所述浏览器。
上述网络信息的挖掘方法和装置,获取浏览器上传得到的浏览器数据,通过分类模型对上传的浏览器数据进行分类得到相应的类别,进而根据得到的类别获取相关的网络信息,进而将网络信息的推送至浏览器,由于浏览器数据是用户在运行浏览器和触发各种操作时产生的,因此,浏览器数据能够反应出用户意图,进而使得基于浏览器数据为相应的用户提供符合该用户的网络信息获取意图的网络信息,从而提高了针对性。
附图说明
图1为一个实施例中网络信息的挖掘方法的流程图;
图2为另一个实施例中网络信息的挖掘方法的流程图;
图3为一个实施例中对存储的浏览器数据和类别进行开方检验得到该类别对应的特征,并通过特征得到该类别的特征集合以及相应的特征向量的方法流程图;
图4为一个实施例中在与类别相对应的浏览器数据中查找与类别的特征相匹配的词,并根据查找结果生成特征集合的特征向量的方法流程图;
图5为一个实施例中通过分类模型对上传的浏览器数据进行分类,得到浏览器数据所属的类别的方法流程图;
图6为另一个实施例中通过分类模型对上传的浏览器数据进行分类,得到浏览器数据所属的类别的方法流程图;
图7为一个实施例中网络信息的挖掘方法的应用示意图;
图8为一个实施例中网络信息的挖掘装置的结构示意图;
图9为另一个实施例中网络信息的挖掘装置的结构示意图;
图10为一个实施例中处理模块的结构示意图;
图11为一个实施例中向量生成单元的结构示意图;
图12为一个实施例中分类模块的结构示意图;
图13为另一个实施例中分类模块的结构示意图;
图14为另一个实施例中分类模块的结构示意图。
具体实施方式
如图1所示,在一个实施例中,一种网络信息的挖掘方法,包括如下步骤:
步骤S110,获取通过浏览器上传得到的浏览器数据。
本实施例中,浏览器数据是浏览器运行过程中产生的数据,记录了浏览历史记录、下载历史记录、缓存等信息,例如,浏览器数据可以是用户通过浏览器访问的网页以及该网页的网络地址。
浏览器在运行过程中将收集产生的浏览器数据,并通过互联网络将收集到的浏览器数据上传到后台的网络服务器中,并存储。
步骤S130,通过分类模型对上传的浏览器数据进行分类,得到浏览器数据所属的类别。
本实施例中,分类模型用于对上传的各种浏览器数据进行分类,以提到浏览器数据所属的类别。例如,上传的浏览器数据为用户访问的篮球网页以及该网页的网络地址,则通过分类模型可以获知这一浏览器数据是属于体育这一类别的。在优选的实施例中,分类模型为朴素贝叶斯分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210321780.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种执手装置
- 下一篇:一种多功能印刷电路板及具有该电路板的智能设备
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置