[发明专利]网站的分类方法及装置在审
申请号: | 201611152977.0 | 申请日: | 2016-12-14 |
公开(公告)号: | CN108228602A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 孙召伟 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网站 分类 用户访问数据 相似度 预设时间间隔 互联网技术 相似度算法 标签方式 访问网站 聚类算法 时间属性 预设 预置 统计 | ||
本发明公开了一种网站的分类方法及装置,涉及互联网技术领域,主要目的在于解决人工打标签方式操作成本大,且无法根据用户的具体需求对访问网站进行分类的问题。本发明的主要技术方案为:获取不同网站符合预设时间间隔条件的用户访问数据;按照时间属性统计所述用户访问数据的平均值;根据所述平均值及预设相似度算法计算所述不同网站之间的相似度;通过所述相似度及预置聚类算法对所述不同网站进行分类。主要用于网站的分类。
技术领域
本发明涉及互联网技术领域,尤其涉及一种网站的分类方法及装置。
背景技术
随着互联网技术的不断发展,越来越多的用户通过访问网站来获取信息。其中,不同人群会根据不同的需求会访问不同类型的网站,对网站的分类成为分析用户访问网站情况的必要手段。
目前,现有的网站分类方法是通过人工对不同属性的网站进行人工打标签,如,音乐类、电商类、新闻类、门户类等等,再根据标注的标签进行分类,但是人工打标签方式是按照网站的属性类型进行分类,操作成本大,且无法根据用户的具体需求对访问网站进行分类,导致网站分类的效率较低。
发明内容
鉴于上述问题,提出了本发明以便提供一种网站的分类方法及装置,主要目的是解决人工打标签方式操作成本大,且无法根据用户的具体需求对访问网站进行分类的问题。
借由上述技术方案,本发明提供的一种网站的分类方法,包括:
获取不同网站符合预设时间间隔条件的用户访问数据,所述用户访问数据为用户浏览网站所产生的流量数据;
按照时间属性统计所述用户访问数据的平均值;
根据所述平均值及预设相似度算法计算所述不同网站之间的相似度;
通过所述相似度及预置聚类算法对所述不同网站进行分类。
借由上述技术方案,本发明提供的一种网站的分类装置,包括:
获取单元,用于获取不同网站符合预设时间间隔条件的用户访问数据,所述用户访问数据为用户浏览网站所产生的流量数据;
统计单元,用于按照时间属性统计所述用户访问数据的平均值;
计算单元,用于根据所述平均值及预设相似度算法计算所述不同网站之间的相似度;
分类单元,用于通过所述相似度及预置聚类算法对所述不同网站进行分类。
借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
本发明实施例提供的一种网站的分类方法及装置,首先获取不同网站符合预设时间间隔条件的用户访问数据,所述用户访问数据为用户浏览网站所产生的流量数据,然后按照时间属性统计所述用户访问数据的平均值,再根据所述平均值及预设相似度算法计算所述不同网站之间的相似度,最后通过所述相似度及预置聚类算法对所述不同网站进行分类。与现有的人工打标签方式且无法根据用户的具体需求对访问网站进行分类相比,本发明实施例将不同时间点的网站中用户访问数据按照时间属性计算平均值,然后将平均值作为预设相似度算法的参数计算网站之间的相似度,再根据相似度及预置的聚类算法对网站进行分类,避免手动打标签进行分类,实现根据时间序列对用户在不同时间点访问的网站进行分类,进一步实现根据用户的需求对用户访问的网站进行分类,增加了网站分类的多样性,从而提高网站分类的效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611152977.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种主数据读写系统及主数据读写方法
- 下一篇:一种网站跳出率计算方法及服务器