[发明专利]网站的分类方法及装置在审
申请号: | 201611152977.0 | 申请日: | 2016-12-14 |
公开(公告)号: | CN108228602A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 孙召伟 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网站 分类 用户访问数据 相似度 预设时间间隔 互联网技术 相似度算法 标签方式 访问网站 聚类算法 时间属性 预设 预置 统计 | ||
1.一种网站的分类方法,其特征在于,包括:
获取不同网站符合预设时间间隔条件的用户访问数据,所述用户访问数据为用户浏览网站所产生的流量数据;
按照时间属性统计所述用户访问数据的平均值;
根据所述平均值及预设相似度算法计算所述不同网站之间的相似度;
通过所述相似度及预置聚类算法对所述不同网站进行分类。
2.根据权利要求1所述的方法,其特征在于,所述通过所述相似度及预置聚类算法对所述不同网站进行分类包括:
根据所述相似度与预置聚类算法建立所述不同网站的多层级网站聚类树;
对多层级网站聚类树选取符合预设切分条件的多层级网站切分点;
根据所述多层级网站切分点对同层级的不同网站划分类别。
3.根据权利要求2所述的方法,其特征在于,所述时间属性包括工作日、周末、节假日,所述按照时间属性统计所述用户访问数据的平均值包括:
按照工作日、周末、节假日分别统计不同网站的用户工作日访问数据的平均值、用户周末访问数据的平均值、用户节假日访问数据的平均值。
4.根据权利要求3所述的方法,其特征在于,所述根据所述平均值及预设相似度算法计算所述不同网站之间的相似度包括:
根据所述不同网站的用户工作日访问数据平均值、用户周末访问数据平均值、用户节假日访问数据平均值,以及预设相似度算法分别计算所述不同网站之间的用户工作日访问数据相似度、用户周末访问数据相似度、用户节假日访问数据相似度;
所述根据所述相似度与预置聚类算法建立所述不同网站的多层级网站聚类树包括:
根据所述不同网站之间的用户工作日访问数据相似度、用户周末访问数据相似度、用户节假日访问数据相似度,以及预置聚类算法建立所述不同网站的多层级网站聚类树。
5.根据权利要求2-4任一项所述的方法,其特征在于,所述对所述多层级网站切分点对应的网站划分类别之后,所述方法还包括:
接收用户输入的多层级网站切分条件,对所述预设切分条件进行更新。
6.一种网站的分类装置,其特征在于,包括:
获取单元,用于获取不同网站符合预设时间间隔条件的用户访问数据,所述用户访问数据为用户浏览网站所产生的流量数据;
统计单元,用于按照时间属性统计所述用户访问数据的平均值;
计算单元,用于根据所述平均值及预设相似度算法计算所述不同网站之间的相似度;
分类单元,用于通过所述相似度及预置聚类算法对所述不同网站进行分类。
7.根据权利要求6所述的装置,其特征在于,所述分类单元包括:
建立模块,用于根据所述相似度与预置聚类算法建立所述不同网站的多层级网站聚类树;
选取模块,用于对多层级网站聚类树选取符合预设切分条件的多层级网站切分点;
划分模块,用于根据所述多层级网站切分点对同层级的不同网站划分类别。
8.根据权利要求7所述的装置,其特征在于,
所述统计单元,具体用于按照工作日、周末、节假日分别统计不同网站的用户工作日访问数据的平均值、用户周末访问数据的平均值、用户节假日访问数据的平均值。
9.根据权利要求8所述的装置,其特征在于,
所述计算单元,具体用于根据所述不同网站的用户工作日访问数据平均值、用户周末访问数据平均值、用户节假日访问数据平均值,以及预设相似度算法分别计算所述不同网站之间的用户工作日访问数据相似度、用户周末访问数据相似度、用户节假日访问数据相似度;
所述建立模块,具体用于根据所述不同网站之间的用户工作日访问数据相似度、用户周末访问数据相似度、用户节假日访问数据相似度,以及预置聚类算法建立所述不同网站的多层级网站聚类树。
10.根据权利要求7-9任一项所述的装置,其特征在于,所述装置还包括:
更新单元,用于接收用户输入的多层级网站切分条件,对所述预设切分条件进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611152977.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种主数据读写系统及主数据读写方法
- 下一篇:一种网站跳出率计算方法及服务器