[发明专利]一种基于第三方的用户数据统计方法及系统在审
| 申请号: | 201710106103.X | 申请日: | 2017-02-25 |
| 公开(公告)号: | CN106919677A | 公开(公告)日: | 2017-07-04 |
| 发明(设计)人: | 张元康 | 申请(专利权)人: | 浙江沛宏网络科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京维正专利代理有限公司11508 | 代理人: | 林乐飞 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 第三 用户数 据统计 方法 系统 | ||
1.一种基于第三方的用户数据统计方法,其特征在于:客户端(100)对记录的m条n维用户数据进行一次统计,即将原始数据按列组成n行m列矩阵X;
客户端(100)将一次统计数据发送给统计服务器(200),统计服务器(200)对接收到的所述一次统计数据进行二次统计,即:
步骤1,将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值;
步骤2,求出协方差矩阵C=1/mXXT;
步骤3,求出协方差矩阵的特征值及对应的特征向量;
步骤4,将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P;
步骤5,Y=PX即为降维到k维后的数据;
统计服务器(200)将二次统计数据发送给数据库服务器(300)以使数据库服务器(300)将所述二次统计数据写入数据库。
2.根据权利要求1所述的基于第三方的用户数据统计方法,其特征在于:所述客户端获取用户数据的方式包括采集游览器的后台数据记录、用户访问记录。
3.根据权利要求1所述的基于第三方的用户数据统计方法,其特征在于:原始的用户数据包括浏览量,访客数,下单数,成交数,成交金额,并形成5维矩阵。
4.根据权利要求1所述的基于第三方的用户数据统计方法,其特征在于:在数据库服务器(300)写入数据库前,发送数据库请求,多个数据库接收所述请求并根据数据库的冗余量(301)设置应答时间,冗余量(301)越大应答时间设置越小。
5.根据权利要求4所述的基于第三方的用户数据统计方法,其特征在于:所述数据库的冗余量(301)按照等距的阶梯划分,并由大到小设置应答时间。
6.根据权利要求5所述的基于第三方的用户数据统计方法,其特征在于:发送数据库请求中包括数据量(302)大小,数据库接收数据请求后还通过比较,计算数据库的冗余量(301)。
7.一种基于第三方的用户数据统计系统,其特征在于:包括
用户端(100),被配置来记录m条n维用户数据,进行一次统计,即将原始数据按列组成n行m列矩阵X,将一次统计数据进行发送;
统计服务器(200),被配置来接收到所述一次统计数据,进行二次统计,即完成:
步骤1,将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值;
步骤2,求出协方差矩阵C=1/mXXT;
步骤3,求出协方差矩阵的特征值及对应的特征向量;
步骤4,将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P;
步骤5,Y=PX即为降维到k维后的数据;
数据库服务器(300),被配置来接收二次统计数据,将所述二次统计数据写入数据库。
8.根据权利要求7所述的基于第三方的用户数据统计系统,其特征在于:
数据库服务器(300)具有多个,对应多个数据库,数据库服务器(300)包括应答开关单元(330)、应答判断单元(310)、应答计时单元(320),应答判断单元(310)用以根据数据库的冗余量(301)设置应答计时单元(320)的计时时间,应答计时单元(320)用以在计时结束后开启应答开关单元(330)来接收数据流。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江沛宏网络科技有限公司,未经浙江沛宏网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710106103.X/1.html,转载请声明来源钻瓜专利网。





