[发明专利]用户分析方法、装置及终端有效
申请号: | 201810459561.6 | 申请日: | 2018-05-15 |
公开(公告)号: | CN108711073B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 刘颖慧;许丹丹;刘静沙 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F40/279;G06F16/903 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨泽;刘芳 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 分析 方法 装置 终端 | ||
1.一种用户分析方法,其特征在于,包括:
获取互动型短信;
从所述互动型短信中提取出服务提供方的名称;
根据预设周期内用户与不同类别服务提供方的互动频率变化情况,分析获得所述用户所属的类别;
所述根据预设周期内用户与不同类别服务提供方的互动频率变化情况,分析获得所述用户所属的类别,包括:
对预设周期内提取到的服务提供方的名称进行分类;
统计在预设周期内,所述用户收到每一类服务提供方发送的所述互动型短信的频率;
计算所述用户所有类别的服务提供方的方差,所述方差的公式,包括:
其中,σ2为总体方差,X为每一类服务提供方在预设周期的互动型短信的数量,μ为所述用户在统计周期内,预设周期时长收到的互动型短信的平均数量,N为所述用户在统计周期内收到的互动型短信的总数量;
设置每一类对用户的影响权重和阈值A,若所述总体方差σ2小于所述阈值A,则分别计算每个类别下互动型短信的方差,获取经所述影响权重调整过后的伪方差B;若所述B的值小于所述阈值A,则所述用户为稳定用户;若所述B不小于所述阈值A,则将所述每一类服务提供方的方差大小进行排序,如果支付金融类和社交娱乐类的方差排名在前两名,确定所述用户不是稳定用户,其中,所述稳定用户是表示用户忠诚度没有变化的用户,所述服务提供方包括支付金融类和社交娱乐类;
若所述总体方差σ2不小于所述阈值A,统计所述用户每个月平均收到的互动型短信数量的变化率,若所述互动型短信数量持续上升,则所述用户为上升型,若所述互动型短信数量持续下降,则该用户为下降型。
2.根据权利要求1所述的方法,其特征在于,所述获取互动型短信,包括:
获取用户在预设周期内的所有短信记录;
从所述短信记录中筛选出包含验证码的短信作为互动型短信。
3.根据权利要求1所述的方法,其特征在于,所述从所述互动型短信中提取出服务提供方的名称,包括:
判断所述互动型短信是否为格式化短信;其中,格式化短信是指短信文本的首字符串中包含有预设标注符号;
若所述互动型短信为格式化短信,则直接从所述格式化短信的预设标注符号中提取出文本信息,将所述文本信息作为服务提供方的名称;
若所述互动型短信为非格式化短信,则对所述非格式化短信进行分词处理,并从分词处理的结果中提取出服务提供方的名称。
4.根据权利要求3所述的方法,其特征在于,所述对所述非格式化短信进行分词处理,并从分词处理的结果中提取出服务提供方的名称,包括:
按照词性将所述非格式化短信划分为N个待检测字段,N为大于0的自然数;
将所述待检测字段与预设字典中的参考字段进行匹配,得到与所述参考字段匹配的目标字段,将所述目标字段作为所述非格式化短信对应的服务提供方的名称。
5.根据权利要求4所述的方法,其特征在于,在按照词性将所述非格式化短信划分为若干个待检测字段之后,还包括:
若所述预设字典中不存在与所述待检测字段匹配的参考字段,则将所述待检测字段对应的分词词组添加至预设集合中;
获取预设周期内所述预设集合中所有分词词组之间的相似度;
将相似度大于预设阈值的分词词组划分为一个子集,得到K个子集,K为大于0的自然数;
分别从K个子集中筛选出重复度最高的待检测字段作为候选参考字段;
对所述候选参考字段进行审核,并将审核通过的所述候选参考字段添加至预设字典中。
6.根据权利要求1-5中任一项所述的方法,其特征在于,还包括:
根据各用户所属的类别,向不同类别的用户推送不同的营销策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810459561.6/1.html,转载请声明来源钻瓜专利网。