[发明专利]一种基于运营商数据识别大学生网贷风险的分析方法与系统在审
申请号: | 201910913601.4 | 申请日: | 2019-09-25 |
公开(公告)号: | CN110648222A | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 田科伟 | 申请(专利权)人: | 杭州谱数梦信息技术有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06F16/2458;G06F16/245;G06F16/28;G06F16/29;G06F16/27;G06K9/62;G06F16/951;G06F16/955 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310000 浙江省杭州市萧山*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分析目标 用户上网 采集 分析 商品详细信息 用户上网行为 目标客户群 运营商数据 爬虫 方式分析 购物行为 轨迹行为 客户群体 目标对象 日志数据 上网行为 实时分析 用户轨迹 用户群体 预警机制 大数据 基准库 运营商 大学生 日志 上网 监控 | ||
1.一种基于运营商数据识别大学生网贷风险的分析方法,其特征在于,根据对以往发生的大学生网贷事件分析,获取大学生网贷的基础特征为:经常使用网贷APP,线上大宗消费信息,经常搜索贷款、还贷类关键词,线下出现商圈频次,经常拨打网贷机构客服电话;其分析方法包括以下步骤:
建立基准库:
APP库:对网贷APP、电商APP及其对应的HOST域名进行分类;
网贷电话库:对贷款类客服电话实现汇总;
位置库:汇总高校及商场的位置POI信息;
网贷搜索词库:汇集运营商用户网络贷款搜索词;
目标群体识别:通过高校的位置POI信息,结合高校覆盖范围内的基站工参数据,采集运营商用户轨迹行为数据,比对运营商用户资料数据,实现对大学生群体的识别;
目标群体行为数据解析:
将目标用户上网日志、基准库数据加载到HDFS,采用M/R实现海量数据快速高效匹配,解析出用户上网具体URL行为、APP行为、网贷APP点击次数;获取用户购买商品数据通过电商APP深度解析出来的用户购买商品编号,通过爬虫实现内容爬取识别商品的详细信息;解析用户的搜索词信息,将APP站内搜索与主流搜索引擎搜索词进行汇总;
通过商场的位置POI信息,结合商场覆盖范围内的基站工参数据,采集目标用户轨迹行为数据,解析目标群体在商场出现的频率;
结合网贷电话库,获取目标用户网贷电话拨打记录;
所述基站工参数据包括基站名称、LAC/CI、经纬度、基站类型;运营商用户轨迹行为数据包括电话号码、开始基站、结束基站、开始时间、结束时间、信令动作;运营商用户资料数据包括电话号码、年龄、性别、网龄、机龄;目标用户上网日志包括上网开始时间、结束时间、电话号码、HOST、URL;
网贷风险模型建立:
通过贝叶斯分类实现对具备大学生网贷特征的用户群体实现特征分析,输出具备网贷风险的特征,建立模型分析维度:
其中规则总分100分,按照分数输出网贷风险等级;风险等级=规则总数/30;风险等级>1为高风险等级;0.5<风险等级<1为中等风险等级;0<风险等级<0.5低风险等级。
2.根据权利要求1所述一种基于运营商数据识别大学生网贷风险的分析方法,其特征在于,还包括将高风险等级消息通知高校管理员或家长。
3.根据权利要求1所述一种基于运营商数据识别大学生网贷风险的分析方法,其特征在于,还包括目标用户上网日志数据清,洗掉HTTP/WAP协议的URL和域名不符合、对应的URL包括有扩展名和没有扩展名形式的地址数据。
4.根据权利要求1所述一种基于运营商数据识别大学生网贷风险的分析方法,其特征在于,还包括用户资料数据清洗,洗掉外省注册的号码。
5.根据权利要求1所述一种基于运营商数据识别大学生网贷风险的分析方法,其特征在于,所述高校为本省高校;所述商圈为本省重点商圈。
6.根据权利要求1所述一种基于运营商数据识别大学生网贷风险的分析方法,其特征在于,所述高校及商场的位置POI信息通过百度地图,实现区域范围的经纬度爬取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州谱数梦信息技术有限公司,未经杭州谱数梦信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910913601.4/1.html,转载请声明来源钻瓜专利网。