[发明专利]投诉热点区域聚类方法、装置、设备、介质有效
申请号: | 201811635495.X | 申请日: | 2018-12-29 |
公开(公告)号: | CN111382765B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 李丹 | 申请(专利权)人: | 中国移动通信集团四川有限公司;中国移动通信集团有限公司 |
主分类号: | G06F18/2321 | 分类号: | G06F18/2321;G06F16/29;G06F16/215 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 彭琼 |
地址: | 610041 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 投诉 热点 区域 方法 装置 设备 介质 | ||
1.一种投诉热点区域聚类方法,其中,包括:
将多个样本工单中地理区域归属相同的样本工单分为一组;其中,分组过程包括:提取大数据量样本工单,所述样本工单中包括投诉地点信息;通过离线地址库对所述样本工单进行地点信息匹配,获得与所述投诉地点信息匹配的实际地点信息;基于归一化处理,通过地图大数据对所述实际地点信息匹配,将地理区域归属相同的样本工单分为一组,其中,所述归一化处理包括:利用纠偏算法对预设地图数据进行纠偏;按照预设精度等级选取规则,选择高精度等级的投诉地点信息;
针对每个所述样本工单,计算所述样本工单的投诉地点信息相对于标准地点信息数据库中各标准地点信息的匹配率;
若所述投诉地点信息的路径值大于所述标准地点信息的路径值,则所述匹配率为所述标准地点信息和所述投诉地点信息的路径值的比值与预定命中率的乘积;
若所述投诉地点信息的路径值小于等于所述标准地点信息的路径值,则所述匹配率为所述投诉地点信息的路径值与所述标准地点信息的路径值的比值与所述预定命中率的乘积;
确定每个样本组的距离分布矩阵,并根据所述距离分布矩阵计算所述样本组的半径邻域参数和距离邻域参数,并基于所述半径邻域参数和所述距离邻域参数对所述样本组中所有样本工单进行密度聚类,得到关于所述样本组所在地理区域的投诉热点区域;
所述距离分布矩阵的每个元素表示该元素所在行的样本工单与所在列的样本工单的距离。
2.根据权利要求1所述的方法,其中,所述根据所述距离分布矩阵计算所述样本组的半径邻域参数和距离邻域参数,包括:
对所述距离分布矩阵中每行的值从小到大排序;
利用最大似然法计算排序后的距离分布矩阵中每一列的参数估计值;
将所述排序后的距离分布矩阵中所有列的参数估计值的平均值,作为所述样本组的半径邻域参数;
根据所述样本组的半径邻域参数,确定所述样本组的距离邻域参数。
3.根据权利要求2所述的方法,其中,所述根据所述样本组的半径邻域参数,确定所述样本组的距离邻域参数,包括:
将所述样本组中每个样本工单的由所述半径邻域参数限定的邻域内的样本工单数目的众数,作为所述样本组的距离邻域参数。
4.根据权利要求1中的方法,其中,所述样本组中样本工单数目小于等于预设数目阈值。
5.根据权利要求1所述的方法,所述将多个样本工单中地理区域归属相同的样本工单分为一组,包括:
根据所述投诉地点信息对所述多个样本工单进行清洗处理;
将清理处理后的样本工单中所述地理区域归属相同的样本工单分为一组。
6.根据权利要求5所述的方法,其中,在所述针对每个所述样本工单,计算所述样本工单的投诉地点信息相对于所述标准地点信息数据库中各标准地点信息的匹配率之后,包括:
若最大匹配率小于预设匹配率阈值,则剔除所述样本工单。
7.根据权利要求6所述的方法,其中,所述根据所述投诉地点信息对所述多个样本工单进行清洗处理,还包括:
若所述最大匹配率大于等于所述预设匹配阈值,则解析所述投诉地点信息的经纬度坐标;
若解析失败和/或,解析得到的经纬坐标对应的地点不在其所属区域范围内和/或不满足预定精度要求,则剔除所述样本工单。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团四川有限公司;中国移动通信集团有限公司,未经中国移动通信集团四川有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811635495.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种复式停车库
- 下一篇:图像三维信息提取方法、对象成像方法、装置及系统