[发明专利]区域画像的构建方法及装置、存储介质及电子设备在审
申请号: | 202110917695.X | 申请日: | 2021-08-11 |
公开(公告)号: | CN113626706A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 王俊伟;钟钢;严伟荣;朱银清 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 区域 画像 构建 方法 装置 存储 介质 电子设备 | ||
1.一种区域画像的构建方法,其特征在于,所述方法包括:
获取多个区域对应的用户数据,并根据所述用户数据确定所述区域的多个特征;其中,所述用户数据包括通信业务数据和外部环境数据;
根据所述用户数据确定所述特征对应的特征权重,并根据所述特征权重确定所述区域对应的多个特征得分;
根据所述区域对应的多个特征得分对所述多个区域进行聚类得到聚类结果,并根据所述聚类结果确定所述区域对应的区域画像。
2.根据权利要求1所述的方法,其特征在于,所述用户数据包括多种类目数据,所述根据用户数据确定所述区域的多个特征,包括:
在所述类目数据满足数据入参条件时,将所述类目数据确定为目标数据;
根据所述目标数据确定所述区域的多个特征。
3.根据权利要求1所述的方法,其特征在于,在所述根据所述用户数据确定所述区域的多个特征之前,所述方法还包括:
对所述用户数据进行预处理。
4.根据权利要求3所述的方法,其特征在于,所述用户数据包括缺失值和异常值,所述对所述用户数据进行预处理,包括:
根据填充配置信息对所述用户数据的缺失值进行填充;
获取所述用户数据中的异常值,并根据异常数据更改信息对所述异常值进行处理。
5.根据权利要求1所述的方法,其特征在于,所述根据用户数据确定所述特征对应的特征权重,包括:
根据所述用户数据确定所述特征对应的贡献度,并根据所述特征对应的贡献度确定所述特征对应的特征熵值;
根据所述特征熵值确定所述特征对应的特征权重。
6.根据权利要求1所述的方法,其特征在于,所述根据所述区域对应的多个特征得分对所述多个区域进行聚类得到聚类结果,包括:
随机输入第一数量的初始聚类中心;其中,所述第一数量为聚类结果对应的类簇的数量;
根据所述区域对应的多个特征得分与所述初始聚类中心对应的多个特征得分确定所述区域与所述初始聚类中心的相似度,并将所述区域赋予所述相似度最大的初始聚类中心;
根据所述初始聚类中心对应的类簇中的多个区域对应多个特征得分重新确定所述初始聚类中心;
迭代计算所述初始聚类中心与所述区域之间的相似度,并重新确定所述初始聚类中心直至满足聚类条件,将当前多个所述初始聚类中心对应的类簇确定为聚类结果。
7.根据权利要求1所述的方法,其特征在于,所述根据所述聚类结果确定所述区域对应的区域画像,包括:
获取所述聚类结果对应的多个类簇,并根据所述类簇中的多个区域确定所述多个区域的共同特征;
根据所述共同特征确定所述区域对应的区域画像。
8.一种区域画像的构建装置,其特征在于,所述装置包括:
用户数据获取模块,用于获取多个区域对应的用户数据,并根据所述用户数据确定所述区域的多个特征;其中,所述用户数据包括通信业务数据和外部环境数据;
特征得分计算模块,用于根据所述用户数据确定所述特征对应的特征权重,并根据所述特征权重确定所述区域对应的多个特征得分;
区域画像确定模块,用于根据所述区域对应的多个特征得分对所述多个区域进行聚类得到聚类结果,并根据所述聚类结果确定所述区域对应的区域画像。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~7中任一项所述的方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1~7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110917695.X/1.html,转载请声明来源钻瓜专利网。