[发明专利]一种涉法人员群体画像分析系统及方法有效
申请号: | 201911366166.4 | 申请日: | 2019-12-26 |
公开(公告)号: | CN111159763B | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 王开红;陈涛;金佳佳;丁锴;李建元 | 申请(专利权)人: | 银江技术股份有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62;G06Q50/18 |
代理公司: | 杭州之江专利事务所(普通合伙) 33216 | 代理人: | 张慧英 |
地址: | 310012 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 法人 群体 画像 分析 系统 方法 | ||
1.一种涉法人员群体画像分析方法,其特征在于,包括如下步骤:
(1)采集涉法数据,并对涉法数据进行融合及预处理;
(2)对融合及预处理后的涉法数据进行深度脱敏;其中,深度脱敏方法步骤如下:
(2.1)统计涉法人员姓名信息,按照姓名中姓和名字的分布情况,重新生成涉法人员姓名;
(2.2)对涉法数据中涉及到的组织机构信息进行编码处理;
(2.3)将身份证件和联系方式转化为唯一标识代码形式;
(2.4)结合外部地图数据,对采集到的地址信息进行规范化处理,规范化为省市县的形式,不涉及更加详细信息;
(2.5)识别所述融合及预处理后的涉法数据中的实体数据,对所述实体数据执行步骤(2.1)-(2.4),完成数据脱敏;
(3)基于涉法数据分别进行文本特征处理与数值特征处理,并进行特征融合,得到涉法人员的特征;
(4)对涉法人员的特征作升维处理,将其转化为固定长度向量后作降维处理,并采用聚类算法进行涉法人员群体挖掘;
(5)基于聚类结果,结合涉法人员的特征进行群体画像构建;
(6)对构建得到的人物画像进行可视化处理,并支持根据界面展示对特征进行二次筛选。
2.根据权利要求1所述的一种涉法人员群体画像分析方法,其特征在于:所述步骤(1)具体为:通过多个业务系统收集涉法数据,将涉法人员基本信息赋予不同的权重,计算涉法人员相似程度,通过设置相似程度阈值、冗余信息处理、冲突信息处理来进行跨系统数据融合,并将单个业务系统中完全相同的记录去除,将空值率大于预设阈值的字段去除。
3.根据权利要求1所述的一种涉法人员群体画像分析方法,其特征在于:所述步骤(3)具体为:将涉法数据归类为文本特征数据与数值特征数据,具体划分为人员固定属性、人员动态属性、文本描述、地址、组织以及涉法案件特征六种特征类别数据,对这六种特征类别分别进行数据处理,并进行特征融合得到涉法人员的特征;其中,六种特征类别数据及处理具体如下:
1)人员固定属性数据反映涉法人员的基本信息,对数据进行预处理;
2)人员动态属性数据是指随着时间变化而不断改变的特征,反映涉法人员思想、行为变化状态,计算各动态属性数据的均值、方差、以及变化趋势,其中类别类数据需转化为数值型数据;
3)文本描述数据反应涉法案件文本描述信息,先进行分词,并采用word2vec模型生成X维向量;
4)地址数据反映涉法案件的地址相关性,采用步骤(2.4)所述方法处理;
5)组织数据反映涉法案件的组织相关性,采用步骤(2.2)所述方法处理;
6)涉法案件特征是指司法机关对涉法人员涉法事件的相关裁定信息,并对此类信息进行预处理。
4.根据权利要求3所述的一种涉法人员群体画像分析方法,其特征在于:所述变化趋势通过如下公式计算:
x=[x1,x2,…,xm]
其中,m表示某个涉法人员动态数据记录条数;j是下标,无实际意义;x表示动态记录;1{}表示括号中记录为真则值为1,否则值为0;td(x)是特征x的变化趋势值,代表动态数据变好或者维持现状的趋势,在0-1之间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银江技术股份有限公司,未经银江技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911366166.4/1.html,转载请声明来源钻瓜专利网。