[发明专利]基于社交网络分析的犯罪嫌疑人挖掘关联方法及系统有效
| 申请号: | 201410726472.5 | 申请日: | 2014-12-04 |
| 公开(公告)号: | CN104408149B | 公开(公告)日: | 2017-12-12 |
| 发明(设计)人: | 孙圣鹏;张玉超;高明;张友春;向俊敏;夏俊玲 | 申请(专利权)人: | 威海北洋电气集团股份有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 威海科星专利事务所37202 | 代理人: | 初姣姣 |
| 地址: | 264200 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 社交 网络分析 犯罪嫌疑人 挖掘 关联 方法 系统 | ||
1.一种基于社交网络分析的犯罪嫌疑人挖掘关联方法,其中基于社交网络分析的犯罪嫌疑人挖掘关联系统,设有依次串联的用于完成关键信息抽取的数据分析和提取模块;用于将结构化数据抽象为网络图模型的社交网络构建模块;用于对社交网络进行划分的社团发现模块;以及用于将初始指定目标所在的社团按照一定的规则输出的结果输出及展示模块,其特征在于包括以下步骤:
步骤1:对数据中的每个人分配一个唯一的id,统计计算人与人之间的关联信息,给每个关联赋予权重,然后对用户输入数据进行预处理,从输入数据提取关键信息;
步骤2:构建社交网络图模型,根据第一步提取的信息,将每个人抽象成网络图中的一个节点,将人与人之间的关联抽象成网络图中的边,所述社交网络是一个图论模型,模型表达如下:
,其中G表示社交网络,V表示网络中的点,E表示网络中的边;
步骤3:设置参数,参数包括两个,重点目标人员对应的网络点集合C,社团所能包含的点的个数上限阈值λ,根据实际的情况,设置一个或者多个重点目标人员,在社交网络中找到这些人对应的节点,还可以选择设置一个阈值,用于控制最终输出的社团大小,
步骤4:运行社团发现算法,对社交网络进行划分,根据用户预设的重点目标人员,在满足阈值条件的情况下进行层次聚类,直到满足算法的终止条件,其中运行的社团发现算法采用层次聚类的方法,算法过程中使用模块度作为度量标准,模块度的定义如下:
,
其中表示点i和点j之间的边的权重,是所有与点i相连的边的权重之和,表示点i所属的社团,如果,函数为1,否则为0,,是归一化因子;
步骤5:输出发现的结果,列出犯罪嫌疑人员;步骤4中运行社团发现算法具体步骤如下:输入:社交网络图模型G=(V,E),
重点目标人员集合C={c1,c2,c3,……ck},
权重数组W={w1,w2,w3,……wm},m为E中边的条数,
社团规模阈值λ;
输出:社团集合P={p1,p2,p3,……,pn},
开始
初始时每个网络节点是一个单独的社团,即P={pi|vi∈pi,vi∈V};
定义|P|为集合P包含的社团的个数,定义|V|为集合V包含的点的个数,循环开始:
对于,
对于,
如果满足阈值λ,算法结束;
将点vi从原来的社团移除,加入新的社团pj,计算模块度的变化△Q,并记录,找到找到△Q大于0且值最大的操作并执行,如果不存在大于0的△Q,则进行下一轮循环;
如果本次循环没有任何操作,算法结束;
对于本次循环得到的社团集合P={p1,p2,p3,……,pt},将P中的每个社团看成一个点,将不同的社团之间的链接及权重统一合并计算为一条带权重的边,这样得到了一个新的社交网络图,以及一个新的权重向量,重新开始循环过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于威海北洋电气集团股份有限公司,未经威海北洋电气集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410726472.5/1.html,转载请声明来源钻瓜专利网。





