[发明专利]一种诈骗电话的检测方法和装置有效
申请号: | 201811219800.7 | 申请日: | 2018-10-19 |
公开(公告)号: | CN109451182B | 公开(公告)日: | 2021-08-13 |
发明(设计)人: | 林荣恒;张震;彭潞;闵星;吴步丹;邹华 | 申请(专利权)人: | 北京邮电大学;国家计算机网络与信息安全管理中心 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;H04M3/22;H04W12/128;G10L15/26;G06F16/332 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 王双;王琦 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 诈骗 电话 检测 方法 装置 | ||
1.一种诈骗通话的检测方法,其特征在于,包括:
将所有通话语音转换为文本,组成文本集;将文本集中的每个文本转换为关键词权重向量;
对所有关键词权重向量通过文本聚类形成多个簇,并根据诈骗关键词集确定各个簇是否为诈骗簇;对于诈骗簇内的所有关键词权重向量对应的通话,确定为诈骗通话;其中,所述确定各个簇是否为诈骗簇包括:在所有关键词向量中选择所述诈骗关键词集中包括的词语,作为诈骗关键词;对于每个簇,根据诈骗关键词集,将该簇的特征与预设的诈骗簇的特征进行比较,计算该簇中所有诈骗关键词的权重之和x,计算x与该簇中所有关键词的权重之和的比值,若该比值大于预设阈值,则认定该簇为诈骗簇;
利用所有通话和所述关键词构建文本社交网络,在所述文本社交网络中将诈骗通话对应的节点标记为诈骗通话,并通过标签传播确定其他标记为诈骗通话的节点;将所有标记为诈骗通话的节点对应的通话确定为诈骗通话;其中,所述构建文本社交网络包括:将所述所有关键词权重向量中的各个关键词建模为所述文本社交网络中的节点,将各关键词权重向量对应的通话文本建模为所述文本社交网络中的节点,若任一通话文本中含有任一关键词,则在所述任一通话文本的节点和所述任一关键词的节点之间添加边,并设定边的权重。
2.根据权利要求1所述的方法,其特征在于,该方法进一步包括:
利用诈骗簇内所有通话的主叫号码及与其有过通话关系的所有号码构建话单社交网络,并进行社区发现;根据所述话单社交网络中每个社区包括的诈骗号码个数确定相应社区为诈骗社区或非诈骗社区;将诈骗社区内的所有通话语音转换为文本后进行文本聚类,提取出新的关键词,加入所述诈骗关键词集中,用于下一次将所有通话语音文本转换为关键词权重向量的过程;
其中,所述诈骗号码为所述诈骗通话中的主叫号码。
3.根据权利要求1或2所述的方法,其特征在于,所述将文本集中的每个文本转换为关键词权重向量时利用TF-IDF方式进行;
所述利用所有通话和所述关键词构建文本社交网络包括:将所有通话语音转换成的文本和所有关键词权重向量中的关键词作为所述文本社交网络的节点,如果文本中包括一关键词,则在相应的文本节点和关键词节点间添加边,边的权重为对应的关键词在相应文本中的TF-IDF值。
4.根据权利要求2所述的方法,其特征在于,所述构建话单社交网络包括:
将所述诈骗簇内所有通话的主叫号码及与其有过通话关系的所有号码作为所述话单社交网络的节点,若任意两个节点间有一通呼叫,则在相应节点间添加一条边,并根据各条边对应通话的特征设置相应边的权重。
5.根据权利要求4所述的方法,其特征在于,所述根据各条边对应通话的特征设置相应边的权重包括:根据所述通话的综合通话时长和主被叫号码归属地确定相应边的权重;其中,综合通话时长越长,边的权重越大,主被叫号码归属地越相似,边的权重越大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学;国家计算机网络与信息安全管理中心,未经北京邮电大学;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811219800.7/1.html,转载请声明来源钻瓜专利网。