[发明专利]一种消息处理方法及装置在审
申请号: | 201710864054.6 | 申请日: | 2017-09-22 |
公开(公告)号: | CN109547319A | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 费硕成;王浩 | 申请(专利权)人: | 中移(杭州)信息技术有限公司;中国移动通信集团公司 |
主分类号: | H04L12/58 | 分类号: | H04L12/58 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 311100 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理消息 消息处理 违规 指纹 统计周期 消息内容 鉴别 鉴别处理 维度 统计 | ||
1.一种消息处理方法,其特征在于,包括:
从获取的待处理消息中提取消息内容;
根据所述待处理消息的消息内容,计算所述待处理消息的消息指纹值;
根据当前统计周期内获取到的每一待处理消息的消息指纹值,确定出所述每一待处理消息分别对应的相似消息的数量,其中,消息指纹值之间的海明距离小于设定阈值的两条待处理消息互为相似消息;
根据所述每一待处理消息分别对应的相似消息的数量,分别判断所述每一待处理消息是否为合规消息。
2.如权利要求1所述的方法,其特征在于,在从获取的待处理消息中提取消息内容之前,进一步包括:
判断所述待处理消息中是否包含有电话号码和/或统一资源定位符URL,并在判定所述待处理消息包含有电话号码和/或URL时,提取所述电话号码和/或URL。
3.如权利要求1或2所述的方法,其特征在于,计算所述待处理消息的消息指纹值,具体包括:
去除所述待处理消息的消息内容中的无意义字符,生成相应的精简消息内容,其中,所述无意义字符至少包括标点,虚词,数字,特殊符号;
将所述精简消息内容拆分成多个分词,根据预设的分词权重表分别为每个分词设置相应的权重值,并通过哈希算法分别计算每个分词的哈希值;
根据每个分词对应的权重值和哈希值,分别计算每个分词的分词加权值,并根据每个分词的分词加权值计算所述待处理消息的加权值;
对所述待处理消息的加权值进行降维计算得到所述待处理消息的消息指纹值。
4.如权利要求3所述的方法,其特征在于,根据所述当前统计周期内获取到的每一待处理消息的消息指纹值,确定出所述每一待处理消息分别对应的相似消息的数量,具体包括:
针对一个消息发送账号,根据获取到的所述一个消息发送账号在所述当前统计周期内发送的待处理消息的消息指纹值,分别计算所述一个消息发送账号在所述当前统计周期内发送的任意两个待处理消息的消息指纹值之间的海明距离,并将海明距离小于设定阈值的两个待处理消息判定为相似消息,以及统计出所述一个消息发送账号在所述当前统计周期内发送的待处理消息中每一条待处理消息的相似消息的数量。
5.如权利要求4所述的方法,其特征在于,在根据所述每一待处理消息分别对应的相似消息的数量,分别判断所述每一待处理消息是否为合规消息之前,进一步包括:
判断所述一个消息发送账号在所述当前统计周期内发送的待处理消息的数量是否小于消息发送总量阈值,若是,则表明所述一个消息发送账号的消息发送量在合规范围内,为合规行为账号,同时判定所述一个消息发送账号在所述当前统计周期内发送的消息均为合规消息;否则,判定所述一个消息发送账号存在疑似扩散消息风险,为疑似违规行为账号,需进一步判断所述每一待处理消息是否为合规消息。
6.如权利要求5所述的方法,其特征在于,根据所述每一待处理消息分别对应的相似消息的数量,分别判断所述每一待处理消息是否为合规消息,具体包括:
针对所述一个消息发送账号在所述当前统计周期内发送的待处理消息中每一条待处理消息分别执行以下操作:判断一条待处理消息的相似消息的数量是否小于预设的第一相似消息数量阈值,若是,则判定所述一条待处理消息为合规消息;
否则,判定所述一条待处理消息为疑似违规消息,并进一步判断所述一条待处理消息的相似消息中包含相同电话号码的待处理消息的数量是否小于预设的相同号码数量阈值,以及判断所述一条待处理消息的相似消息中包含相同URL的待处理消息的数量是否小于预设的相同URL数量阈值,若是,则判定所述一条待处理消息为疑似违规消息,需进一步进行人工审核,否则,判定所述一条待处理消息为大面积扩散型违规消息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(杭州)信息技术有限公司;中国移动通信集团公司,未经中移(杭州)信息技术有限公司;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710864054.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:VPN数据报文的处理方法、装置、电子设备
- 下一篇:社交方法、装置及设备