[发明专利]消息数据处理方法、装置、计算机设备和存储介质有效
申请号: | 201810124547.0 | 申请日: | 2018-02-07 |
公开(公告)号: | CN108287823B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 张澍滋 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/335 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 易皎鹤 |
地址: | 518052 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 消息 数据处理 方法 装置 计算机 设备 存储 介质 | ||
1.一种消息数据处理方法,所述方法包括:
在主线程中向服务器对应的聊天发送接口发送获取聊天消息的获取请求,接收所述服务器发送的身份验证请求,根据接收到所述服务器发送的所述身份验证请求向所述服务器发送身份验证信息,当所述身份验证信息通过所述服务器验证时,则接收所述服务器发送的消息数据,所述消息数据上携带有来源数据,所述来源数据是对应的所述消息数据的来源标识;
在主线程中获取预设的多个分词逻辑,将所述消息数据按照预设的多个所述分词逻辑进行拆分得到分词序列,获取每一个所述分词序列中的不同的分词词组的正确率,计算不同的所述分词词组的正确率乘积得到每一个所述分词序列对应的拆分正确率,获取与最大的所述拆分正确率对应的所述分词序列作为目标分词数据,所述分词逻辑是将所述消息数据拆分为多个标准术语的逻辑,所述分词序列以及所述目标分词数据是指经过拆分后得到的具有独立语义的所述标准术语;
在主线程中将所述目标分词数据与所述目标分词数据对应的来源数据进行关联存储,所述目标分词数据对应的来源数据与所述目标分词数据对应消息数据上携带的来源数据相同;
在识别线程中查询所述目标分词数据中是否存在风险等级大于预设等级的目标分词数据;其中,所述主线程与所述识别线程是异步关系;
在识别线程中获取查询到的所述风险等级大于预设等级的目标分词数据对应的来源数据,并对所获取到的所述来源数据添加风险标签。
2.根据权利要求1所述的方法,其特征在于,所述在识别线程中查询所述目标分词数据中是否存在风险等级大于预设等级的目标分词数据,包括:
将所述目标分词数据与预存的风险等级大于预设等级的数据进行匹配;
当至少一个所述目标分词数据匹配成功时,则获取匹配成功的所述风险等级大于预设等级的数据的存储类别;
获取匹配成功的所述目标分词数据对应的来源数据中的时间数据,根据所述时间数据提取在预设的消息数据获取时间段内的未进行匹配的所述目标分词数据;
将未进行匹配的所述目标分词数据与所述存储类别下预存的风险等级大于预设等级的数据进行匹配;
当所述未进行匹配的目标分词数据与所述存储类别下预存的风险等级大于预设等级的数据匹配成功时,则所述未进行匹配的目标分词数据为所述风险等级大于预设等级的目标分词数据。
3.根据权利要求1所述的方法,其特征在于,所述在识别线程中获取查询到的所述风险等级大于预设等级的目标分词数据对应的来源数据,并对所获取到的所述来源数据添加风险标签,包括:
获取所述风险等级大于预设等级的目标分词数据的关联词组;
当所述关联词组的风险等级大于预设等级时,则查询与未添加风险标签的来源数据对应的目标分词数据中是否存在所述关联词组;
当与未添加风险标签的来源数据对应的目标分词数据中存在所述关联词组时,则将所述未添加风险标签的来源数据添加所述风险标签。
4.根据权利要求1所述的方法,其特征在于,所述在识别线程中获取查询到的所述风险等级大于预设等级的目标分词数据对应的来源数据,并对所获取到的所述来源数据添加风险标签之后,还包括:
提取所述添加风险标签的来源数据对应的身份标识;
统计预设时间段内所述身份标识对应的相同的风险等级大于预设等级的目标分词数据的数量;
当所述数量超过预设值时,则对所述身份标识对应的消息数据进行监控。
5.根据权利要求4所述的方法,其特征在于,所述当所述数量超过预设值时,则对所述身份标识对应的消息数据进行监控的步骤之后,还包括:
根据所述身份标识获取所述身份标识对应的网络地址;
查询所述网络地址在预设的注册时间段内注册的身份标识的数量;
当所注册的身份标识的数量超过预设值时,则将所述网络地址标记为风险等级大于预设等级的网络地址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810124547.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种中文相似问题生成系统与方法
- 下一篇:语义相似度计算方法及装置