[发明专利]特征事件的识别方法及装置、电子设备、存储介质有效
| 申请号: | 202010373434.1 | 申请日: | 2020-05-06 |
| 公开(公告)号: | CN111552857B | 公开(公告)日: | 2023-09-19 |
| 发明(设计)人: | 刘小刚 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9536;G06F16/958;H04L9/40;G06N3/0464;G06N3/08 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 特征 事件 识别 方法 装置 电子设备 存储 介质 | ||
1.一种特征事件的识别方法,包括:
基于互联网渠道与特征事件的关联程度分别确定各个互联网渠道的等级,所述等级与所述关联程度呈正相关;
向各个互联网渠道分配采集资源,并通过分配的采集资源分别采集来自各个互联网渠道的目标数据;其中,分配的采集资源的资源量与各个互联网渠道对应的等级呈正相关;
通过对采集到的目标数据进行分析,以识别出所述目标数据中包含的特征事件。
2.根据权利要求1所述的特征事件的识别方法,确定互联网渠道与特征事件的关联程度,包括:
分别以相同资源量的初始采集资源对各个互联网渠道进行目标数据的初始采集;
分别根据从各个互联网渠道初始采集的目标数据,确定各个互联网渠道与所述特征事件的关联程度。
3.根据权利要求2所述的特征事件的识别方法,根据初始采集的目标数据确定所述互联网渠道与特征事件的关联程度,包括:
对所述目标数据进行关键词匹配;
根据所述目标数据中包含的关键词的数量和关键词的权重对所述互联网渠道进行关联度打分,分值与所述关联程度呈正相关。
4.根据权利要求2所述的特征事件的识别方法,所述确定各个互联网渠道与所述特征事件的关联程度,包括:
确定各个互联网渠道的数据更新频率和/或采集目标数据时的资源消耗量;
关联程度与数据更新频率和/或采集目标数据时的资源消耗呈正相关。
5.根据权利要求1所述的特征事件的识别方法,通过对采集到的目标数据进行分析,以识别出所述目标数据中包含的特征事件,包括:
将文本类型的目标数据输入事件识别模型,其中,所述事件识别模型采用标注有特征事件标签的文本对神经网络训练得到;
根据所述事件识别模型输出的置信度识别出所述互联网渠道包含的特征事件。
6.根据权利要求5所述的特征事件的识别方法,还包括:
在采集到的目标数据中包含图片类型的目标数据的情况下,将所述图片类型的目标数据转换为文本类型的目标数据,以用于输入所述事件识别模型。
7.根据权利要求1所述的特征事件的识别方法,所述通过分配的采集资源分别采集来自各个互联网渠道的目标数据,包括:
周期性地采集来自各个互联网渠道的目标数据;
其中,采集周期与分配至相应的互联网渠道的采集资源的资源量呈负相关。
8.根据权利要求1所述的特征事件的识别方法,所述识别方法还包括:
根据所述采集资源从所述互联网渠道采集的目标数据更新所述各个互联网渠道的等级。
9.根据权利要求8所述的特征事件的识别方法,更新所述各个互联网渠道的等级,包括:
根据采集资源在每个采集周期中采集的目标数据,重新确定所述互联网渠道与特征事件的关联程度;
根据重新确定的关联程度调整所述互联网渠道的等级。
10.根据权利要求1所述的特征事件的识别方法,所述识别方法,还包括:
在识别出所述目标数据包含所述特征事件的情况下,向预设告警对象发送预警信息。
11.一种特征事件的识别装置,包括:
确定模块,用于基于互联网渠道与特征事件的关联程度分别确定各个互联网渠道的等级,所述等级与所述关联程度呈正相关;
分配模块,用于向各个互联网渠道分配采集资源,并通过分配的采集资源分别采集来自各个互联网渠道的目标数据;其中,分配的采集资源的资源量与各个互联网渠道对应的等级呈正相关;
识别模块,用于通过对采集到的目标数据进行分析,以识别出所述目标数据中包含的特征事件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010373434.1/1.html,转载请声明来源钻瓜专利网。





