[发明专利]一种邮件处理方法、装置及存储介质在审
申请号: | 202111016447.4 | 申请日: | 2021-08-31 |
公开(公告)号: | CN113706115A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 陈文捷;曾利强 | 申请(专利权)人: | 平安银行股份有限公司 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06F16/35;G06F40/117;G06F40/194;G06F40/279;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 邮件 处理 方法 装置 存储 介质 | ||
1.一种邮件处理方法,其特征在于,包括:
获取用户电子邮箱中的已处理邮件,所述已处理邮件为已收到且已回复的邮件;
获取所述已处理邮件的目标变量对应的邮件数据和关键特征变量对应的邮件数据,所述目标变量对应的邮件数据与所述已处理邮件的处理重要性相关,所述关键特征变量用于表示影响所述已处理邮件的处理重要性的邮件属性;
基于所述已处理邮件的目标变量对应的邮件数据和所述关键特征变量对应的邮件数据,对待训练的XGBoost模型进行训练,获得训练完成的XGBoost模型;
获取所述用户电子邮箱中的待处理邮件,以及所述待处理邮件的所述关键特征变量对应的邮件数据,所述待处理邮件为已收到且未回复的邮件;
将所述待处理邮件的所述关键特征变量对应的邮件数据输入所述训练完成的XGBoost模型,获得所述待处理邮件的所述目标变量的预测值;
基于所述待处理邮件的所述目标变量的预测值,确定所述待处理邮件的重要性级别。
2.如权利要求1所述的方法,其特征在于,所述获取用户电子邮箱中的已处理邮件,包括:
获取用户电子邮箱中的已收到邮件和已发送邮件,并获取所述已收到邮件和所述已发送邮件的属性数据;
在确定已收到的第一邮件和已发送的第二邮件的属性数据满足对应条件的情况下,将所述第一邮件确定为所述已处理邮件,并将所述第二邮件确定为所述已处理邮件对应的邮件;所述第一邮件是所述已收到邮件中的任一封邮件,所述第二邮件是所述已发送邮件中的任一封邮件,所述对应条件包括:所述第二邮件的收件人包括所述第一邮件的发件人、所述第二邮件的发送时间大于所述第一邮件的接收时间、所述第二邮件与所述第一邮件的主题的相似度大于第一阈值、所述第二邮件与所述第一邮件的正文的相似度大于第二阈值。
3.如权利要求2所述的方法,其特征在于,所述获取所述已处理邮件的目标变量对应的邮件数据和关键特征变量对应的邮件数据,包括:
将所述已处理邮件对应的邮件的发送时间与所述已处理邮件的接收时间的时间差,确定为所述已处理邮件的目标变量对应的邮件数据;
获取所述已处理邮件的至少两个基础特征变量中每个基础特征变量分别对应的邮件数据,所述基础特征变量用于表示所述已处理邮件的邮件属性;
基于所述已处理邮件的至少两个基础特征变量中每个基础特征变量分别对应的邮件数据,对所述至少两个基础特征变量进行筛选处理,获得所述关键特征变量,并获得所述已处理邮件的关键特征变量对应的邮件数据。
4.如权利要求3所述的方法,其特征在于,所述至少两个基础特征变量包括正文特征变量,所述获取所述已处理邮件的至少两个基础特征变量中每个基础特征变量分别对应的邮件数据,包括:
对所述已处理邮件的正文进行分词处理,获得所述正文包含的关键词;
将所述正文包含的关键词与预设关键词进行匹配,获得匹配结果,并将所述匹配结果作为所述正文特征变量对应的邮件数据,所述预设关键词包括以下类型中的至少一种:用于表示紧急程度的预设关键词、用于表示时间的预设关键词、用于表示动作的预设关键词、用于表示惩罚意义的预设关键词;所述匹配结果包括所述正文包含的关键词与所述预设关键词是否匹配成功,和/或所述正文包含的关键词与所述预设关键词匹配成功的数量。
5.如权利要求3或4所述的方法,其特征在于,所述基于所述已处理邮件的至少两个基础特征变量中每个基础特征变量分别对应的邮件数据,对所述至少两个基础特征变量进行筛选处理,获得所述关键特征变量,包括:
对所述至少两个基础特征变量中每个基础特征变量分别对应的邮件数据进行证明力权重WOE编码,并基于所述WOE编码的结果计算所述至少两个基础特征变量中每个基础特征变量的信息价值IV值;
将IV值大于第三阈值的基础特征变量或IV值最大的前N个基础特征变量,确定为所述关键特征变量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安银行股份有限公司,未经平安银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111016447.4/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理