[发明专利]一种处理重复信件的方法、装置、存储介质和电子设备在审
| 申请号: | 202210546548.0 | 申请日: | 2022-05-20 |
| 公开(公告)号: | CN114897504A | 公开(公告)日: | 2022-08-12 |
| 发明(设计)人: | 李双贺;王颖;冯添;鄢阁俊;陈一朴 | 申请(专利权)人: | 北京北大软件工程股份有限公司 |
| 主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06F16/35;G06F40/279;G06N3/04;G06N3/08 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 周春霞 |
| 地址: | 100089 北京市海淀区北四环西路67号中关*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 处理 重复 信件 方法 装置 存储 介质 电子设备 | ||
1.一种处理重复信件的方法,其特征在于,包括:
获取待处理重复信件;
对所述待处理重复信件进行实体抽取,得到实体抽取结果;
将所述实体抽取结果输入到预先训练好的分类模型中,得到所述待处理重复信件的分类结果;
基于所述待处理重复信件的分类结果,对所述待处理重复信件执行相应的处理。
2.根据权利要求1所述的方法,其特征在于,所述对所述待处理重复信件进行实体抽取,得到实体抽取结果,包括:
将所述待处理重复信件输入到训练好的BiLSTM-CRF模型中,得到所述实体抽取结果。
3.根据权利要求2所述的方法,其特征在于,所述BiLSTM-CRF模型的训练过程包括:
获取样本训练数据;其中,所述样本训练数据是通过对样本重复信件进行预处理后得到的,所述样本重复信件的预处理包括为所述样本重复信件中的标点符合添加标识;
利用所述样本训练数据对初始BiLSTM-CRF模型进行训练,得到所述训练好的BiLSTM-CRF模型。
4.根据权利要求1或2所述的方法,其特征在于,所述待处理重复信件包括目标人员,所述实体抽取结果包括所述目标人员的姓名、所述目标人员的身份证号、所述目标人员的地址和所述目标人员对应的信件问题的归属地。
5.一种处理重复信件的装置,其特征在于,包括:
第一获取模块,用于获取待处理重复信件;
实体抽取模块,用于对所述待处理重复信件进行实体抽取,得到实体抽取结果;
输入模块,用于将所述实体抽取结果输入到预先训练好的分类模型中,得到所述待处理重复信件的分类结果;
处理模块,用于基于所述待处理重复信件的分类结果,对所述待处理重复信件执行相应的处理。
6.根据权利要求5所述的装置,其特征在于,所述实体抽取模块,用于将所述待处理重复信件输入到训练好的BiLSTM-CRF模型中,得到所述实体抽取结果。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取样本训练数据;其中,所述样本训练数据是通过对样本重复信件进行预处理后得到的,所述样本重复信件的预处理包括为所述样本重复信件中的标点符合添加标识;
训练模块,用于利用所述样本训练数据对初始BiLSTM-CRF模型进行训练,得到所述训练好的BiLSTM-CRF模型。
8.根据权利要求5或6所述的装置,其特征在于,所述待处理重复信件包括目标人员,所述实体抽取结果包括所述目标人员的姓名、所述目标人员的身份证号、所述目标人员的地址和所述目标人员对应的信件问题的归属地。
9.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1-4任一所述的处理重复信件的方法。
10.一种电子设备,其特征在于,所述电子设备包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当所述电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1-4任一所述的处理重复信件的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京北大软件工程股份有限公司,未经北京北大软件工程股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210546548.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





