[发明专利]内件品名与寄递地址的关联关系的识别方法和系统有效
| 申请号: | 202210478330.6 | 申请日: | 2022-05-05 |
| 公开(公告)号: | CN114818730B | 公开(公告)日: | 2023-05-12 |
| 发明(设计)人: | 许良锋;王丰;高黎明;杨阳;任仰奇;张彬;杨韬;杨睿;闻克宇;张倾城 | 申请(专利权)人: | 国家邮政局邮政业安全中心 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F40/284;G06F40/216;G06F40/237;G06F40/253;G06F40/58 |
| 代理公司: | 北京友谊嘉知识产权代理事务所(普通合伙) 16075 | 代理人: | 张会会 |
| 地址: | 100080*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 品名 寄递 地址 关联 关系 识别 方法 系统 | ||
1.一种内件品名与寄递地址的关联关系的识别方法,其特征在于,包括:获取英语语境的寄递面单数据;对所述寄递面单数据的英文内件品名和英文寄递地址进行自然语言处理;对自然语言处理得到的数据进行关注词分析;根据关注词分析结果,所述寄递面单数据以及业务规则库构建识别模型,所述业务规则库对不同类型的英文风险内件品的识别规则进行预设定;通过所述识别模型,获得英文风险内件品名与英文风险寄递地址的关联关系;
所述内件品名与寄递地址的关联关系的识别方法还包括:在所述对自然语言处理得到的数据进行关注词分析之前,建立特征词库,所述特征词库中包括至少一类危险内件品的英文内件品名;所述对自然语言处理得到的数据进行关注词分析包括:从所述特征词库中选择英文内件品名作为关注词,或,自定义词语进行关注词分析;在自定义词语进行关注词分析时,所述内件品名与寄递地址的关联关系的识别方法还包括:将关注词分析结果与所述特征词库中的英文内件品名进行匹配,在匹配失败后,确认所述关注词分析结果是否为危险内件品,在确认为风险内件品后,将所述关注词分析结果更新至所述特征词库中。
2.根据权利要求1所述的内件品名与寄递地址的关联关系的识别方法,其特征在于,所述通过所述识别模型,获得英文风险内件品名与英文风险寄递地址的关联关系包括:向所述识别模型输入一个英文风险内件品名,所述识别模型输出相关的多个英文风险寄递地址及各英文风险寄递地址的出现概率;或,向所述识别模型输入一个英文风险寄递地址,所述识别模型输出相关的多个英文风险内件品名及各英文风险内件品名的出现概率。
3.根据权利要求2所述的内件品名与寄递地址的关联关系的识别方法,其特征在于,所述识别模型为Skip-gram模型。
4.根据权利要求1所述的内件品名与寄递地址的关联关系的识别方法,其特征在于,所述通过所述识别模型,获得英文风险内件品名与英文风险寄递地址的关联关系包括:向所述识别模型输入多个英文风险内件品名,所述识别模型输出相关的一个英文风险寄递地址;或,向所述识别模型输入多个英文风险寄递地址,所述识别模型输出相关的一个英文风险内件品名。
5.根据权利要求4所述的内件品名与寄递地址的关联关系的识别方法,其特征在于,所述识别模型为CBOW模型。
6.根据权利要求1所述的内件品名与寄递地址的关联关系的识别方法,其特征在于,通过N LT K方法对所述寄递面单数据的英文内件品名和英文寄递地址进行自然语言处理。
7.根据权利要求1所述的内件品名与寄递地址的关联关系的识别方法,其特征在于,所述对自然语言处理得到的数据进行关注词分析包括:统计关注词数量,统计关注词密度,搜索单个关注词,统计关注词出现位置的上下文中的相似词,搜索多个关注词的共同上下文,统计关注词出现的频率,统计出现次数高于第一预设值的关注词,统计出现次数低于第二预设值的关注词,多维度选择关注词,以及,图形化展示多个关注词中的一种或多种。
8.根据权利要求1所述的内件品名与寄递地址的关联关系的识别方法,其特征在于,还包括:在所述通过所述识别模型,获得英文风险内件品名与英文风险寄递地址的关联关系之后,查找与所述英文风险寄递地址或英文风险内件品名对应的寄递面单,并为所述寄递面单设置风险识别标识。
9.一种内件品名与寄递地址的关联关系的识别系统,其特征在于,包括:获取模块,用于获取英语语境的寄递面单数据;处理模块,用于对所述寄递面单数据的英文内件品名和英文寄递地址进行自然语言处理;分析模块,用于对自然语言处理得到的数据进行关注词分析;构建模块,用于根据关注词分析结果,寄递面单数据以及业务规则库构建识别模型,所述业务规则库对不同类型的英文风险内件品的识别规则进行预设定;识别模块,用于通过所述识别模型,获得英文风险内件品名与英文风险寄递地址的关联关系;
所述内件品名与寄递地址的关联关系的识别系统还包括:词库建立模块和词库更新模块;所述词库建立模块用于在所述对自然语言处理得到的数据进行关注词分析之前,建立特征词库,所述特征词库中包括至少一类危险内件品的英文内件品名;所述对自然语言处理得到的数据进行关注词分析包括:从所述特征词库中选择英文内件品名作为关注词,或,自定义词语进行关注词分析;所述词库更新模块用于在自定义词语进行关注词分析时,将关注词分析结果与所述特征词库中的英文内件品名进行匹配,在匹配失败后,确认所述关注词分析结果是否为危险内件品,在确认为风险内件品后,将所述关注词分析结果更新至所述特征词库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家邮政局邮政业安全中心,未经国家邮政局邮政业安全中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210478330.6/1.html,转载请声明来源钻瓜专利网。





