[发明专利]一种快速准确侦测多次上传的物料清单属于同一产品的方法有效
申请号: | 202011534261.3 | 申请日: | 2020-12-22 |
公开(公告)号: | CN112632953B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 施海昕;刘云锋 | 申请(专利权)人: | 云汉芯城(上海)互联网科技股份有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F18/22;G06Q10/0875 |
代理公司: | 北京远创理想知识产权代理事务所(普通合伙) 11513 | 代理人: | 卫安乐 |
地址: | 201612 上海市松江区漕河泾开*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 快速 准确 侦测 多次 上传 物料 清单 属于 同一 产品 方法 | ||
1.一种快速准确侦测多次上传的物料清单属于同一产品的方法,包括以下步骤:
A、读取物料清单的所有文件名列表;
B、按照用户ID分组,并从第一个用户开始;
C、判断此用户上传的物料清单的次数,如果次数2,则删除记录;如果次数≥2,则计算同用户组内的字符串相似度,基于所述的字符串相似度做聚类分析,并标记文件名的组ID;计算字符串相似度选用计算Levenshtein编辑距离的方式进行;
D、判断是否有下一个用户,如果有则重复步骤C,如果没有,则去除掉只有一次上传记录的组;
E、对于每个文件名组,计算上传天数差异和物料清单条目明细相似度;
计算物料清单条目明细相似度的具体方法包括:
E1、比较两组物料清单中每行的参数和型号,相同的参数或者型号归为一行相同;
E2、物料清单的相似度=相同行数/平均值(第一组物料清单的行数+第二组物料清单的行数);
如果天数差异大于N,且所述的物料清单条目明细相似度≤M,则需要将所述的文件名组拆分为不同的子分组,并标注子分组ID;且去除掉只有一次上传记录的子分组;
所述的天数差异值N为3天,所述的M为0;
F、最终上传天数差异小和物料清单条目相似度度高的物料清单属于同一产品。
2.根据权利要求1所述的一种快速准确侦测多次上传的物料清单属于同一产品的方法,其特征在于,先判断所述物料清单条目明细相似度,如果所述的物料清单条目明细相似度不为0,再判断天数差异。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云汉芯城(上海)互联网科技股份有限公司,未经云汉芯城(上海)互联网科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011534261.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于野外河道的水文测绘监测系统
- 下一篇:加热炉及微波加热装置