[发明专利]物料标签的构建方法、装置、可读存储介质及电子设备有效
| 申请号: | 202011352250.3 | 申请日: | 2020-11-27 |
| 公开(公告)号: | CN112395881B | 公开(公告)日: | 2022-12-13 |
| 发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 北京筑龙信息技术有限责任公司 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/284;G06F40/216;G06F40/247;G06F16/35 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 毕翔宇 |
| 地址: | 100100 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 物料 标签 构建 方法 装置 可读 存储 介质 电子设备 | ||
本申请提供了一种物料标签的构建方法、装置、可读存储介质及电子设备,所述构建方法包括:将获取到的物料描述文本输入至预先训练好的实体识别模型中,确定所述物料描述文本中包括的至少一个物料实体;基于预设特征集,从所述物料描述文本中确定出至少一个物料特征;基于预设的特征‑关联词映射关系,确定与每一个物料特征相关联的物料属性类别;针对每一个物料实体,基于将与该物料实体相关联的物料特征,以及与该物料特征相关联的物料属性类别,构建物料标签。这样,通过基于物料描述文本中构建与每个物料相对应的物料标签,可以通过物料标签准确识别物料的物料信息,有助于提高物料识别的效率以及准确率。
技术领域
本申请涉及数据处理技术领域,尤其是涉及物料标签的构建方法、装置、可读存储介质及电子设备。
背景技术
在现有产品生产线上,一般会存在多条生产线同时进行工作的情况,在每一条生产线上除了生产线上生产的产品之外,生产线上的生产工具等均是生产线上需要进行管理的物料,为了进行物料的统一管理,收集相应的物料描述文本,但是在收集到的物料描述文本中的物料数据是随机进行收集的,难以快速准确地识别出物料描述文本所描述的物料,因此,如何从物料描述文本中如何准确地确定出物料信息成为亟待解决的问题。
发明内容
有鉴于此,本申请的目的在于提供物料标签的构建方法、装置、可读存储介质及电子设备,通过基于物料描述文本中构建与每个物料相对应的物料标签,可以通过物料标签准确识别物料的物料信息,有助于提高物料识别的效率以及准确率。
本申请实施例提供了一种物料标签的构建方法,所述构建方法包括:
将获取到的物料描述文本输入至预先训练好的实体识别模型中,确定所述物料描述文本中包括的至少一个物料实体;
基于预设特征集,从所述物料描述文本中确定出至少一个物料特征;
基于预设的特征-关联词映射关系,确定与每一个物料特征相关联的物料属性类别;
针对每一个物料实体,基于将与该物料实体相关联的物料特征,以及与该物料特征相关联的物料属性类别,构建物料标签。
进一步的,所述基于预设特征集,从所述物料描述文本中确定出至少一个物料特征,包括:
确定所述预设特征集中每一个特征包括的多个字符,以及每两个字符之间的关联关系;
基于每一个特征中的多个字符以及每两个字符之间的关联关系,构建与所述预设特征集对应的匹配树;
基于所述匹配树,确定所述物料描述文本中确定出至少一个物料特征。
进一步的,通过以下步骤确定所述预设特征集:
获取多条历史数据以及与每一条历史数据对应的目录信息;
基于获取到的多条目录信息,确定与所述多条历史数据对应的至少一个历史类别,并将所述多条历史数据基于至少一个历史类别分类,确定多个历史数据集;
针对每一个历史数据集,确定出该历史数据集中的包括的至少一个特征词,以及每一个特征词的词频;
针对于每一个历史数据集,确定对应的词频大于预设词频阈值的至少一个目标特征词;
将每一个历史数据集中包括的至少一个目标特征词集合,组成所述预设特征集。
进一步的,通过以下步骤确定预设的特征对应的关联词:
针对每一个目标特征词,确定该目标特征词与同一历史数据集中的出该目标特征词之外,每一个特征词之间的支持度以及置信度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京筑龙信息技术有限责任公司,未经北京筑龙信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011352250.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:混合动力总成及其控制方法
- 下一篇:一种用于橡胶领域的粉碎装置





