[发明专利]特征类别确定方法、装置、电子设备及存储介质有效
| 申请号: | 202210649433.4 | 申请日: | 2022-06-10 |
| 公开(公告)号: | CN114722162B | 公开(公告)日: | 2022-08-26 |
| 发明(设计)人: | 陈哲;周玉林;王越 | 申请(专利权)人: | 南京英诺森软件科技有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/216;G06F40/289 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 马迪 |
| 地址: | 211300 江苏省南京市*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 特征 类别 确定 方法 装置 电子设备 存储 介质 | ||
本发明公开了一种特征类别确定方法、装置、电子设备及存储介质,该方法包括:获取待处理主数据,对待处理主数据进行分词处理,得到与待处理主数据相对应的第一待处理关键词;基于预先建立的条件随机场模型,对待处理主数据进行处理,得到与待处理主数据相对应的第二待处理关键词;根据第一待处理关键词和第二待处理关键词,确定待使用关键词;根据待使用关键词以及历史长文本数据,确定各待使用关键词的词频逆文本频率,并根据词频逆文本频率,确定与待处理主数据相对应的目标关键词;根据目标关键词以及各待匹配关键词,确定目标关键词的特征类别。本发明实施例的技术方案,实现了快速准确确定主数据的关键词以及关键词对应的特征类别的效果。
技术领域
本发明涉及主数据管理技术领域,尤其涉及一种特征类别确定方法、装置、电子设备及存储介质。
背景技术
主数据指系统间共享数据,是企业内跨平台跨业务可共享的高价值数据,是企业运营的核心主体或对象。
在供应链系统使用主数据时,可通过关键词调出主数据。因此,针对主数据和主数据的关键词必须应当加以正确维护,才能保证供应链系统的完整性和准确性。
但是,由于主数据之间缺乏语义关联,难以进行识别和管理,且由于主数据的数据量大、结构复杂,难以确定主数据中各关键词的特征类别,以应对数据变化。
发明内容
本发明提供了一种特征类别确定方法、装置、电子设备及存储介质,以解决主数据管理时难以确定关键词以及难以确定关键词所对应的特征类别的问题,实现了快速准确的确定主数据的关键词以及关键词所对应的特征类别的技术效果。
根据本发明的一方面,提供了一种特征类别确定方法,该方法包括:
获取待处理主数据,对所述待处理主数据进行分词处理,得到与所述待处理主数据相对应的第一待处理关键词;
基于预先建立的条件随机场模型,对所述待处理主数据进行处理,得到与所述待处理主数据相对应的第二待处理关键词;
根据所述第一待处理关键词和所述第二待处理关键词,确定待使用关键词;
根据所述待使用关键词以及历史长文本数据,确定各待使用关键词的词频逆文本频率,并根据所述词频逆文本频率,确定与所述待处理主数据相对应的目标关键词;
根据目标关键词以及各待匹配关键词,确定所述目标关键词的特征类别。
根据本发明的另一方面,提供了一种特征类别确定装置,该装置包括:
第一待处理关键词确定模块,用于获取待处理主数据,对所述待处理主数据进行分词处理,得到与所述待处理主数据相对应的第一待处理关键词;
第二待处理关键词确定模块,用于基于预先建立的条件随机场模型,对所述待处理主数据进行处理,得到与所述待处理主数据相对应的第二待处理关键词;
待使用关键词确定模块,用于根据所述第一待处理关键词和所述第二待处理关键词,确定待使用关键词;
目标关键词确定模块,用于根据所述待使用关键词以及历史长文本数据,确定各待使用关键词的词频逆文本频率,并根据所述词频逆文本频率,确定与所述待处理主数据相对应的目标关键词;
特征类别确定模块,用于根据目标关键词以及各待匹配关键词,确定所述目标关键词的特征类别。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京英诺森软件科技有限公司,未经南京英诺森软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210649433.4/2.html,转载请声明来源钻瓜专利网。





