[发明专利]一种基于语义模型的Handle存量标识解析方法在审
申请号: | 202111077324.1 | 申请日: | 2021-09-14 |
公开(公告)号: | CN113780005A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 宋世杰;霍健 | 申请(专利权)人: | 码客工场工业科技(北京)有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/216;G06K9/62 |
代理公司: | 太原科卫专利事务所(普通合伙) 14100 | 代理人: | 朱源;武建云 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 模型 handle 存量 标识 解析 方法 | ||
1.一种基于语义模型的Handle存量标识解析方法,其特征在于:将存量标识预处理后通过朴素贝叶斯算法分类并将分类结果映射到语义模型中,之后通过事先定义的规则将语义模型表示的存量标识转换为Handle标识,从而将存量标识的解析转换为对Handle标识的解析。
2.根据权利要求1所述的一种基于语义模型的Handle存量标识解析方法,其特征在于:具体包括如下步骤:
(1)、在企业内部场景对存量标识进行预处理
将无效标识去除以保证标识的正确性;无效标识包括失效标识和多义标识;失效标识指在企业现有解析体系下也无法获取查询结果的标识,多义标识指在企业现有解析体系下进行解析得到多个解析结果的标识;
(2)、通过朴素贝叶斯算法对存量标识进行分类处理
将存量标识按照产品名和企业归属分为不同的组;
(3)、构建一个通用语义知识模型
模型如下:M={概念,实例,企业};该模型为一个由三个概念组成的三元组,由概念、实例和企业三个元素组成;如下:
概念,称为产品名,其存在是为了将同一产品在不同企业的异构表示统一起来;
实例,其是企业现有存量标识本身;
企业,即模型中实例的生产企业;
(4)、基于规则将步骤(2)中的分组映射为语义知识模型
映射规则如下:
产品名映射为概念,
存量标识本身映射为实例,
企业归属映射为企业;
(5)、按照Handle标识的格式将语义知识模型转化为Handle标识;转换格式如下:
Handle::=Stock Identification Manage/concept_instance_enterprise
Stock Identification Manage为一个Handle前缀,其在Handle解析系统中注册,所有的存量标识都共用该前缀;
concept_instance_enterprise为一个Handle后缀,其由步骤(4)中的知识模型转换而来,其具体形式为由两个下划线连接的知识模型的三个组成部分。
3.根据权利要求2所述的一种基于语义模型的Handle存量标识解析方法,其特征在于:步骤(2)中,通过朴素贝叶斯算法对存量标识的处理过程如下:
1)准备阶段
此阶段需要确定特征属性,并对每个特征属性进行划分,然后由人工对部分待分类存量标识进行分类,形成训练样本合集;特征属性是人为划定的存量标识的不同部分;这一阶段的输入为待分类的存量标识,输出为特征属性和训练样本;
2)训练分类器
此阶段生成分类器;工作是计算每个类别在样本中的出现概率以及每个特征属性划分对每个类别的条件概率估计,并将结果记录;其输入为特征属性和训练样本,输出是分类器;
3)选取部分存量标识人工进行分类后作为测试分类器的数据合集,对训练好的分类器进行测试;
测试后得到成功率=测试集中成功的数据个数/测试集中所有数据总个数;
若是成功率低于96%则回到步骤1)更改特征属性,并继续向下进行;
4)对存量标识进行处理
使用分类器对待分类存量标识进行分类,其输入为分类器和待分类存量标识,输出是存量标识与其所属的组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于码客工场工业科技(北京)有限公司,未经码客工场工业科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111077324.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:管芯堆叠结构及其制造方法
- 下一篇:触控显示模组及其制备方法