[发明专利]一种面向焊接工艺文本的工艺知识要素抽取方法在审
| 申请号: | 202211174510.1 | 申请日: | 2022-09-26 |
| 公开(公告)号: | CN115577709A | 公开(公告)日: | 2023-01-06 |
| 发明(设计)人: | 王美清;郑宇航;段金健 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/247;G06F16/35;G06N3/04;G06N3/08;G06Q50/04 |
| 代理公司: | 北京慧泉知识产权代理有限公司 11232 | 代理人: | 王顺荣;唐爱华 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 焊接 工艺 文本 知识 要素 抽取 方法 | ||
本发明提出了一种面向焊接工艺文本的工艺知识要素抽取方法,目的在于提供面向焊接工艺文本的工艺知识要素抽取方法,通过焊接工艺文本构建语料库,训练基于深度学习的命名实体识别模型,实现自然语言描述的焊接工艺文本中焊接工艺知识要素的自动抽取。本发明能够快速、准确地识别焊接工艺文本中的工艺知识要素;本发明对于同一焊接工艺知识要素的近义表达具有很好的识别能力,即该方法具有良好的泛化能力。
技术领域
本发明涉及一种面向焊接工艺文本的工艺知识要素抽取方法,它以焊接工艺文本作为训练语料,采用基于深度学习的中文命名实体识别模型,能有效识别出焊接工艺文本中的焊接工艺知识要素,达到将非结构化焊接工艺文本中工艺知识要素结构化的目的。该方法适用于船舶制造等领域。
背景技术
在船舶建造过程中,焊接加工在总工作量中的占比超过了30%,而焊接工艺设计的质量又是影响焊接加工质量和效率的关键。因此,船舶制造企业亟需实现高效高质的焊接工艺设计。对于船舶制造中的焊接加工而言,影响焊接质量的因素众多,且多因素相互关联,导致焊接工艺复杂、内容繁多;焊接过程中的每一条焊缝,都可能需要采用完全不同的焊接方法、坡口形式、焊接材料和焊接工艺参数等,工艺设计人员必须充分了解他们所使用的各项焊接工艺参数和要素,才能设计出高质量的焊接工艺,这些都对焊接工艺设计带来很大的挑战。经过数十年的积累,船舶制造企业积累了大量的焊接工艺案例,这些焊接工艺案例是工艺设计人员智慧的结晶。然而,由于这些工艺案例一般是以word或excel等文本形式存储,这些非结构化的文本信息一般都由工艺设计人员单独保管,不仅不便于查询检索,更难以实现工艺知识的共享,导致工艺案例知识的重用率低,难以发挥其应有的价值。因此,如何从非结构化的焊接工艺文本中抽取结构化的工艺信息,实现焊接工艺要素的结构化管理,进而提高工艺案例知识的重用能力就成为企业亟待解决的关键技术之一。
近年来,自然语言处理技术的发展使得非结构化文本信息的结构化处理成为可能。随着中文命名实体识别的准确率不断提高,命名实体识别的方法逐渐应用到各个专业领域中,尤其是基于深度学习的命名实体识别方法。该方法采用词向量空间来表示词语的内在特征,解决了数据稀疏问题,实现了较高的识别准确率和泛化性。但深度学习方法对训练样本有较高的要求,需要大量有标注的训练语料,因此,面向焊接工艺的语料库不可或缺。
综上所述,考虑到焊接工艺词汇的专业性特点,本发明针对焊接工艺文本非结构化的问题,首先建立了各个焊接知识要素的关系模型,制定了面向焊接工艺的专业语料的标注方法,提出了一种适用于自然语言描述的焊接工艺文本中工艺知识要素的抽取方法,能够实现焊接工艺要素的有效识别和自动抽取。
发明内容
在船舶建造过程中,焊接工艺文本的非结构化表达影响了焊接工艺知识的可重用性,进而也影响了焊接工艺的编制效率。因此,实现焊接工艺文本中焊接工艺知识要素的自动抽取,对于提高焊接工艺知识重用能力和管理效率具有重要意义。基于此,本发明的目的在于提供面向焊接工艺文本的工艺知识要素抽取方法,通过焊接工艺文本构建语料库,训练基于深度学习的命名实体识别模型,实现自然语言描述的焊接工艺文本中焊接工艺知识要素的自动抽取。
本发明提出了一种面向焊接工艺文本的工艺知识要素抽取方法。主要利用焊接工艺文本中的工艺语言作为训练数据,采用基于深度学习的中文命名实体识别方法抽取焊接工艺案例中的焊接工艺知识要素。本发明的具体实施步骤如下:
步骤一:根据焊接工艺手册、焊接工艺卡片等工艺文本信息确定在焊接工艺中需要识别的工艺要素,将工艺要素作为属性,按照自身的含义进行分类,分为7类焊接工艺知识要素。
步骤二:建立面向焊接工艺专业语料的标注规则,采用“BMES”标注准则,依据字符在工艺要素实体中的位置(首字、中间字、尾字、单字),将7类焊接工艺知识要素分为29个子类,如表2所示。对焊接工艺文本中每个字符进行标注,完成焊接工艺语料库的构建。将构建好的语料库划分为训练集和测试集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211174510.1/2.html,转载请声明来源钻瓜专利网。





