[发明专利]模型训练方法及装置、知识抽取方法及装置、设备和介质在审

申请号：	202111302016.4	申请日：	2021-11-04
公开（公告）号：	CN114186533A	公开（公告）日：	2022-03-15
发明（设计）人：	李舰;史亚冰;蒋烨;柴春光;朱勇	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06F40/14	分类号：	G06F40/14;G06F40/295;G06F40/205;G06F16/332
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	单冠飞
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	模型训练方法装置知识抽取设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供了一种模型训练方法及装置、知识抽取方法及装置、设备和介质，涉及人工智能领域，具体为知识图谱技术领域。方案为：对样本文档进行解析，确定样本文档中各元素在样本文档中所属的层级，并根据各元素所属的层级，生成文档树，文档树中包括各个层级的节点用于指示样本文档中对应层级的元素；针对文档树中的每个节点，查询与节点所指示元素的类型匹配的目标知识抽取模型，并采用目标知识抽取模型对节点所指示的元素进行知识抽取，得到预测知识；根据预测知识和节点所指示的元素在样本文档上对应的标注知识之间的差异，对目标知识抽取模型进行训练。由此，基于深度学习技术，对各知识抽取模型进行训练，可以提升各知识抽取模型的预测效果。

技术领域

本公开涉及人工智能领域，具体为知识图谱技术领域，尤其涉及模型训练方法及装置、知识抽取方法及装置、设备和介质。

背景技术

从不同来源、不同结构的数据中进行知识抽取，形成知识存入到知识图谱，为智能问答、智能客服等技术的基础。得益于人工智能与深度学习技术的不断发展，可以利用模型来实现知识的自动抽取。为了提升模型的预测效果，对模型进行训练是非常重要的。

发明内容

本公开提供了一种用于模型训练方法及装置、知识抽取方法及装置、设备和介质。

根据本公开的一方面，提供了一种模型训练方法，包括：

获取样本集合中的至少一个样本文档，并对所述样本文档进行解析，以确定所述样本文档中各元素在所述样本文档中所属的层级；

根据各所述元素所属的层级，生成文档树；其中，所述文档树中包括各个层级的节点，每个层级的所述节点用于指示所述样本文档中对应层级的元素；

针对所述文档树中的每个节点，根据所述节点所指示元素的类型，查询与所述类型匹配的目标知识抽取模型；

采用所述目标知识抽取模型对所述节点所指示的元素进行知识抽取，以得到预测知识；

根据所述预测知识和所述节点所指示的元素在所述样本文档上对应的标注知识之间的差异，对所述目标知识抽取模型进行训练。