[发明专利]模型训练方法及装置、知识抽取方法及装置、设备和介质在审
申请号: | 202111302016.4 | 申请日: | 2021-11-04 |
公开(公告)号: | CN114186533A | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 李舰;史亚冰;蒋烨;柴春光;朱勇 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/14 | 分类号: | G06F40/14;G06F40/295;G06F40/205;G06F16/332 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 单冠飞 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 知识 抽取 设备 介质 | ||
本公开提供了一种模型训练方法及装置、知识抽取方法及装置、设备和介质,涉及人工智能领域,具体为知识图谱技术领域。方案为:对样本文档进行解析,确定样本文档中各元素在样本文档中所属的层级,并根据各元素所属的层级,生成文档树,文档树中包括各个层级的节点用于指示样本文档中对应层级的元素;针对文档树中的每个节点,查询与节点所指示元素的类型匹配的目标知识抽取模型,并采用目标知识抽取模型对节点所指示的元素进行知识抽取,得到预测知识;根据预测知识和节点所指示的元素在样本文档上对应的标注知识之间的差异,对目标知识抽取模型进行训练。由此,基于深度学习技术,对各知识抽取模型进行训练,可以提升各知识抽取模型的预测效果。
技术领域
本公开涉及人工智能领域,具体为知识图谱技术领域,尤其涉及模型训练方法及装置、知识抽取方法及装置、设备和介质。
背景技术
从不同来源、不同结构的数据中进行知识抽取,形成知识存入到知识图谱,为智能问答、智能客服等技术的基础。得益于人工智能与深度学习技术的不断发展,可以利用模型来实现知识的自动抽取。为了提升模型的预测效果,对模型进行训练是非常重要的。
发明内容
本公开提供了一种用于模型训练方法及装置、知识抽取方法及装置、设备和介质。
根据本公开的一方面,提供了一种模型训练方法,包括:
获取样本集合中的至少一个样本文档,并对所述样本文档进行解析,以确定所述样本文档中各元素在所述样本文档中所属的层级;
根据各所述元素所属的层级,生成文档树;其中,所述文档树中包括各个层级的节点,每个层级的所述节点用于指示所述样本文档中对应层级的元素;
针对所述文档树中的每个节点,根据所述节点所指示元素的类型,查询与所述类型匹配的目标知识抽取模型;
采用所述目标知识抽取模型对所述节点所指示的元素进行知识抽取,以得到预测知识;
根据所述预测知识和所述节点所指示的元素在所述样本文档上对应的标注知识之间的差异,对所述目标知识抽取模型进行训练。
根据本公开的另一方面,提供了一种知识抽取方法,包括:
获取待识别文档;
对所述待识别文档进行解析,以确定所述待识别文档中各元素在所述待识别文档中所属的层级;
根据各所述元素所属的层级,生成文档树;其中,所述文档树中包括各个层级的节点,每个层级的所述节点用于指示所述待识别文档中对应层级的元素;
针对所述文档树中的每个节点,根据所述节点所指示元素的类型,查询与所述类型匹配的目标知识抽取模型;
采用所述目标知识抽取模型对所述节点所指示的元素进行知识抽取,以得到目标知识。
根据本公开的又一方面,提供了一种模型训练装置,包括:
解析模块,用于获取样本集合中的至少一个样本文档,并对所述样本文档进行解析,以确定所述样本文档中各元素在所述样本文档中所属的层级;
生成模块,用于根据各所述元素所属的层级,生成文档树;其中,所述文档树中包括各个层级的节点,每个层级的所述节点用于指示所述样本文档中对应层级的元素;
查询模块,用于针对所述文档树中的每个节点,根据所述节点所指示元素的类型,查询与所述类型匹配的目标知识抽取模型;
抽取模块,用于采用所述目标知识抽取模型对所述节点所指示的元素进行知识抽取,以得到预测知识;
训练模块,用于根据所述预测知识和所述节点所指示的元素在所述样本文档上对应的标注知识之间的差异,对所述目标知识抽取模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111302016.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种喷嘴旋转的单水动力防砸喷雾降尘器
- 下一篇:一种高合金方坯的径向锻造方法