[发明专利]文本处理方法、神经网络的训练方法、装置和设备在审
| 申请号: | 202211727311.9 | 申请日: | 2022-12-30 | 
| 公开(公告)号: | CN115862031A | 公开(公告)日: | 2023-03-28 | 
| 发明(设计)人: | 张丹;吴思瑾;罗斌;彭启明;胡腾;冯仕堃 | 申请(专利权)人: | 北京百度网讯科技有限公司 | 
| 主分类号: | G06V30/18 | 分类号: | G06V30/18;G06V30/148;G06F40/289;G06V10/82;G06N3/04;G06N3/08 | 
| 代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 | 
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 文本 处理 方法 神经网络 训练 装置 设备 | ||
1.一种文本处理方法,包括:
获取目标文本和目标问题;
利用文本理解模型对所述目标问题和所述目标文本进行处理,以得到信息抽取结果,所述信息抽取结果指示所述目标文本中的用于回答所述目标问题的文本片段;以及
利用文本生成模型对所述目标问题、所述目标文本以及所述信息抽取结果进行处理,以得到用于回答所述目标问题的文本生成结果。
2.根据权利要求1所述的方法,其中,利用文本理解模型对所述目标问题和所述目标文本进行处理,以得到信息抽取结果包括:
将所述目标问题和所述目标文本输入所述文本理解模型,以得到对所述目标文本的标注结果,所述标注结果指示所述目标文本中的哪些部分属于用于回答所述目标问题的文本片段;以及
基于对所述目标文本的标注结果,确定所述信息抽取结果。
3.根据权利要求1或2所述的方法,其中,所述文本生成模型包括第一编码器和第一解码器,利用文本生成模型对所述目标问题、所述目标文本以及所述信息抽取结果进行处理,以得到用于回答所述目标问题的文本生成结果包括:
将所述目标问题、所述目标文本以及所述信息抽取结果输入所述第一编码器,以得到第一中间特征向量,所述第一中间特征向量表征所述目标问题、所述目标文本以及所述信息抽取结果三者各自的语义信息;以及
将所述中间特征向量输入所述第一解码器,以得到所述文本生成结果。
4.根据权利要求1或2所述的方法,其中,获取目标文本和目标问题包括:
对文档图像进行文本识别,以得到所述目标文本,
其中,利用文本理解模型对所述目标问题和所述目标文本进行处理,以得到信息抽取结果包括:
利用文本理解模型对所述目标问题、所述目标文本和所述文档图像进行处理,以得到所述信息抽取结果,
其中,利用文本生成模型对所述目标问题、所述目标文本以及所述信息抽取结果进行处理,以得到用于回答所述目标问题的文本生成结果包括:
利用文本生成模型对所述目标问题、所述目标文本、所述信息抽取结果以及所述文档图像进行处理,以得到所述文本生成结果。
5.根据权利要求2所述的方法,其中,所述文本理解模型包括第二编码器和至少一个标注模型,将所述目标问题和所述目标文本输入所述文本理解模型,以得到对所述目标文本的标注结果包括:
将所述目标问题和所述目标文本输入所述第二编码器,以得到第二中间特征向量,所述第二中间特征向量表征所述目标问题和所述目标文本两者各自的语义信息;
分别利用所述至少一个标注模型中的每一个标注模型对所述第二中间特征向量进行处理,以得到所述至少一个标注模型各自输出的对所述目标文本的候选标注结果;以及
基于与所述至少一个标注模型对应的至少一个候选标注结果,确定所述标注结果。
6.一种用于文本处理的神经网络的训练方法,所述神经网络包括文本生成模型,所述方法包括:
获取样本集,所述样本集包括至少一个样本文本、与所述至少一个样本文本对应的至少一个样本问题、以及用于回答所述至少一个样本问题的至少一个真实结果;
针对所述样本集中的每一个样本文本,利用所述文本生成模型对该样本文本、与该样本文本对应的样本问题、以及用于回答该样本问题的真实结果进行处理,以得到用于回答该样本问题的预测结果;以及
基于所述至少一个样本文本中的每一个样本文本对应的真实结果和预测结果,调整所述神经网络的参数,以得到训练后的神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211727311.9/1.html,转载请声明来源钻瓜专利网。





