[发明专利]一种基于外部知识和片段选择的抽取式阅读理解方法在审
| 申请号: | 202210034681.8 | 申请日: | 2022-01-13 |
| 公开(公告)号: | CN114385803A | 公开(公告)日: | 2022-04-22 |
| 发明(设计)人: | 张璞;谢陈;金诗鸿 | 申请(专利权)人: | 重庆邮电大学 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/242;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 卢胜斌 |
| 地址: | 400065 重*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 外部 知识 片段 选择 抽取 阅读 理解 方法 | ||
1.一种基于外部知识和片段选择的抽取式阅读理解方法,其特征在于,包括获取数据并对数据进行预处理;将预处理后数据送入训练好的抽取式阅读理解模型,通过抽取式阅读理解模型输出针对数据的问题的最佳答案;抽取式阅读理解模型包括SpanBERT编码模块、外部知识融合模块以及片段选择模块;
训练抽取式阅读理解模型的过程包括以下步骤:
S1.获取原始阅读理解数据集,对原始阅读理解数据集进行预处理,得到预处理后的文本和问题;
S2.将预处理后的文本和问题输入到SpanBERT编码模块,获取文本和问题的上下文特征表示并判断预处理后的问题是否可回答,若可回答,则进入步骤S3;
S3.从外部知识融合模块得到预处理后的问题相关的知识信息向量,并将知识信息向量通过哨兵机制与文本和问题的上下文特征表示融合,得到融合文本;
S4.根据融合文本,采用全连接操作获取预处理后的问题的答案,若存在多个答案相同的片段,则启用片段选择模块得到抽取结果;设置迭代次数初始值;
S5.采用交叉熵损失函数对抽取结果计算损失值,根据损失值计算抽取式阅读理解模型的优化结果并反向传播,调整抽取式阅读理解模型的参数;
S6.设置最大迭代次数,判断迭代次数是否达到最大迭代次数,若达到,则完成抽取式阅读理解模型的训练,否则返回步骤S5,且迭代次数加1。
2.根据权利要求1所述的一种基于外部知识和片段选择的抽取式阅读理解方法,其特征在于,对原始阅读理解数据集进行预处理包括:
S11.设定文本长度阈值,判断每个文本的长度是否超过文本长度阈值;
S12.若超过文本长度阈值,则计算文本中的每个句子和问题的相似度;
S13.相似度计算完成后按降序排列,留下和问题最相关的TOP K个句子;
其中相似度计算公式为:
Sqp表示问题和文本句的相似度得分,cos(θ)表示余弦相似度计算,Qi表示问题句中的第i个单词,Pi表示文本句中的第i个单词,n表示文本的最大长度。
3.根据权利要求1所述的一种基于外部知识和片段选择的抽取式阅读理解方法,其特征在于,获取文本和问题的上下文特征表示并判断预处理后的问题是否可回答的过程为:
S21.将预处理后的的文本和问题进行组合,组合后的格式为:
W(P,Q)=[CLS],P1,…,Pn,[SEP],Q1,…,Qm,[SEPend];
S22.对组合后的文本和问题添加位置信息,得到词嵌入表示序列并输入SpanBERT编码模块,词嵌入表示序列的计算公式为:
S23.采用融合外部知识的多头自注意力机制处理词嵌入表示序列,得到包含句子语义的向量序列;
S24.将包含句子语义的向量序列经过多层Transformer编码器提取特征向量;
S25.将特征向量中的第一个标记[CLS]作为分类任务中该向量的总表示,根据[CLS]判断问题是否可回答,若[CLS]=[0],则不可回答,若[CLS]=[1],则可回答;
其中,P=(P1,…,Pi,…,Pn)表示文本句,Q=(Q1,…Qj,…,Qm)表示问题句,Pi表示文本句中的第i个单词,Qj表示问题句中的第j个单词,[CLS]表示分类标志,[SEP]表示分隔标志,[SEPend]表示结尾标志,为词嵌入表示序列中第i个词的词嵌入,为词嵌入表示序列中第i个词的位置嵌入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210034681.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种应用6G数字孪生的数字、智慧化建筑物
- 下一篇:打桩机





