[发明专利]一种机器阅读理解方法、系统、计算机及存储介质在审
申请号: | 202111419520.2 | 申请日: | 2021-11-26 |
公开(公告)号: | CN114218365A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 姜小波;何昆 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/383;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 梁莹 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机器 阅读 理解 方法 系统 计算机 存储 介质 | ||
1.一种机器阅读理解方法,其特征在于,包括以下步骤:
S1、获取原始文段文本和原始问题文本的单词级信息、字符级信息以及特征信息;
S2、将步骤S1获得的信息进行向量表征以及向量表征融合,得到原始文段表征de和原始问题表征qe,以及融合后的综合文段表征du和综合问题表征qu;
S3、将原始文段表征de、原始问题表征qe、综合文段表征du、综合问题表征qu进行层次注意力交互,并将各层的交互结果进行拼接,得到交互后的文段表征d和交互后的问题表征q;
S4、对交互后的文段表征d和交互后的问题表征q进行特征提取,得到文段的上下文表征dx和问题的上下文表征qx;
S5、利用文段的上下文表征dx和问题的上下文表征qx进行多轮回答,将每轮的生成的双指针分布结果进行汇总,并计算汇总结果的随机掩码平均值,得到最终的双指针分布,分布中最大元素对应的索引即为答案在文段中的起、止位置。
2.根据权利要求1所述的一种机器阅读理解方法,其特征在于,所述步骤S2具体包括:
S2-1、使用GloVe和CoVe来表征单词向量,得到wglove∈RL×300以及两层wcove∈RL×600;使用ELMo来表征字符向量,得到wchar∈RL×1024以及两层welmo∈RL×1024;通过特征工程得到特征向量wfeature∈RL×24,将wglove、wchar、wfeature以及wcove与welmo的第一层进行拼接,送入两层一维卷积前馈网络CFF中,得到一度融合后的表征wffn∈RL×256;
S2-2、将wcove与welmo的第一层与wffn拼接得x∈RL×1880,将x送入多样性循环单元DRU中计算,得到二度融合后的表征wdru0∈RL×256;
S2-3、将wglove、welmo的第二层与wdru0进行拼接,再送入一个多样性循环单元DRU中,得到三度融合后的表征wdru1∈RL×256;
S2-4、将wdru0与wdru1进行拼接作为融合后的综合表征u∈RL×512;将wcove、welmo的第二层与wglove进行拼接作为原始表征e∈RL×1924;
S2-5、分别对原始文段文本与原始问题文本执行S2-1~S2-4的过程,得到原始文段表征de、原始问题表征qe、融合后的综合文段表征du以及综合问题表征qu。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111419520.2/1.html,转载请声明来源钻瓜专利网。