[发明专利]基于注意力机制的用于阅读理解的方法、装置和电子设备有效
| 申请号: | 201810611199.X | 申请日: | 2018-06-14 |
| 公开(公告)号: | CN109033068B | 公开(公告)日: | 2022-07-12 |
| 发明(设计)人: | 杨鹏 | 申请(专利权)人: | 北京慧闻科技(集团)有限公司 |
| 主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/30;G06F40/211;G06F16/33 |
| 代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰 |
| 地址: | 100124 北京市朝阳区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 公开了基于注意力机制的用于阅读理解的方法、装置和电子设备。该方法包括:对获得文本数据和问题数据分别进行词向量转化;处理问题和文本的词向量表示,以分别获得问题和文本的语义向量表示;对问题和文本的语义向量表示进行语义加强;通过注意力机制层获得融合问题信息的上下文表示;对融合问题信息的上下文表示进行语义加强,以及,基于加强的融合问题信息的上下文表示和加强的问题语义向量表示,获得问题数据对应的答案。这样,通过采用语义加强方法的特定模型架构优化用于机器阅读理解的系统,以提升短文本答案抽取任务的效果。 | ||
| 搜索关键词: | 基于 注意力 机制 用于 阅读 理解 方法 装置 电子设备 | ||
【主权项】:
1.一种基于注意力机制的用于机器阅读理解的方法,其特征在于,包括:对获得文本数据和与所述文本数据相关的问题数据分别进行词向量转化,以分别获得所述问题数据和所述文本数据的词向量表示;以第一循环神经网络模型分别处理所述问题数据和所述文本数据的词向量表示,以分别获得所述问题数据的问题语义向量表示和所述文本数据的文本语义向量表示;通过第一语义加强层处理所述问题语义向量表示和文本向量语义表示,以分别获得加强的问题语义向量表示和加强的文本语义向量表示;通过注意力机制层处理所述加强的问题语义向量表示和所述加强的文本语义向量表示,以获得融合问题信息的上下文表示;通过第二语义加强层处理所述融合问题信息的上下文表示,以获得加强的融合问题信息的上下文表示;基于所述加强的融合问题信息的上下文表示和所述加强的问题语义向量表示,获得所述文本数据中每个词语为所述问题数据对应答案的起始位置和结束位置的概率,以将所述起始位置和结束位置的联合分布概率最大的文本片段确定为所述问题数据对应的答案。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京慧闻科技(集团)有限公司,未经北京慧闻科技(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810611199.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种界图
- 下一篇:一种基于社会媒体用户动态行为的微博主题挖掘方法





