[发明专利]答案抽取方法、装置、服务器及存储介质有效
| 申请号: | 201910049030.4 | 申请日: | 2019-01-18 |
| 公开(公告)号: | CN109815325B | 公开(公告)日: | 2021-12-10 |
| 发明(设计)人: | 戴松泰;杨仁凯;冯欣伟;余淼;周环宇 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 答案 抽取 方法 装置 服务器 存储 介质 | ||
1.一种答案抽取方法,其特征在于,包括:
确定问题特征表示和文章特征表示;
根据问题特征表示中各问题词表示与文章特征表示中各文章词表示之间的相关度,更新问题特征表示,具体包括:将所述相关度添加至所述问题特征表示中,与所述问题特征表示进行组合,得到更新后的问题特征表示;
将文章特征表示中各文章词表示与各问题特征表示中各问题词表示之间的相关度添加至所述文章特征表示中,与所述文章特征表示进行组合,得到文章相关特征表示;
根据文章相关特征表示中文章词表示与问题词表示之间的相关度,更新文章特征表示中各文章词表示,以得到新的文章特征表示;
根据新的文章特征表示中不同文章词表示之间的相关度,对新的文章特征表示中各文章词表示进行更新;
根据更新的问题特征表示和更新的文章特征表示,确定文章中的答案起始特征和答案结束特征。
2.根据权利要求1所述的方法,其特征在于,根据文章相关特征表示中文章词表示与问题词表示之间的相关度,更新文章特征表示中各文章词表示,以得到新的文章特征表示,包括:
根据文章相关特征表示中各文章词表示与问题词表示之间的相关度,调整文章特征表示中各文章词表示的权重;
其中权重与相关度正相关。
3.根据权利要求1所述的方法,其特征在于,根据新的文章特征表示中不同文章词表示之间的相关度,对新的文章特征表示中各文章词表示进行更新,包括:
根据新的文章特征表示中不同文章词表示之间的相关度,调整新的文章特征表示中各文章词表示的权重;
其中,权重与相关度正相关。
4.根据权利要求1所述的方法,其特征在于,根据更新的问题特征表示和更新的文章特征表示,确定文章中的答案起始特征和答案结束特征,包括:
根据更新的问题特征表示和更新的文章特征表示,确定答案起始特征表示;
根据答案起始特征表示和更新的文章特征表示,确定答案结束特征表示。
5.根据权利要求1所述的方法,其特征在于,确定问题特征表示,包括:
对问题文本进行分词处理;
将问题文本中包括的问题词与知识图谱进行匹配,确定问题文本中包括的实体问题词;
根据问题文本中包括的问题词向量和实体问题词向量,确定问题特征表示。
6.一种答案抽取装置,其特征在于,所述装置包括:
特征表示确定模块,用于确定问题特征表示和文章特征表示;
第一更新模块,用于根据问题特征表示中各问题词表示与文章特征表示中各文章词表示之间的相关度,更新问题特征表示,具体包括:将所述相关度添加至所述问题特征表示中,与所述问题特征表示进行组合,得到更新后的问题特征表示;
第二更新模块,用于将文章特征表示中各文章词表示与各问题特征表示中各问题词表示之间的相关度添加至所述文章特征表示中,与所述文章特征表示进行组合,得到文章相关特征表示;根据文章相关特征表示中文章词表示与问题词表示之间的相关度,更新文章特征表示中各文章词表示,以得到新的文章特征表示;根据新的文章特征表示中不同文章词表示之间的相关度,对新的文章特征表示中各文章词表示进行更新;
答案确定模块,用于根据更新的问题特征表示和更新的文章特征表示,确定文章中的答案起始特征和答案结束特征。
7.一种服务器,其特征在于,所述服务器包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的一种答案抽取方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的一种答案抽取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910049030.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:校园信息的查询方法、装置、计算机设备和存储介质
- 下一篇:对话控制方法及装置





