[发明专利]一种基于文本摘要的非事实类问答答案选择方法及系统有效
申请号: | 201810428163.8 | 申请日: | 2018-05-07 |
公开(公告)号: | CN108681574B | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 马荣强;张健;李淼;陈雷;高会议 | 申请(专利权)人: | 中国科学院合肥物质科学研究院 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/34;G06F40/289;G06F40/30;G06F40/211 |
代理公司: | 合肥天明专利事务所(普通合伙) 34115 | 代理人: | 奚华保 |
地址: | 230031 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 摘要 事实 问答 答案 选择 方法 系统 | ||
1.一种基于文本摘要的非事实类问答答案选择方法,其特征在于,包括:
抽取待选择答案文本的首句和尾句;
利用文本摘要模型TextRank对所述待选择答案文本除首句和尾句之外剩余的文本进行摘要抽取,得到初步文本摘要,包括:
将所述待选择答案文本分割成句子,并对每个句子进行分词;
对每个词的词性进行标注,并对标注后词的信息进行过滤,得到特定词的词项;
将所述特定词的词项或句子作为文本单元,将文本单元构成节点,文本单元间的相似度构成节点之间的边,得到权重图模型;
计算任两个节点的相似度,并将相似度值作为节点权重计算公式的计算参数;
对所述节点权重计算公式进行迭代直至收敛,得到各节点的得分结果;
根据收敛时各节点之间的得分,对各节点进行排序,得到排序后的各节点;
按照设定的抽取比率,在排序后的各节点中抽取文本单元组成初步文本摘要;
将所述首句、所述初步文本摘要以及所述尾句依次组合,得到待选择的答案文本摘要;
将问句和所述待选择的答案文本摘要作为神经网络语义表示模型的输入,得到问句和所述待选择的答案文本摘要的语义相关程度;
将与问句语义相关程度最高的答案文本摘要作为答案返回。
2.如权利要求1所述的基于文本摘要的非事实类问答答案选择方法,其特征在于,所述抽取所述待选择答案文本的首句和尾句,包括:
根据所述待选择答案文本中首句和尾句的位置,将所述待选择答案文本的首句和尾句抽取出来。
3.如权利要求1所述的基于文本摘要的非事实类问答答案选择方法,其特征在于,所述任两个节点的相似度的计算方法包括:词汇重叠法、字符串法、余弦相似度法以及最大共同子序列法。
4.一种基于文本摘要的非事实类问答答案选择系统,其特征在于,包括依次连接的第一抽取模块、第二抽取模块、组合模块、匹配模块以及确定模块;
第一抽取模块,用于抽取待选择答案文本的首句和尾句;
第二抽取模块,用于利用文本摘要模型TextRank对所述待选择答案文本除首句和尾句之外剩余的文本进行摘要抽取,得到初步文本摘要,所述第二抽取模块包括依次连接的分割单元、过滤单元、权重图模型构建单元、相似度计算单元、迭代单元、排序单元以及组成单元;
分割单元,用于将所述待选择答案文本分割成句子,并对每个句子进行分词;
过滤单元,用于对每个词的词性进行标注,并对标注后词的信息进行过滤,得到特定词的词项;
权重图模型构建单元,用于将所述特定词的词项或句子作为文本单元,将文本单元构成节点,文本单元间的相似度构成节点之间的边,得到权重图模型;
相似度计算单元,用于计算任两个节点的相似度,并将相似度值作为节点权重计算公式的计算参数;
迭代单元,用于对所述节点权重计算公式进行迭代直至收敛,得到各节点的得分结果;
排序单元,用于根据收敛时各节点之间的得分,对各节点进行排序,得到排序后的各节点;
组合单元,用于按照设定的抽取比率,在排序后的各节点中抽取文本单元组成初步文本摘要;
组合模块,用于将所述首句、所述初步文本摘要以及所述尾句依次组合,得到待选择的答案文本摘要;
匹配模块,用于将问句和所述待选择的答案文本摘要作为神经网络语义表示模型的输入,得到问句和所述待选择的答案文本摘要的语义相关程度;
确定模块,用于将与问句语义相关程度最高的答案文本摘要作为答案返回。
5.如权利要求4所述的基于文本摘要的非事实类问答答案选择系统,其特征在于,所述第一抽取模块具体用于:
根据所述待选择答案文本中首句和尾句的位置,将所述待选择答案文本的首句和尾句抽取出来。
6.如权利要求4所述的基于文本摘要的非事实类问答答案选择系统,其特征在于,所述相似度计算单元采用的相似度计算方法包括:词汇重叠法、字符串法、余弦相似度法以及最大共同子序列法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院合肥物质科学研究院,未经中国科学院合肥物质科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810428163.8/1.html,转载请声明来源钻瓜专利网。