[发明专利]一种候选回答语句生成和自然语言选择方法及系统有效
| 申请号: | 201911017584.2 | 申请日: | 2019-10-24 |
| 公开(公告)号: | CN110727768B | 公开(公告)日: | 2022-10-11 |
| 发明(设计)人: | 李亮;杨士杰;王树徽;黄庆明 | 申请(专利权)人: | 中国科学院计算技术研究所 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06N3/04;G06N3/08 |
| 代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 候选 回答 语句 生成 自然语言 选择 方法 系统 | ||
1.一种基于SARN模型的候选回答语句生成方法,所述SARN模型包括编码网络和解码网络,所述解码网络包括宏观语义层和微观词汇层,所述生成方法包括:
利用所述编码网络获得输入语句特征;
基于所述输入语句特征,利用所述解码网络获得对应的候选回答语句,包括:
所述宏观语义层根据所述编码网络的输出对宏观语义隐变量因子进行随机采样,得到宏观语义隐变量因子采样结果;
所述微观词汇层针对所述候选回答语句中的每个词汇执行:
根据当前词汇对应的内部状态编码对微观词汇隐变量因子进行随机采样,得到当前词汇对应的微观词汇隐变量因子采样结果,
基于注意力机制,根据所述输入语句特征和所述微观词汇隐变量因子采样结果计算当前词汇对应的注意力隐含状态,
根据所述当前词汇对应的内部状态编码、所述微观词汇隐变量因子采样结果和所述注意力隐含状态,计算当前词汇对应的分布向量,并且根据所述分布向量选取词汇作为当前词汇;
其中,下一词汇对应的内部状态编码从当前词汇对应的内部状态编码、当前词汇和当前词汇对应的微观词汇隐变量因子采样结果得到,并且初始词汇对应的内部状态编码从所述宏观语义隐变量因子采样结果得到。
2.根据权利要求1所述的生成方法,其特征在于,所述宏观语义层对应的随机隐变量因子是用于表征和决策候选回答语句宏观特性的宏观语义隐变量因子;所述微观词汇层对应的随机隐变量因子是用于表征和决策输入语句词汇注意力的微观词汇隐变量因子。
3.根据权利要求2所述的生成方法,其特征在于,所述宏观语义层根据所述编码网络的输出对宏观语义隐变量因子进行随机采样,得到宏观语义隐变量因子采样结果包括:
在宏观语义层,根据所述编码网络的输出计算所述宏观语义隐变量因子的高斯分布参数,并执行随机采样,将获得的结果输入至所述微观词汇层。
4.根据权利要求1所述的生成方法,其特征在于,根据当前词汇对应的内部状态编码对微观词汇隐变量因子进行随机采样,得到当前词汇对应的微观词汇隐变量因子采样结果包括:
根据当前词汇对应的内部状态编码计算所述微观词汇隐变量因子的高斯分布参数,并执行随机采样。
5.一种适用于人机交互的自然语言选择方法,包括:
利用如权利要求1-4任一项所述方法建立的人机交互模型获得对应于输入语句的多样性候选回答语句;
根据所述候选回答语句的语句特征,获得与所述输入语句对应的回答语句。
6.根据权利要求5所述的选择方法,其特征在于,根据所述候选回答语句的语句特征,获得与所述输入语句对应的回答语句进一步包括:
计算各所述候选回答语句的TF-IDF特征向量;
利用所述TF-IDF特征向量对预定义自然语言数据库进行筛选,获得匹配结果;
基于所述匹配结果获得与所述输入语句对应的回答语句。
7.根据权利要求6所述的选择方法,其特征在于,基于所述匹配结果获得与所述输入语句对应的回答语句进一步包括:
采用随机选择的方法从所述匹配结果中选择所述对应的回答语句。
8.一种基于SARN模型的候选回答语句生成系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器运行所述程序时执行如权利要求1-4任一项所述的步骤。
9.一种适用于人机交互的自然语言选择系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器运行所述程序时执行如权利要求5-7任一项所述的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911017584.2/1.html,转载请声明来源钻瓜专利网。





