[发明专利]针对多轮对话生成回复语句的方法和装置有效
申请号: | 202010410108.3 | 申请日: | 2020-05-15 |
公开(公告)号: | CN111400481B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 林谢雄;简葳玙;何建杉;王太峰 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 孙欣欣;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 轮对 生成 回复 语句 方法 装置 | ||
1.一种针对多轮对话生成回复语句的方法,所述方法包括:
获取多轮对话中包含当前用户问句的历史上下文;
对所述历史上下文基于注意力机制进行编码,得到所述历史上下文对应的上下文向量,以及所述历史上下文对应的第一分词序列的编码注意力分布;
对候选知识集合中的各候选知识基于注意力机制进行编码,得到所述候选知识集合对应的知识融合向量,以及所述候选知识集合对应的第二分词序列的知识注意力分布;
针对回复语句进行逐词预测,其中每次预测包括:
通过指针生成网络,分别生成当前的第一指针和第二指针,第一指针指示根据历史上下文生成下一个词的概率,第二指针指示根据候选知识集合生成下一个词的概率;
对于扩充词表中每个候选词,至少根据所述上下文向量、所述知识融合向量预测生成该候选词的第一概率;根据第一指针和编码注意力分布,确定从历史上下文中复制该候选词的第二概率,根据第二指针和知识注意力分布,确定从候选知识集合中复制该候选词的第三概率,并根据所述第一概率,第二概率和第三概率,得到将该候选词作为下一个词的预测概率;其中所述扩充词表包括,用于生成候选词的初始词表,第一分词序列中各分词,以及第二分词序列中各分词;
根据扩充词表中各个词的预测概率,预测下一个词。
2.如权利要求1所述的方法,其中,所述历史上下文还包括至少一轮的历史用户问句和历史回复语句。
3.如权利要求1所述的方法,其中,所述对候选知识集合中的各候选知识基于注意力机制进行编码之前,所述方法还包括:
提取所述历史上下文中的实体词或关键词;
根据所述实体词或关键词,确定与所述历史上下文相关的所述候选知识集合。
4.如权利要求1所述的方法,其中,所述候选知识包括:句子形式的候选知识或三元组形式的候选知识;所述三元组形式的候选知识包括能够扩充为句子的三个实体词或关键词。
5.如权利要求1所述的方法,其中,所述对候选知识集合中的各候选知识基于注意力机制进行编码,包括:
对候选知识集合中的各候选知识分别基于注意力机制进行编码,得到所述各候选知识分别对应的单条知识向量,以及各候选知识分别对应的分词序列的注意力分布;
针对各单条知识向量,基于注意力机制进行编码,得到所述候选知识集合对应的知识融合向量;以及根据各候选知识分别对应的分词序列的注意力分布,进行综合处理,得到所述候选知识集合对应的第二分词序列的知识注意力分布。
6.如权利要求1所述的方法,其中,所述通过指针生成网络,分别生成当前的第一指针和第二指针,包括:
通过指针生成网络,根据所述上下文向量、前一个词的解码状态、以及前一个词对应的词向量和所述上下文向量的组合向量,生成当前的第一指针;
通过指针生成网络,根据所述知识融合向量、前一个词的解码状态、以及前一个词对应的词向量和所述知识融合向量的组合向量,生成当前的第二指针。
7.如权利要求1所述的方法,其中,所述根据所述第一概率,第二概率和第三概率,得到将该候选词作为下一个词的预测概率,包括:
当该候选词存在于所述初始词表中,且不存在于所述第一分词序列中,且不存在于所述第二分词序列中,根据所述第一概率,得到将该候选词作为下一个词的预测概率。
8.如权利要求1所述的方法,其中,所述根据所述第一概率,第二概率和第三概率,得到将该候选词作为下一个词的预测概率,包括:
当该候选词存在于所述第一分词序列中,且不存在于所述初始词表中,且不存在于所述第二分词序列中,根据所述第二概率,得到将该候选词作为下一个词的预测概率。
9.如权利要求1所述的方法,其中,所述根据所述第一概率,第二概率和第三概率,得到将该候选词作为下一个词的预测概率,包括:
当该候选词存在于所述第二分词序列中,且不存在于所述初始词表中,且不存在于所述第一分词序列中,根据所述第三概率,得到将该候选词作为下一个词的预测概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010410108.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:驱动芯片与相关的显示器
- 下一篇:一种聚合物多元醇及其制备方法