[发明专利]语句补全方法、装置、介质及对话处理系统有效

专利信息
申请号: 201910701230.3 申请日: 2019-07-31
公开(公告)号: CN110427625B 公开(公告)日: 2022-12-27
发明(设计)人: 王琰;潘珠峰;白坤 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06F40/211 分类号: G06F40/211;G06F40/30;G06F16/332
代理公司: 北京市柳沈律师事务所 11105 代理人: 王娟
地址: 518057 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语句 方法 装置 介质 对话 处理 系统
【权利要求书】:

1.一种基于人工智能的语句补全方法,包括:

获取对话中当前语句及当前语句的至少一个先前语句;

提取所述至少一个先前语句中与当前语句相关联的隐含字;

将所述至少一个先前语句、当前语句和隐含字拼接,得到复合输入序列;

对所述复合输入序列进行处理,补全当前语句,得到补全对话;

其中,提取所述至少一个先前语句中与当前语句相关联的隐含字包括:

将所述至少一个先前语句及当前语句拼接得到待挑选语句序列,并生成与所述待挑选语句序列对应的待挑选语句矩阵,所述待挑选语句矩阵中的每一行向量为待挑选语句序列中相应字的字向量;

对所述待挑选语句矩阵进行处理,得到隐含字预测向量,所述隐含字预测向量与待挑选语句序列具有相同尺寸;

将隐含字预测向量中的每一个隐含字预测值与预设阈值相比较,并将大于预设阈值的隐含字预测值所对应的字确定为隐含字;

且其中,对所述复合输入序列进行处理以补全当前语句得到补全对话包括:对于预设输出序列中的每一个输出位,

计算复合输入序列中每一个输入字为预设输出序列该输出位上输出字的概率,获得在该输出位上该输入字所对应的注意力数值,基于所述注意力数值得到注意力分布向量;

计算预设字库序列中的每一个预设字为预设输出序列该输出位上的输出字的概率,获得在该输出位上该预设字所对应的生成概率数值,基于所述生成概率数值得到生成概率分布向量;

基于生成概率分布向量和注意力分布向量,得到总分布向量;

将总分布向量中最大总分布数值所对应的字确定为预设输出序列该输出位上的输出字,并将其输出。

2.如权利要求1所述的语句补全方法,其中,对所述待挑选语句矩阵进行处理得到隐含字预测向量包括:

对于待挑选语句矩阵中的每一行向量,计算其所对应的位置编码向量,并将所得到的位置编码向量与该行向量相加和,得到语句编码矩阵;

对所述语句编码矩阵进行处理,生成待检测矩阵;

对所述待检测矩阵进行处理,得到对应于该待检测矩阵的隐含字预测向量。

3.如权利要求1所述的语句补全方法,其中,对于预设输出序列中的每一个输出位得到所述注意力分布向量包括:

通过第一循环神经网络对所述复合输入序列进行处理,生成与所述复合输入序列相对应的加码器隐状态矩阵,所述加码器隐状态矩阵中每一行向量对应于复合输入序列中的一个字;

基于所得到的加码器隐状态矩阵,通过第二循环神经网络处理,得到用于该输出位的解码器隐状态向量;

基于所述解码器隐状态向量与加码器隐状态矩阵,计算得到用于该输出位的注意力分布向量。

4.如权利要求1所述的语句补全方法,其中,对所述复合输入序列进行处理以补全当前语句得到补全对话还包括:

对所述隐含字预测向量与复合输入序列共同进行处理,以得到补全对话。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910701230.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top