[发明专利]在参与者之间的对话中检测可行动项有效
| 申请号: | 201680056137.6 | 申请日: | 2016-09-17 |
| 公开(公告)号: | CN108028043B | 公开(公告)日: | 2021-11-19 |
| 发明(设计)人: | D·Z·哈卡尼-图尔;何晓冬;陈缊侬 | 申请(专利权)人: | 微软技术许可有限责任公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F40/30;G06Q10/10;G06N3/08;G10L15/20;G06F40/35;G10L15/22;G10L15/26 |
| 代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;辛鸣 |
| 地址: | 美国华*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 参与者 之间 对话 检测 行动 | ||
1.一种由至少一个硬件处理器实现的用于标识可行动项的方法,所述至少一个硬件处理器由至少一个计算设备提供,所述方法包括:
接收话语信息,所述话语信息表达在涉及多个参与者的对话期间被说出的至少一个话语;
将所述话语信息转换为识别的语音信息,以提供一个或多个检测到的话语;
使用机器训练的模型来:
将特定的检测到的话语映射到语义空间中的特定话语嵌入中;
将候选可行动项映射到所述语义空间中的候选动作嵌入中;
生成反映所述特定话语嵌入与所述候选动作嵌入的相似性的得分;以及
至少基于所述得分来识别与所述特定的检测到的话语相关联的特定可行动项;以及
执行与所述特定可行动项相关联的至少一个计算机实现的动作,
所述接收、转换、使用和执行由所述至少一个硬件处理器执行,而不中断所述对话中的所述多个参与者之间的通信流。
2.根据权利要求1所述的方法,其中所述对话发生在两个或更多个人类参与者之间的会议中。
3.根据权利要求1所述的方法,其中所述特定可行动项通过至少部分地基于所述得分来从所述候选可行动项选择最可能的候选可行动项而被识别。
4.根据权利要求3所述的方法,其中所述选择包括响应于确定所述特定可行动项具有最有利得分而挑选所述特定可行动项。
5.根据权利要求3所述的方法,其中所述选择包括:
使用排名模型对所述候选可行动项排名,以提供对应的排名值,所述排名模型接收与每个所述候选可行动项相关联的对应的得分作为输入特征值,其中总体而言,所述排名提供与所述候选可行动项相关联的排名值,并且
其中所述选择包括响应于至少基于所述排名值来确定所述特定可行动项为最可能的候选可行动项而选择所述特定可行动项。
6.根据权利要求1所述的方法其中所述机器训练的模型是神经网络。
7.根据权利要求6所述的方法,其中所述神经网络是深层结构的卷积神经网络。
8.根据权利要求1所述的方法,其中所述执行至少一个计算机实现的动作包括:
标识一个或多个动作值,所述一个或多个动作值在执行与所述特定可行动项相关联的所述至少一个计算机实现的动作时起到操作性角色的作用;
解决所述一个或多个动作值中的不明确性,以提供经解决的可行动项;以及
执行所述经解决的可行动项。
9.根据权利要求1所述的方法,其中所述使用机器训练的模型包括:使用已经至少部分地基于已经从源环境被收集的训练数据的源语料库而被训练的机器训练的模型,其中所述源环境与所述机器训练的模型被应用于其中的目标环境不同。
10.根据权利要求9所述的方法,
其中所述源环境从属于人类参与者在其中与助理部件交互的域,并且
其中所述目标环境从属于人类参与者在其中直接相互通信的域。
11.根据权利要求10所述的方法,其中训练数据的所述源语料库中的每个训练示例对应于由参与者对所述助理部件说出的话语以及与所述话语相关联的对应的可行动项。
12.根据权利要求9所述的方法,其中所述使用机器训练的模型包括:使用已经通过以下各项而被训练的机器训练的模型:
至少基于训练数据的所述源语料库来开发源-环境模型;以及
通过至少基于训练数据的目标语料库继续训练所述源-环境模型来开发目标-环境模型,所述目标语料库从所述目标环境被收集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680056137.6/1.html,转载请声明来源钻瓜专利网。





