[发明专利]话音识别有效
申请号: | 201780014607.7 | 申请日: | 2017-02-24 |
公开(公告)号: | CN108701458B | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | R·J·弗勒利克 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/08;G10L15/19;G10L15/183 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 王英;刘瑜 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 话音 识别 | ||
从用户接收语音输入。ASR系统在存储器中生成其已经在该语音输入中识别出的单词的集合,并且在其每次在该语音输入中识别出新的单词时更新该集合以将该新的单词添加至该集合。信息在话音活动仍在进行时被预先取回以用于响应于要在所述话音活动间隔的结束时被输出而进行传递。
背景技术
通信系统允许用户例如通过在网络上进行通信事件而通过通信网络彼此通信。网络例如可以是互联网或公共交换电话网(PSTN)。在通话期间,音频和/或视频信号能够在网络的节点之间被传输,由此允许用户在通过通信网络的通信会话中互相发送和接收音频数据(例如,话音)和/或视频数据(例如,网络摄像头视频)。
这样的通信系统包括互联网协议语音或视频(VoIP)系统。为了使用VoIP系统,用户在用户设备上安装并执行客户端软件。客户端软件建立VoIP连接并且提供诸如注册和用户认证之类的其他功能。除了语音通信之外,客户端还可以建立用于通信事件、即时消息传送(IM)、屏幕共享、或白板会话的连接。
通信事件可以在(多个)用户与智能软件代理之间进行,所述智能软件代理有时被称作“bot”。软件代理是一种代表具有代理关系的用户来执行任务的自主计算机软件。软件代理在通信事件的持续时间内连续运行以等待代理的输入,当所述输入被检测到时触发要对那些输入执行自动任务。软件代理可以表现出人工智能(AI),由此它可以模拟某些人类智能过程,例如对来自用户的输入生成类似人类的响应,因此促进用户与软件代理之间经由网络的双向对话。
发明内容
提供了该发明内容以用简化的形式引入在以下的具体实施方式中进一步描述的概念的选择。该发明内容不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。
本发明的一个方面针对一种计算机系统,其包括:输入端,其被配置为从用户接收语音输入;ASR系统,其用于识别该语音输入中的个体单词,其中,所述ASR系统被配置为在该语音输入中的至少一个话音活动的间隔期间、在存储器中生成它已经在该语音输入中识别出的一个或多个单词的集合,并且被配置为它每次在该语音输入中识别出新的单词时更新该存储器中的集合以将该新的单词添加至该集合;查找模块,其被配置为在该语音输入中的话音活动的间隔期间在该话音活动间隔仍在进行时的第一时间从该存储器中的集合中取回至少一个单词,并且被配置为在该话音活动间隔仍在进行时执行查找以预先取回与所述至少一个单词相关联的信息;以及响应生成模块,其被配置为检测该话音活动间隔在稍后时间的结束,该集合在该第一时间与所述稍后时间之间至少被该ASR系统更新了一次,并且基于其来生成用于输出给用户的响应,其中,该响应传达由查找模块预先取回的信息。
在用户已经完成讲话之前执行先发性(pre-emptive)查找确保了最终响应能够在期望时被输出而没有延迟。这提供了更加自然的对话流。被预先取回的信息例如可以来自互联网搜索引擎(例如,Bing、Google等),或者该用户可以是通信系统的用户并且所述信息可以是与通信系统中的另一个用户有关的信息。例如,可以将关键词与通信系统的用户数据库中的用户标识符(例如,用户名)进行比较以定位与该关键词相匹配的用户标识符中的一个,并且该信息可以是有关与其用户名相关联的所识别的用户的信息(例如,联系人细节)。
在实施例中,可以基于由ASR系统向该个体单词中的至少一个所指定的置信度数值和/或由计算机系统的语言模型向单词集合所指定的置信度数值来生成所述响应。
所述信息可以是从互联网搜索引擎预先取回的。
所述用户可以是通信系统的用户,而预先取回的信息可以是与通信系统中的另一个用户有关的信息。例如,预先取回的信息可以包括针对其他用户的联系人细节。
所述计算机系统可以包括话音检测模块,其被配置为当存储器中的所识别的单词的集合被ASR系统更新时对其进行监视,其中,所述响应生成模块被配置为基于对所识别的单词集合的所述监视来检测话音活动间隔的结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780014607.7/2.html,转载请声明来源钻瓜专利网。