[发明专利]将来自各种语音服务的结果表示为统一概念知识库在审
申请号: | 201680080451.8 | 申请日: | 2016-05-31 |
公开(公告)号: | CN108701459A | 公开(公告)日: | 2018-10-23 |
发明(设计)人: | M·N·A·乔治斯;F·E·A·奈特恩;J·D·阿纳斯塔西亚迪斯;O·本德尔;J·M·德克罗斯 | 申请(专利权)人: | 纽昂斯通讯公司 |
主分类号: | G10L15/32 | 分类号: | G10L15/32;G06F17/27 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 黄纶伟 |
地址: | 美国马*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音服务结果 语音服务 服务规范 可靠结果 数据结构 概念知识 应用模块 概念知识库 可靠性测度 异步接收 评估 统一 | ||
描述了用于处理来自多个语音服务的结果的系统和方法。一种方法包括:接收来自多个语音服务的语音服务结果和与语音服务结果对应的服务规范。结果为表示根据语音服务的功能的信息的至少一种数据结构。服务规范描述数据结构及针对各语音服务该数据结构的解释。基于服务规范将语音服务结果编码成结果的统一概念知识表示。向应用模块提供统一概念知识表示。方法包括:评估从多个语音服务异步接收的语音服务结果,以基于可靠性测度来确定所接收的语音服务结果中是否存在可靠结果。如果存在可靠结果,则将可靠结果提供给应用模块;否则,方法继续评估所接收的语音服务结果。
相关申请
本申请要求2015年12月1日提交的美国第62/261,762号临时申请的权益。此处以引证的方式将上述申请的整个示教并入。
背景技术
支持话音的应用和服务,诸如在汽车资讯娱乐系统中设置的,通常包括对话或用户接口,并且可以例如受益于组合独立言语理解(SLU)系统的多个结果。在组合自动语音识别(ASR)结果的领域中存在已知组合方法,但这些方法常常遭受丢失定时信息、丢失统一语音描述以及处理时延。包括具有组合信息检索功能的系统的SLU系统由语音服务来表示。通常,对于特殊域,例如,话音目的地输入或话音命令和控制,优化各语音服务。语音服务的结果经常交叠。组合语音服务可能引入基准模糊以及含义的模糊。
发明内容
一种处理来自多个语音服务的结果的方法包括:接收来自多个语音服务的语音服务结果和与语音服务结果对应的服务规范。结果为表示根据语音服务的功能的信息的至少一种数据结构。服务规范描述数据结构及针对各语音服务该数据结构的解释。方法还包括:基于服务规范将语音服务结果编码成结果的统一概念知识表示;以及向应用模块提供统一概念知识表示。
数据结构可以包括所识别语句的列表、所标记词序列的列表以及关键字值对的列表中的至少一项。数据结构可以表示用于结果的至少部分的加权信息。数据结构还可以包括阵列或分层存储信息的树中的至少一种。
统一概念知识表示可以由于相同信息以相同方式呈现而被认为是统一的,并且可以由于使用合适表示按组定义相关事实而被认为是概念性的。统一概念知识表示可以以信息的结构化表示来表示知识,并且还可以提供与应用模块连接的接口。
统一概念知识表示可以包括概念的列表,各概念实现函数的集合。对函数的集合的一个函数的函数调用可以返回结果列表。例如,概念可以包含定义关系的函数的集合,并且“实现”可以意指基于结果来定义关系。例如考虑概念“目的地输入”,其可以描述有用且对于目的地输入可能需要的关系(例如,街道与城市与门牌号之间的关系)。函数使得能够访问关系,例如能够取得给定城市中的所有门牌号或取得具有类似发音的所有城市的列表等。
编码语音服务结果可以包括根据概念向语音服务结果应用运算符的集合。各概念可以用独立且通用的运算符的序列来因数化,运算符具有对共享资源的访问。作为经验法则,所有运算符独立且通用。可以的是一些运算符是特定的,或者一些运算符依赖其他运算符,但这因为常常降低运算符的可重用性而不是优选的。
运算符的序列和选择可以在运行时间期间配置。这里,“运行时间”指“编译之后”,使得可以在不重编译/建立软件的情况下改变序列。此外,运行时间期间的配置简单地通过提供新配置(例如,新序列定义)支持已经部署系统的功能更新。
一次可以计算多个概念,多个概念接收相同语音服务结果作为输入。概念可以为语义解释。编码结果可以包括在给定来自多个语音服务的语音服务结果的集合的情况下计算语义组的集合,各语义组通过识别可比较的数据来定义,当数据本身在给定距离测度的情况下类似时或当数据共享与可比较的数据的关系时,数据是可比较的。
应用模块可以为对话模块、用户接口等,还可以为优先级编码器。例如,一个优先级编码器可以编码语音服务结果,并且向是另一优先级编码器的应用模块提供在统一概念知识库中表示的结果。将优先级编码器级联为这种结构可以促进语音服务结果的合并。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于纽昂斯通讯公司,未经纽昂斯通讯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680080451.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:话音识别
- 下一篇:使用全通滤波器的无损带分离和带连结