[发明专利]用于操作智能自动化助理的电子设备和方法、存储介质有效
申请号: | 201510855408.1 | 申请日: | 2015-11-30 |
公开(公告)号: | CN105702248B | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | C·亨顿;D·奈克 | 申请(专利权)人: | 苹果公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L15/22 |
代理公司: | 11038 中国国际贸易促进委员会专利商标事务所 | 代理人: | 刘凤香<国际申请>=<国际公布>=<进入 |
地址: | 美国加*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 话音 合成 消除 同形 异音词 歧义 | ||
1.一种用于操作智能自动化助理的方法,所述方法包括:
在具有处理器和存储有供处理器执行的一个或多个程序的存储器的电子设备处:
接收来自用户的包含同形异音词以及一个或多个附加单词的话音输入;
利用自动话音辨识系统对话音输入进行处理,以确定以下各项的至少其中之一:
对应于由用户在话音输入中发音的同形异音词的音素串;以及
n元语法关于语料库的出现频率,其中,所述n元语法包括所述同形异音词以及一个或多个附加单词;
基于所述音素串和n元语法的出现频率的至少其中之一确定同形异音词的正确发音;
生成针对话音输入的对话响应,其中所述对话响应包括所述同形异音词;以及
输出所述对话响应以作为话音输出,其中根据所确定的正确发音在话音输出中发音所述对话响应中的同形异音词。
2.根据权利要求1所述的方法,其中,利用自动话音辨识系统处理话音输入包括确定对应于话音输入的文本串,并且所述方法还包括:
基于所述文本串确定可行动意图,其中基于所述音素串、n元语法的出现频率和可行动意图的至少其中之一确定同形异音词的正确发音。
3.根据权利要求2所述的方法,还包括:
把同形异音词指派到可行动意图的一个参数,其中至少部分地基于所述参数确定同形异音词的正确发音。
4.根据权利要求2所述的方法,其中:
词汇表列表与可行动意图相关联;
词汇表列表包括同形异音词;
词汇表列表中的同形异音词与特定发音相关联;并且
基于与词汇表列表中的同形异音词相关联的特定发音确定同形异音词的正确发音。
5.根据权利要求2所述的方法,还包括:
接收与话音输入相关联的情境信息,其中至少部分地基于情境信息确定可行动意图。
6.根据权利要求1所述的方法,其中:
所述n元语法中的同形异音词与第一发音相关联;
利用自动话音辨识系统处理话音输入包括确定第二n元语法关于语料库的出现频率;
第二n元语法包括所述同形异音词以及一个或多个附加单词;
第二n元语法中的同形异音词与第二发音相关联;并且
基于所述n元语法的出现频率和所述第二n元语法的出现频率确定同形异音词的正确发音。
7.根据权利要求6所述的方法,其中,所述n元语法的出现频率比第二n元语法的出现频率高至少预定数量,并且其中把同形异音词的正确发音确定为第一发音。
8.根据权利要求6所述的方法,其中,第一n元语法的出现频率高于第一预定阈值,第二n元语法的出现频率低于第二预定阈值,并且其中把同形异音词的正确发音确定为第一发音。
9.根据权利要求6所述的方法,其中,所述音素串对应于第二发音,所述n元语法的出现频率比所述第二n元语法的出现频率高至少预定数量,并且其中把同形异音词的正确发音确定为第一发音。
10.根据权利要求1所述的方法,还包括:
从自动话音辨识系统获得对应于所确定的正确发音的第二音素串,其中输出对话响应包括利用话音合成器合成对话响应中的同形异音词,并且其中所述话音合成器使用第二音素串根据所述正确发音合成话音输出中的同形异音词。
11.根据权利要求1所述的方法,还包括:
利用标签注释对话响应中的同形异音词以标识出同形异音词的正确发音,其中输出对话响应包括利用话音合成器合成对话响应中的同形异音词,并且其中基于所述标签合成对话响应中的同形异音词。
12.根据权利要求1所述的方法,还包括:
接收与话音输入相关联的情境信息,其中至少部分地基于所述情境信息确定同形异音词的正确发音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苹果公司,未经苹果公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510855408.1/1.html,转载请声明来源钻瓜专利网。