[发明专利]在语音用户接口中基于上下文的动作在审
| 申请号: | 201580060292.0 | 申请日: | 2015-11-06 |
| 公开(公告)号: | CN107077503A | 公开(公告)日: | 2017-08-18 |
| 发明(设计)人: | M·E·沃格尔;O·克里希纳;J·于;V·R·托塔;J·C·塞托;C·杨;A·Y·白;D·J·斯特潘内齐;E·基金吉尔 | 申请(专利权)人: | 微软技术许可有限责任公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F9/44;G10L15/22 |
| 代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 孟杰雄,王英 |
| 地址: | 美国华*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 用户 接口 基于 上下文 动作 | ||
背景技术
计算机系统被广泛使用。一些这种计算机系统被部署在设备中,所述设备包括台式计算机、膝上型计算机、平板计算机、智能电话、具有大屏的智能电话(例如,平板手机)以及多种其它移动设备和其它计算设备。
对用户而言操作多个不同的计算设备是常见的。例如,用户可能在工作时具有台式计算机,而在家中具有另一计算机(例如,膝上型计算机)。用户还可以具有可以用于工作和个人使用两者的移动设备(例如,智能电话)。用户也可以具有用于专业工作和个人工作两者的其它设备。
另外,可能存在用户可以生成并存储相关内容的多个不同位置。例如,用户可以在本地生成内容并将内容存储到设备(例如,智能电话、膝上型计算机、台式计算机等)。在客户端/服务器环境中,用户可以在服务器上生成信息并存储信息。用户还可以在存在多个不同服务器的环境中操作,并且用户可以在这些服务器中的任一个或全部上生成信息并存储信息。类似地,用户可以使用一个或多个基于云的服务,例如,基于云的存储、或其它基于云的服务。如果使用了基于云的服务,则用户也可以在云上生成内容并存储内容。
为了定位相关内容,常常发现用户浏览许多不同的文件,以便定位其希望定位的特定文档或文件。类似地,当用户正在开会并希望与会议中的他人共享文档时,这通常需要用户自己定位文档,修改会议中所有的不同个人,识别所有这些个人的电子邮箱别名,编写具有所有上述信息的电子邮箱消息,然后附上文档并将其发送给这些个人。
用于定位内容并与内容交互的这些当前过程是繁琐且耗时的。另外,尤其是在用诸如智能电话的相对小屏设备时,它们容易产生误差。
上述讨论仅用于一般的背景信息,并不旨在用作辅助确定所要求保护的主题的范围。
发明内容
计算设备从用户处接收语音命令输入。所述设备基于语音命令输入来获得语言处理结果。所述结果包括意图和一组变元(argument)。所述设备还获得多种不同类型的上下文信息。基于所述意图、所述变元和所述上下文信息来识别动作,并且所述设备然后通过显示能够由所述用户启动以执行所述动作的用户可选输入机构来建议所述动作。所述设备也能够自动执行所述动作。
提供该“发明内容”是为了引入在下文“具体实施方式”中进一步描述的简化形式的概念选择。该发明内容并不旨在识别所要求保护的主题的关键特征或必要特征,也不旨在用作辅助确定所要求保护的主题的范围。所要求保护的主题不限于解决在背景中提及的任意或所有缺点的实施方式。
附图说明
图1A和图1B(在本文统称为图1)示出了基于上下文的命令架构的一个范例的框图。
图2是言语处理结果的一个范例的框图。
图3A-图3B(在本文统称为图3)示出了图示图1中示出的架构的基于上下文信息识别相关内容的操作的一个范例的流程图。
图3C-图3H示出了用户接口显示的范例。
图4是图示图1中示出的架构的对言语输入信号执行言语处理的操作的一个范例的流程图。
图4A-图4H示出了用户接口显示的范例。
图5是图示在图1中示出的架构在已经打开的文档内处理命令输入的操作的一个范例的流程图。
图5A-图5V示出了用户接口显示的范例。
图6A-图6B(在本文统称为图6)示出了在图1中示出的架构的执行快速开始过程的操作的一个范例的流程图。
图6C-图6H示出了用户接口显示的各种范例。
图7是示出在图1中示出的架构的在远程服务器环境中的一些部分的范例的框图。
图8是示出在图1中图示的架构的在客户端/服务器环境中的一些部分的框图。
图9是示出在图1中图示的架构的被设置在云计算架构中的部分的一个范例的框图。
图10-图12示出了移动设备的各种范例。
图13是能够被使用在先前附图中的各种架构中的计算系统的一个范例的框图。
具体实施方式
图1A和图1B(在本文统称为图1)示出了基于上下文的命令架构100的一个范例的框图。架构100说明性地包括基于上下文的动作系统102,所述动作系统102与语言处理系统104和一组源106交互,所述源106说明性地包括多个不同的信息源108-110。信息源108-110本身能够是诸如最近使用文档的存储库、电子邮件消息、联系方式或人、日程信息(例如,日历信息)、在协作或演示系统中的文档或其它信息、设备信息、位置信息、以及多种其它信息的信息源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580060292.0/2.html,转载请声明来源钻瓜专利网。





