[发明专利]用于在接口内构造语音单元的方法和系统无效

专利信息
申请号: 200710135911.5 申请日: 2007-03-09
公开(公告)号: CN101055524A 公开(公告)日: 2007-10-17
发明(设计)人: F·戈梅斯;C·阿加皮;J·R·刘易斯;B·D·梅茨;B·D·曼达利亚;D·E·赖克;K·M·霍罗威茨 申请(专利权)人: 国际商业机器公司
主分类号: G06F9/44 分类号: G06F9/44
代理公司: 北京市金杜律师事务所 代理人: 冯谱
地址: 美国纽*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 接口 构造 语音 单元 方法 系统
【说明书】:

技术领域

发明涉及软件开发领域,具体地涉及一种基于用户提供的标准和自动化过程从图形用户接口单元生成具有语音功能的接口单元的交互式软件开发工具。

背景技术

计算设备越来越多地利用具有语音功能的接口作为常规图形用户接口的补充或代替。产业正在变得自动化,并且要求雇员在与计算设备交互的同时进行大量现实世界的任务。具有语音和图形接口模式的多模式接口已经证明是一种允许这些雇员使用对于现实世界任务和计算机交互而言最为便利的交互模式来同时执行双重活动的有利工具。例如,结账店员可以在为客户打包购买物品的同时向麦克风说出用于计算设备的命令。同一职员可以在与客户交谈的同时利用图形接口来与计算设备交互。

具有语音功能的接口正在越来越多地得到使用的另一原因与具有有限或者不便的输入/输出外围设备的移动计算设备激增有关。这一点对于移动设备、嵌入设备和可佩戴的计算设备而言尤其成立。例如,许多智能电话包括触屏GUI和语音接口。语音接口可以接收被自动地转换成文本并且放置于比如电子邮件应用程序或者字处理应用程序这样的应用程序中的语音输入。这一语音输入机制对于用户而言可能比尝试使用与设备的GUI模式相关联的触屏输入机制来输入文本消息要简单地多。此外,可能要在难以阅读相对小型屏幕(由于便携设备的移动性质)的环境中或者在读取显示屏过于分散注意力的情形中利用移动设备。在这样的情形中,文本输出可以转换成语音并且以可听的方式提供给用户。

尽管具有语音交互模式的计算设备有广泛的使用,但是大部分的应用程序缺乏用于交互的语音形态。这一点对于通常配置用于复杂的GUI交互和配置用以在可视浏览器中呈现的Web页面而言可能最为明显。即使许多移动设备具有Web功能,但是用户常常无法从这些移动设备访问所需站点,因为可视单元无法呈现在移动设备的有限屏幕上,以及因为所需站点缺乏语音交互模式。类似地,虽然存在许多允许电话用户访问Web内容的声音浏览器,但是很少有Web页面是针对完全基于语音的交互而设计的。

用以将GUI应用程序转换成语音用户接口(SUI)应用程序的两种普遍途径包括从暂时存储器(scratch)设计SUI应用程序和使用代码转换(transcode)技术。从暂时存储器写入SUI可能成本很高并且耗费时间。从GUI直接代码转换为SUI通常导致SUI代码包括许多错误,这可能使自动和动态生成的SUI的用户不胜其烦。可选地,自动生成的SUI代码的结果可以由开发者在SUI开发工作的生成后阶段中进行修改。这些生成后阶段的修改可能耗费时间、成本很高,并且可能导致相对低质量的SUI(取决于在生成后阶段中耗费的时间)。

发明内容

一种软件工具,其通过使用一些自动化过程和至少一个预生成的由设计者规定的选择而从图形用户接口(GUI)交互式地生成具有语音功能的接口。具体而言,一种设计接口可以用图形方式引导一个从对应GUI单元创建具有语音功能的单元的过程。在设计接口中,可以与将要转换成语音用户接口(SUI)单元的每个GUI单元紧邻地放置可视选择器。与每个关联GUI单元紧邻地放置可视选择器可以自动地和/或人工地进行。

设计者可以在可视选择器内规定GUI单元将要转换成的语音控制类型。在一个实施例中,可以从可用语音控制类型的列表中进行这一选择,这些语音控制类型可以各自对应于可重用的对话框组件(RDC)或者对应于有助于生成具有语音功能的单元的其它代码机制。可以用默认语音控制类型和/或使用代码转换技术来确定的语音控制类型初始地设置可视选择器。在设计者已经调整可视选择器内的值之后,可以自动创建语音用户接口(SUI)。这一接口可以是新的纯语音接口以及既包括GUI单元又包括具有语音功能的单元的多模式接口。此外,GUI和新接口都可以用可由浏览器呈现的标记语言来实施。在一个实施例中,可以从可以向开发者提供已知调用流设计特征的设计接口内获得调用流接口或者视图,这些设计特征促使从自动生成的SUI代码产生高质量的具有语音功能的接口。

本发明可以根据与这里提供的实质内容相一致的许多方面来实施。例如,本发明的一个方面可以包括一种用于在接口内构造语音单元的方法。该方法可以包括识别具有多个可视单元的可视接口的步骤。可以与每个可视单元邻近地提供可视选择器。可视选择器可以允许用户为关联的可视单元输入语音控制类型。对于每个提供的可视选择器,可以自动生成具有在可视选择器中规定的语音控制类型的语音单元。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200710135911.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top