[发明专利]用于网络浏览器的语音式交互方法无效
申请号: | 201110388772.3 | 申请日: | 2011-11-30 |
公开(公告)号: | CN102520792A | 公开(公告)日: | 2012-06-27 |
发明(设计)人: | 林云 | 申请(专利权)人: | 江苏奇异点网络有限公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06F17/30;G10L15/02 |
代理公司: | 苏州广正知识产权代理有限公司 32234 | 代理人: | 张利强 |
地址: | 215123 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 网络 浏览器 语音 交互 方法 | ||
技术领域
本发明涉及人机交互领域,具体涉及一种用于网络浏览器的语音式交互方法。
背景技术
我国的语音识别研究起始于1958年,由中国科学院声学所利用电子管电路识别10个元音。直至1973年才由中国科学院声学所开始计算机语音识别。由于当时条件的限制,我国的语音识别研究工作一直处于缓慢发展的阶段。 进入80年代以后,随着计算机应用技术在我国逐渐普及和应用以及数字信号技术的进一步发展,国内许多单位具备了研究语音技术的基本条件。与此同时,国际上语音识别技术在经过了多年的沉寂之后重又成为研究的热点,发展迅速。就在这种形式下,国内许多单位纷纷投入到这项研究工作中去。1986年3月我国高科技发展计划(863计划)启动,语音识别作为智能计算机系统研究的一个重要组成部分而被专门列为研究课题。在863计划的支持下,我国开始了有组织的语音识别技术的研究,并决定了每隔两年召开一次语音识别的专题会议。从此我国的语音识别技术进入了一个前所未有的发展阶段。尤其随着最近些年来,国家以及各种商业机构对语音识别的重视,目前语音识别技术已经基本成熟,并且已经在商业应用中得到了广泛的应用。
目前网络浏览器已经成为操作系统以及各类应用平台的主要入口,已经渐渐成为操作系统中主要的应用软件之一,因此如何提高网络浏览器的用户体验已经成为网络浏览器吸引用户的主要手段之一。而网络浏览器相对而言由于识别的内容相对单一,尤其适用于语音识别技术。
发明内容
本发明要解决的技术问题是提供一种能够充分利用浏览器本身的网络功能实现服务端语音识别引擎的调用、实现网络浏览器的语音式交互、用户体验好、使用简单方便的用于网络浏览器的语音式交互方法。
为了解决上述技术问题,本发明采用的技术方案为:
一种用于网络浏览器的语音式交互方法,其实施步骤如下:
1)服务端建立语音识别引擎;
2)客户端在打开网络浏览器后,通过麦克风采集用户语音,提取采集得到的用户语音中的语音特征信息,并将所述语音特征信息发送给服务端;
3)所述服务端接收客户端发送的语音特征信息,调用语音识别引擎将语音特征信息转换为浏览器控制命令,并将所述浏览器控制命令发送给客户端;
4)客户端接收所述服务端发送的浏览器控制命令,并执行所述浏览器控制命令实现与网络浏览器的交互。
作为上述技术方案的进一步改进:
所述步骤3)中服务器调用语音识别引擎将语音特征信息转换为浏览器控制命令的具体步骤包括:调用语音识别引擎将语音特征信息转换为文字信息,将所述文字信息分割为控制模式信息和控制命令信息,所述控制模式信息包括网址输入、当前页面以及标签控制、浏览器程序控制三种,所述控制命令信息包括用于在所述控制模式信息下对应的快捷键。
所述步骤4)中客户端执行所述浏览器控制命令的具体步骤包括:客户端读取浏览器控制命令的控制模式信息,如果控制模式信息为网址输入,则将操作系统的当前焦点定位网络浏览器的地址输入栏,然后向操作系统发送控制命令信息包含快捷键的按键事件;如果控制模式信息为当前页面以及标签控制,则将操作系统的当前焦点定位网络浏览器的页面或者标签,然后向操作系统发送控制命令信息包含快捷键的按键事件;如果控制模式信息为浏览器程序控制,则将操作系统的当前焦点定位网络浏览器的窗口,然后向操作系统发送控制命令信息包含快捷键的按键事件。
所述客户端读取浏览器控制命令的控制模式信息时如果读取控制模式信息失败,则将网络浏览器的当前标签页或者当前页导航至预设网址。
本发明具有下述优点:
本发明通过服务端建立语音识别引擎、客户端在打开网络浏览器后,通过麦克风采集用户语音,提取采集得到的用户语音中的语音特征信息,并将语音特征信息发送给服务端、服务端接收客户端发送的语音特征信息,调用语音识别引擎将语音特征信息转换为浏览器控制命令,并将浏览器控制命令发送给客户端、客户端接收服务端发送的浏览器控制命令,并执行浏览器控制命令实现与网络浏览器的交互,能够充分利用浏览器本身的网络功能实现服务端语音识别引擎的调用,而且语音识别引擎设置在服务端可以随时方便更新语音识别引擎而客户端无需任何改动即可提高语音识别性能,具有用户体验好、使用简单方便的优点。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏奇异点网络有限公司,未经江苏奇异点网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110388772.3/2.html,转载请声明来源钻瓜专利网。