[发明专利]语音查询方法和装置有效
申请号: | 201710035818.0 | 申请日: | 2017-01-17 |
公开(公告)号: | CN106897372B | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 孟宾宾 | 申请(专利权)人: | 腾讯科技(上海)有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/538;G10L15/22 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 董文倩;褚敏 |
地址: | 201200 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 查询 方法 装置 | ||
本发明公开了一种语音查询方法和装置。其中,该方法包括:接收语音查询信息,其中,语音查询信息用于指示查询关键词;获取待识别图像的特征信息,其中,特征信息用于表示待识别图像中的对象;从特征信息中查询与查询关键词匹配的目标特征信息;在查询到目标特征信息的情况下,播放语音查询结果,其中,语音查询结果用于指示图像中的目标对象,目标对象由目标特征信息表示。本发明解决了由于无法识别图像特征信息造成的语音查询系统不智能的技术问题。
技术领域
本发明涉及智能识别领域,具体而言,涉及一种语音查询方法和装置。
背景技术
随着技术进步,智能技术的发展倾向于满足越来越多的人们的生活工作需求,例如,一些语音问答系统能够满足盲人的一些信息查询需求,目前市场上有的盲人问答系统都只是解决知识层面的问题,一般通过语音交互,先通过Speech2Text把问题转化成文本,然后进行知识库搜索,返回对应问题的答案,最后在通过Text2Speech的过程,把答案告诉提问者。
现有一些产品的最大问题在于仅仅解决的是文本语义方面的问题,只能识别文字或者语言,但是针对盲人群体面临的环境认知的问题,目前还没有一款产品能够解决。世界是丰富多彩的,盲人也需要了解这个世界的样子。再比如,现在盲人上网,用的大都是“读屏”软件,而读屏软件只能读取文字信息,穿插在文字中的图片信息,读屏软件是无法读取的。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种语音查询方法和装置,以至少解决由于无法识别图像特征信息造成的语音查询系统不智能的技术问题。
根据本发明实施例的一个方面,提供了一种语音查询方法,包括:接收语音查询信息,其中,语音查询信息用于指示查询关键词;获取待识别图像的特征信息,其中,特征信息用于表示待识别图像中的对象;从特征信息中查询与查询关键词匹配的目标特征信息;在查询到目标特征信息的情况下,播放语音查询结果,其中,语音查询结果用于指示图像中的目标对象,目标对象由目标特征信息表示。
根据本发明实施例的另一方面,还提供了一种语音查询装置,包括:接收单元,用于接收语音查询信息,其中,语音查询信息用于指示查询关键词;获取单元,用于获取待识别图像的特征信息,其中,特征信息用于表示待识别图像中的对象;查询单元,用于从特征信息中查询与查询关键词匹配的目标特征信息;播放单元,用于在查询到目标特征信息的情况下,播放语音查询结果,其中,语音查询结果用于指示图像中的目标对象,目标对象由目标特征信息表示。
在本发明实施例中,通过接收语音查询信息和获取待识别图像的特征信息,然后从特征信息中查询与查询关键词匹配的目标特征信息,在查询到目标特征信息的情况下,播放语音查询结果,达到了识别图像中的特征信息后语音输出查询结果的目的,从而实现了提高语音查询系统的智能程度的技术效果,进而解决了由于无法识别图像特征信息造成的语音查询系统不智能的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的语音查询方法的硬件环境的示意图;
图2是根据本发明实施例的一种可选的语音查询方法的流程图;
图3是根据本发明实施例的语音查询系统的原理示意图;
图4是根据本发明实施例的一种可选的语音查询装置的示意图;
图5是根据本发明实施例的一种可选的语音查询装置的示意图;以及
图6是根据本发明实施例的一种终端的结构框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(上海)有限公司,未经腾讯科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710035818.0/2.html,转载请声明来源钻瓜专利网。