[发明专利]一种语音播放纸质书籍内容的方法及装置有效
| 申请号: | 201410025898.8 | 申请日: | 2014-01-20 |
| 公开(公告)号: | CN103761892A | 公开(公告)日: | 2014-04-30 |
| 发明(设计)人: | 简文杰;秦伟 | 申请(专利权)人: | 广东小天才科技有限公司 |
| 主分类号: | G09B5/04 | 分类号: | G09B5/04;G06F17/30 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 胡彬 |
| 地址: | 523860 广东省东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 播放 纸质 书籍 内容 方法 装置 | ||
1.一种语音播放纸质书籍内容的方法,其特征在于,包括:
获取图像序列;
判断所述图像序列是否与书籍摆放动作或书籍翻页动作相适配;
如果判断所述图像序列与书籍摆放动作相适配,提取并识别所述图像序列中图像的封面特征信息,从数据库中查找与识别结果相匹配的书名内容;在所述书名内容查找成功的情况下,通过发音模块发出对应于所述书名内容的语音;
如果判断所述图像序列与书籍翻页动作相适配,提取并识别所述图像序列中图像的页面特征信息,从数据库中查找与识别结果相匹配的页面内容;在所述页面内容查找成功的情况下,通过发音模块发出对应于所述页面内容的语音。
2.根据权利要求1所述的语音播放纸质书籍内容的方法,其特征在于,所述获取图像序列,包括:
控制摄像头每隔固定时间捕捉一次图像,得到预设时间长度上或预设捕捉次数下的图像序列。
3.根据权利要求1所述的语音播放纸质书籍内容的方法,其特征在于,所述提取并识别所述图像序列中图像的封面特征信息或页面特征信息,包括:
从所述图像序列中查找拍摄时间距离当前时间最近的图像,并提取所查找到的图像的封面特征信息或页面特征信息;
将所提取的封面特征信息或页面特征信息,与预先存储的封面特征信息或页面特征信息进行相似度计算,根据计算结果得到识别结果。
4.根据权利要求1所述的语音播放纸质书籍内容的方法,其特征在于,所述判断所述图像序列是否与书籍摆放动作或书籍翻页动作相适配,包括:
对所述图像序列中相邻帧的图像进行比对,根据所述比对结果判断所述图像序列是否与书籍摆放动作或书籍翻页动作相适配。
5.根据权利要求1所述的语音播放纸质书籍内容的方法,其特征在于,还包括:
在所述书名内容查找失败的情况下,通过发音模块发出失败提示音;
在所述页面内容查找失败的情况下,对所述图像序列中的图像进行文字识别,得到所述图像所包含的文字信息,通过发音模块发出对应于所述文字信息的语音。
6.一种语音播放纸质书籍内容的装置,其特征在于,包括:
图像获取单元,用于获取图像序列;
动作判断单元,用于判断所述图像序列是否与书籍摆放动作或书籍翻页动作相适配;
书名语音播放单元,用于当所述动作判断单元判断所述图像序列与书籍摆放动作相适配时,提取并识别所述图像序列中图像的封面特征信息,从数据库中查找与识别结果相匹配的书名内容;在所述书名内容查找成功的情况下,通过发音模块发出对应于所述书名内容的语音;
页面语音播放单元,用于当所述动作判断单元判断所述图像序列与书籍翻页动作相适配,提取并识别所述图像序列中图像的页面特征信息,从数据库中查找与识别结果相匹配的页面内容;在所述页面内容查找成功的情况下,通过发音模块发出对应于所述页面内容的语音。
7.根据权利要求6所述的语音播放纸质书籍内容的装置,其特征在于,所述图像获取单元,具体用于:
控制摄像头每隔固定时间捕捉一次图像,得到预设时间长度上或预设捕捉次数下的图像序列。
8.根据权利要求6所述的语音播放纸质书籍内容的装置,其特征在于,
所述书名语音播放单元,具体用于:从所述图像序列中查找拍摄时间距离当前时间最近的图像,并提取所查找到的图像的封面特征信息;将所提取的封面特征信息,与预先存储的封面特征信息进行相似度计算,根据计算结果得到识别结果;或
所述页面语音播放单元,具体用于:从所述图像序列中查找拍摄时间距离当前时间最近的图像,并提取所查找到的图像的页面特征信息;将所提取的页面特征信息,与预先存储的所有的页面特征信息进行相似度计算,根据计算结果得到识别结果。
9.根据权利要求6所述的语音播放纸质书籍内容的装置,其特征在于,所述动作判断单元,具体用于:
对所述图像序列中相邻帧的图像进行比对,根据所述比对结果判断所述图像序列是否与书籍摆放动作或书籍翻页动作相适配。
10.根据权利要求6所述的语音播放纸质书籍内容的装置,其特征在于,还包括:
第一失败处理单元,用于在所述书名内容查找失败的情况下,通过发音模块发出失败提示音;
第二失败处理单元,用于在所述页面内容查找失败的情况下,对所述图像序列中的图像进行文字识别,得到所述图像所包含的文字信息,通过发音模块发出对应于所述文字信息的语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410025898.8/1.html,转载请声明来源钻瓜专利网。





