[实用新型]一种基于OCR和TTS的视障者阅读装置有效
申请号: | 202023117638.3 | 申请日: | 2020-12-22 |
公开(公告)号: | CN214202843U | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 张德钱;李宇航;廖斌强;丁凡;杨森泉 | 申请(专利权)人: | 韶关学院 |
主分类号: | G09B21/00 | 分类号: | G09B21/00 |
代理公司: | 广州骏思知识产权代理有限公司 44425 | 代理人: | 程毅 |
地址: | 512005 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ocr tts 视障者 阅读 装置 | ||
1.一种基于OCR和TTS的视障者阅读装置,其特征在于,包括:
微电脑单元、语音识别单元、摄像头以及语音播放器;
所述微电脑单元分别与所述语音播放器、所述摄像头以及所述语音识别单元电连接;
所述语音识别单元用于识别语音指令,所述语音指令包括阅读指令,所述语音识别单元还用于将所述阅读指令发送给所述微电脑单元;
所述微电脑单元用于根据所述阅读指令,驱动所述摄像头对待阅读文字进行抓拍,得到文字图像;
所述微电脑单元还用于对所述文字图像进行文字识别,得到文本数据,并根据所述文本数据得到语音流,以及将所述语音流发送给所述语音播放器进行播放;其中,所述语音流记载有所述待阅读文字的内容。
2.根据权利要求1所述的基于OCR和TTS的视障者阅读装置,其特征在于:还包括服务器,所述微电脑单元与所述服务器信号连接;
所述微电脑单元还用于将所述文本数据发送给所述服务器;
所述服务器用于通过百度语音合成API根据所述文本数据得到所述语音流,并将所述语音流发送给所述微电脑单元。
3.根据权利要求2所述的基于OCR和TTS的视障者阅读装置,其特征在于:所述微电脑单元包括OCR模块,所述OCR模块用于通过谷歌的开源OCR算法对所述文字图像进行文字识别。
4.根据权利要求2所述的基于OCR和TTS的视障者阅读装置,其特征在于:所述语音识别单元包括ASR管理模块以及ASR模块;
所述ASR管理模块用于对语音指令的声纹信息进行学习并记录;
所述ASR模块用于根据所述记录的声纹信息对语音指令进行识别并将识别结果发送给所述ASR管理模块;
所述ASR管理模块还用于将所述识别结果发送给所述微电脑单元。
5.根据权利要求4所述的基于OCR和TTS的视障者阅读装置,其特征在于:还包括手势识别模块,所述手势识别模块与所述微电脑单元电连接;
所述手势识别模块用于通过对预设的手势进行识别,并产生阅读指令,以及将所述阅读指令发送给所述微电脑单元。
6.根据权利要求5所述的基于OCR和TTS的视障者阅读装置,其特征在于:
所述微电脑单元包括还用于对所述文字图像进行边缘检测算法处理或者二值化算法处理,使所述文字图像成像内容更加清晰。
7.根据权利要求5所述的基于OCR和TTS的视障者阅读装置,其特征在于:所述语音识别单元还包括麦克风,所述麦克风设有隔音棉,所述隔音棉仅在一个方向预留一个收音孔。
8.根据权利要求5所述的基于OCR和TTS的视障者阅读装置,其特征在于:还包括LED灯,所述LED灯通过继电器与所述语音识别单元电连接;
所述语音识别单元还用于根据所述语音指令的识别结果驱动所述LED灯打开或关闭。
9.根据权利要求8所述的基于OCR和TTS的视障者阅读装置,其特征在于:还包括机箱,所述机箱主体材料为铝型材,所述机箱的外壳为轻质雪佛板;
所述LED灯为一灯带,环绕设置在所述机箱中;
所述机箱设有感应口、阅读区和密封区域;
所述感应口用于给用户进行手势感应操作;
所述密封区域用于收纳所述微电脑单元、语音播放器、以及语音识别单元;
所述阅读区用于放置待阅读的文件。
10.根据权利要求5至9任一权利要求所述的基于OCR和TTS的视障者阅读装置,其特征在于:所述微电脑单元为树莓派3B;所述ASR管理模块为STC89C52单片机;所述ASR模块为LD3320语音识别芯片;所述手势识别模块为E18-D80NK红外感应器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韶关学院,未经韶关学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202023117638.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种给排水工程建筑防渗结构
- 下一篇:吸泵自动压装设备