[发明专利]一种基于图像识别的试题搜索方法和系统在审
| 申请号: | 201510703528.X | 申请日: | 2015-10-23 |
| 公开(公告)号: | CN105426390A | 公开(公告)日: | 2016-03-23 |
| 发明(设计)人: | 丁新朗 | 申请(专利权)人: | 广东小天才科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 邓猛烈;胡彬 |
| 地址: | 523860 广东省东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 图像 识别 试题 搜索 方法 系统 | ||
技术领域
本发明涉及互联网技术领域,尤其涉及一种基于图像识别的试题搜索方法和系统。
背景技术
随着互联网时代浪潮的到来,教育行业也慢慢在开始被颠覆,在线教育产品也随着这个趋势井喷式地爆发出来,在这些产品之中最为突出的产品类型当属题库类和拍照答疑类,为了解决现在学生们作业多,作业中遇到难题等问题,题库类和拍照答疑类产品必须保证后台题库类大,满足学生们能够搜索到他们想要的题目和答案解析。然而题目中含有较多的图形、公式、字母符号,而且由于目前图像识别的技术受限等原因,在传统搜索方法中,学生们在利用拍照答疑类产品的时候,拍出来的照片经过图像识别后,产生了大量的乱码、错误字符等问题,导致搜索查找出来的题目与学生们拍照上传的题目不符,这样会导致大量使用该产品的用户流失。
发明内容
本发明提供了一种基于图像识别的试题搜索方法和系统,大大提高了搜索的准确度,解决了因图像识别技术缺陷产生的乱码、错误字符,而导致的搜索不到准确的题目推送给用户的问题。
为实现上述设计,本发明采用以下技术方案:
一方面,提供了一种基于图像识别的试题搜索方法,该方法,包括:
识别试题图像的原始信息;
使用所述原始信息对题库的试题进行搜索,匹配出预置数量的试题;删除所述原始信息中不属于汉字、数字、字母的信息和乱码信息,得到文本信息;
分别计算所述预置数量的试题与所述文本信息的最大公共子序列;
根据所述最大公共子序列的长度推送检索结果。
优选地,所述根据最大公共子序列的长度推送检索结果,包括:
推送最大公共子序列长度最长的试题;或
推送最大公共子序列长度最长的试题及试题对应的答案和解析。
优选地,所述根据最大公共子序列的长度推送检索结果,包括:对最大公共子序列按长度从长到短进行排序,推送长度排在前面的预置数目的试题。
优选地,所述根据根据最大公共子序列的长度推送检索结果,包括:
分别计算所述预置数量的试题与所述文本信息的相似度,相似度=最大公共子序列的长度/文本信息的长度;
根据所述相似度推送检索结果。
优选地,所述根据所述相似度推送检索结果,包括:
推送最大相似度的试题;或
推送最大相似度的试题及试题对应的答案和解析。
优选地,所述根据所述相似度推送检索结果,包括:对所述相似度进行从大到小排序,推送相似度排在前面的预置数目的试题。
另一方面,提供了一种基于图像识别的试题搜索系统,该系统,包括:
识别模块,识别试题图像的原始信息;
匹配模块,使用所述原始信息对题库的试题进行搜索,匹配出预置数量的试题;
删除模块,删除所述原始信息中不属于汉字、数字、字母的信息和乱码信息,得到文本信息;
计算模块,分别计算所述预置数量的试题与所述文本信息的最大公共子序列;
推送模块,根据所述最大公共子序列的长度推送检索结果。
优选地,所述推送模块,具体用于,
推送最大公共子序列长度最长的试题;或
推送最大公共子序列长度最长的试题及试题对应的答案和解析;或
对最大公共子序列按长度从长到短进行排序,推送长度排在前面的预置数目的试题;
优选地,所述推送模块还包括:
计算单元,分别计算所述预置数量的试题与所述文本信息的相似度,相似度=最大公共子序列的长度/文本信息的长度;
推送单元,根据所述相似度推送检索结果。
优选地,所述推送单元具体用于:
推送最大相似度的试题;或
推送最大相似度的试题的试题及试题对应的答案和解析;或
对所述相似度进行从大到小排序,推送相似度排在前面的预置数目的试题。
与现有技术相比,本发明的有益效果为:一种基于图像识别的试题搜索方法,包括:识别试题图像的原始信息;使用所述原始信息对题库的试题进行搜索,匹配出预置数量的试题;删除所述原始信息中不属于汉字、数字、字母的信息和乱码信息,得到文本信息;分别计算所述预置数量的试题与所述文本信息的最大公共子序列;根据所述最大公共子序列的长度推送检索结果。本发明根据题库试题中的信息特点,对图像识别出来的原始信息进行加工处理,再利用最大公共子序列的容错性和鲁棒性,减少了搜索匹配时的干扰因素,大大提高了搜索的准确度,能够搜索到准确的题目,并推送给用户。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510703528.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:书签同步方法及装置
- 下一篇:一种网页正文提取比对装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





