[发明专利]一种基于文字识别的信息检索方法和系统在审
申请号: | 201710251901.1 | 申请日: | 2017-04-18 |
公开(公告)号: | CN108733687A | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 陈伯妤;姜蓓 | 申请(专利权)人: | 陈伯妤 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;H04L29/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610066 四川省成都市锦*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 拍摄照片 文字内容 文字识别 信息检索 云端 光学字符识别 多媒体信息 检索结果 快速检索 推送 检索 发送 播放 拍摄 转换 应用 | ||
1.一种基于文字识别的信息检索方法,其特征在于,该方法包括:
拍摄文字内容,并发送拍摄照片到云端;
云端对所述拍摄照片执行光学字符识别以将所述拍摄照片转换为文字内容,基于所述文字内容检索相关内容,并推送包含所述相关内容的检索结果。
2.根据权利要求1所述的基于文字识别的信息检索方法,其特征在于,所述拍摄文字内容,并发送拍摄照片到云端为:利用可穿戴设备拍摄文字内容,并利用所述可穿戴设备发送拍摄照片到云端;
所述基于文字内容检索相关内容,并推送包含所述相关内容的检索结果包括:云端基于所述文字内容检索相关的音频文件或视频文件,并将所述音频文件或视频文件发送到所述可穿戴设备;
该方法还包括:
所述可穿戴设备播放所述音频文件或视频文件。
3.根据权利要求1所述的基于文字识别的信息检索方法,其特征在于,所述拍摄文字内容,并发送拍摄照片到云端为:利用移动终端拍摄文字内容,并利用所述移动终端发送拍摄照片到云端;
所述基于文字内容检索相关内容,并推送包含所述相关内容的检索结果包括:云端基于所述文字内容检索相关的音频文件或视频文件,并将所述音频文件或视频文件发送到所述移动终端;
该方法还包括:
所述移动终端播放所述音频文件或视频文件。
4.根据权利要求1所述的基于文字识别的信息检索方法,其特征在于,该方法还预先包括:
云端将篇章级的词语利用符号切分为字符串,并从切出的字符串中提取出语言线性结构和语块,分别对提取出的语言线性结构以及语块进行倒排,创建语言线性结构子索引以及语块子索引,并将语言线性结构子索引和语块子索引予以合并,以形成整体索引;
所述基于所述文字内容检索相关内容,并推送包含所述相关内容的检索结果包括:
提取出该文字内容的语言线性结构和语块,并根据所述的整体索引推送与从该文字内容中提取出的语言线性结构和语块相匹配的信息。
5.根据权利要求4所述的基于文字识别的信息检索方法,其特征在于,所述将篇章级的词语利用符号切分为字符串包括:
使用基于篇章的局部子串统计表作为临时辅助词典,用基于多路径规划的切分路径树作为切分模型,将所述篇章级的词语字符编码统一转换为UTF-8编码格式;对转换为UTF-8编码格式后的篇章级的词语利用符号切分为字符串;
根据所述的整体索引推送与从该文字内容中提取出的语言线性结构和语块相匹配的信息包括:依据语言线性结构和语块的匹配程度由高到低的顺序,推送从该文字内容中提取出的语言线性结构和语块相匹配的信息,其中当从该文字内容中提取出的语言线性结构与整体索引中的语言线性结构的重复字数越多时,所述匹配程度越高。
6.根据权利要求5所述的基于文字识别的信息检索方法,其特征在于,
该方法还包括:预先设置语言线性结构重复权重和语块重复权重;
基于所述语言线性结构重复权重计算从该文字内容中提取出的语言线性结构与整体索引中的语言线性结构的第一重叠指数,并基于语块重复权重计算从该文字内容中提取出的语块与整体索引中的语块的第二重叠指数;当所述第一重叠指数与第二重叠指数的和越高,所述匹配程度越高。
7.一种基于文字识别的信息检索系统,其特征在于,该系统包括:
拍摄装置,用于拍摄文字内容,并发送拍摄照片到云端;
检索系统,位于云端,用于对所述拍摄照片执行光学字符识别以将所述拍摄照片转换为文字内容,基于所述文字内容检索相关内容,并向拍摄装置推送包含所述相关内容的检索结果。
8.根据权利要求7所述的基于文字识别的信息检索系统,其特征在于,
所述拍摄装置为可穿戴设备;
检索系统,用于基于所述文字内容检索相关的音频文件或视频文件,并将所述音频文件或视频文件发送到所述可穿戴设备;
所述可穿戴设备,还用于播放所述音频文件或视频文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陈伯妤,未经陈伯妤许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710251901.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息处理方法和设备
- 下一篇:数据分析的方法、装置