[发明专利]一种基于文字识别的信息检索方法和系统在审
申请号: | 201710251901.1 | 申请日: | 2017-04-18 |
公开(公告)号: | CN108733687A | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 陈伯妤;姜蓓 | 申请(专利权)人: | 陈伯妤 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;H04L29/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610066 四川省成都市锦*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 拍摄照片 文字内容 文字识别 信息检索 云端 光学字符识别 多媒体信息 检索结果 快速检索 推送 检索 发送 播放 拍摄 转换 应用 | ||
本发明实施方式公开了一种基于文字识别的信息检索方法和系统。方法包括:拍摄文字内容,并发送拍摄照片到云端;云端对所述拍摄照片执行光学字符识别以将所述拍摄照片转换为文字内容,基于所述文字内容检索相关内容,并推送包含所述相关内容的检索结果。应用本发明实施方式以后,可以方便用户快速检索,并播放相关的多媒体信息。
技术领域
本发明涉及搜索领域。更具体地,涉及一种基于文字识别的信息检索方法和系统。
背景技术
自然语言处理(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。狭义的自然语言处理就是自然语言处理过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search或Information Seek)。
目前常用的自然语言处理方法通常包括:普通法、追溯法和分段法等。普通法是利用书目、文摘、索引等检索工具进行文献资料查找的方法。运用这种方法的关键在于熟悉各种检索工具的性质、特点和查找过程,从不同角度查找。普通法又可分为顺检法和倒检法。顺检法是从过去到现在按时间顺序检索,费用多、效率低;倒检法是逆时间顺序从近期向远期检索,它强调近期资料,重视当前的信息,主动性强,效果较好。追溯法是利用已有文献所附的参考文献不断追踪查找的方法,在没有检索工具或检索工具不全时,此法可获得针对性很强。
步入21世纪以来,随着国际互联网(Internet)的迅猛发展和世界经济一体化的加速,网络信息急剧膨胀,国际交流日益频繁,通过网络来检索信息以协助人们快速获取信息,已经成为必然的趋势。
发明内容
本发明实施方式提出一种基于文字识别的信息检索方法和系统,以便捷地向用户反馈信息。
本发明实施方式的技术方案是这样实现的:
一种基于文字识别的信息检索方法,该方法包括:拍摄文字内容,并发送拍摄照片到云端;云端对所述拍摄照片执行光学字符识别以将所述拍摄照片转换为文字内容,基于所述文字内容检索相关内容,并推送包含所述相关内容的检索结果。
在一个实施方式中,所述拍摄文字内容,并发送拍摄照片到云端为:利用可穿戴设备拍摄文字内容,并利用所述可穿戴设备发送拍摄照片到云端;
所述基于文字内容检索相关内容,并推送包含所述相关内容的检索结果包括:云端基于所述文字内容检索相关的音频文件或视频文件,并将所述音频文件或视频文件发送到所述可穿戴设备;
该方法还包括:所述可穿戴设备播放所述音频文件或视频文件。
在一个实施方式中,所述拍摄文字内容,并发送拍摄照片到云端为:利用移动终端拍摄文字内容,并利用所述移动终端发送拍摄照片到云端;
所述基于文字内容检索相关内容,并推送包含所述相关内容的检索结果包括:云端基于所述文字内容检索相关的音频文件或视频文件,并将所述音频文件或视频文件发送到所述移动终端;
该方法还包括:所述移动终端播放所述音频文件或视频文件。
在一个实施方式中,该方法还预先包括:云端将篇章级的词语利用符号切分为字符串,并从切出的字符串中提取出语言线性结构和语块,分别对提取出的语言线性结构以及语块进行倒排,创建语言线性结构子索引以及语块子索引,并将语言线性结构子索引和语块子索引予以合并,以形成整体索引;所述基于所述文字内容检索相关内容,并推送包含所述相关内容的检索结果包括:提取出该文字内容的语言线性结构和语块,并根据所述的整体索引推送与从该文字内容中提取出的语言线性结构和语块相匹配的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陈伯妤,未经陈伯妤许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710251901.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信息处理方法和设备
- 下一篇:数据分析的方法、装置