[发明专利]一种内容检索方法及系统有效
申请号: | 201811335789.0 | 申请日: | 2018-11-11 |
公开(公告)号: | CN109284362B | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 魏誉荧 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/30 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 523851 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 内容 检索 方法 系统 | ||
本发明属于数据处理技术领域,公开了一种内容检索方法及系统,其方法包括:建立包括多个正则表达式的正则表达式库;获取正则表达式中的关键字对应的语义槽;获取用户输入的语音信息;将语音信息与所述正则表达式库中的正则表达式进行匹配,找到匹配后的正则表达式作为目标正则表达式;根据所述目标正则表达式及目标正则表达式中的关键字对应的语义槽,对存储的内容进行检索,得到检索结果。本发明根据目标正则表达式及目标正则表达式中的关键字对应的语义槽,对存储的内容进行检索,当目标正则表达式检索不到时,可根据关键字对应的语义槽中的词语进行检索,以确保能检索到所需的内容,防止出现检索失败的情况,提高检索的成功率。
技术领域
本发明属于数据处理技术领域,特别涉及一种内容检索方法及系统。
背景技术
随着智能终端及网络技术的迅速发展,人们越来越习惯地使用智能终端完成各种需求,如在学习的过程中,碰到不理解的知识点、不会解的习题时,在智能学习设备中语音输入相关知识点,检索对应的答案和知识讲解,以便对用户进行学习辅导。
目前,在人机交互场景中,通过语音对内容进行检索的方法,一般是通过关键字语查找来进行检索,但是如果用户无法精确说明需要检索的关键字,则会造成检索失败的情况,因此,通过关键字检索的方法具备很大的局限性,不利于用户的使用。
发明内容
本发明的目的是提供一种内容检索方法及系统,通过正则表达式对内容进行检索,以提高检索的成功率。
本发明提供的技术方案如下:
一方面,提供一种内容检索方法,包括:
建立包括多个正则表达式的正则表达式库;
获取所述正则表达式中的关键字对应的语义槽;
获取用户输入的语音信息;
将所述语音信息与所述正则表达式库中的正则表达式进行匹配,找到匹配后的正则表达式作为目标正则表达式;
根据所述目标正则表达式及所述目标正则表达式中的关键字对应的语义槽,对存储的内容进行检索,得到检索结果。
优选地,所述建立包括多个正则表达式的正则表达式库具体包括:
获取大量语料信息;
对每个所述语料信息进行分词并提取语料信息中的关键字;
根据每个所述语料信息中的关键字和语法结构,生成每个所述语料信息对应的正则表达式;
根据每个所述语料信息对应的正则表达式,建立包括多个正则表达式的正则表达式库。
优选地,所述将所述语音信息与所述正则表达式库中的正则表达式进行匹配,找到匹配后的正则表达式作为目标正则表达式具体包括:
将所述语音信息与所述正则表达式库中的正则表达式的每个匹配项进行匹配;
若所述语音信息与所述正则表达式库中的某一正则表达式的每个匹配项都匹配,且与所述匹配项相匹配的匹配信息在所述语音信息中的排列顺序与所述匹配项在所述某一正则表达式中的排列顺序相同,则所述某一正则表达式为目标正则表达式。
优选地,所述根据所述目标正则表达式及所述目标正则表达式中的关键字对应的语义槽,对存储的内容进行检索,得到检索结果具体包括:
利用所述目标正则表达式中的关键字对应的语义槽中的字词替换所述目标正则表达式中对应的关键字;
根据所述目标正则表达式和替换关键字后的目标正则表达式,对存储的内容进行检索,得到检索结果。
优选地,所述根据所述目标正则表达式和替换关键字后的目标正则表达式,对存储的内容进行检索,得到检索结果具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811335789.0/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法