[发明专利]页面内容检索方法和系统有效
申请号: | 201210299109.0 | 申请日: | 2012-08-21 |
公开(公告)号: | CN103631784B | 公开(公告)日: | 2018-07-20 |
发明(设计)人: | 付笑冰;刘晓更 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 何平;曾旻辉 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 页面 内容 检索 方法 系统 | ||
一种页面内容检索方法,包括以下步骤:获取输入的关键词;对所述关键词进行分词;对页面内容进行双重分词;根据所述分词后的关键词在所述进行双重分词后的页面内容中进行检索,得到与所述关键词匹配的页面内容。该页面内容检索方法能够提高检索的准确率。此外,还提供了一种页面内容检索系统。
技术领域
本发明涉及信息检索技术,特别是涉及一种页面内容检索方法和系统。
背景技术
随着网络技术的发展,在智能电视上通过Web浏览器浏览页面内容越来越普遍。由于页面内容包含的信息量比较大,用户往往需要对页面内容进行了解和对页面内容的一些关键信息进行定位。
传统的页面内容检索方法中,需首先获取输入的关键词,可以通过全键盘遥控器进行关键词输入,或通过手写输入触摸屏或手写板进行关键词输入,也可以通过语音输入关键词;进一步的,可根据输入的关键词在页面内容中进行检索,得到与关键词匹配的页面内容,并将检索得到的与关键词匹配的页面内容在页面中进行标记。
然而,传统的这种页面内容检索方法中,在根据输入的关键词在页面内容中进行检索的过程中,仅会对关键词进行简单分词后与页面内容进行匹配,往往会漏掉很多检索结果,从而降低了检索结果的准确率。
发明内容
基于此,有必要针对检索结果准确率不高的问题,提供一种更准确的页面内容检索方法。
一种页面内容检索方法,包括以下步骤:
获取语音输入的关键词;
对所述关键词进行分词;
对页面内容进行双重分词;
根据所述分词后的关键词在所述进行双重分词后的页面内容中进行检索,得到与所述分词后的关键词匹配的页面内容。
此外,还提供了一种更准确的页面内容检索系统。
一种页面内容检索系统,包括:
关键词获取模块,用于获取语音输入的关键词;
关键词分词模块,用于对所述关键词进行分词;
页面内容分词模块,用于对页面内容进行双重分词;
检索模块,用于根据所述分词后的关键词在所述进行双重分词后的页面内容中进行检索,得到与所述分词后的关键词匹配的页面内容。
上述页面内容检索方法和系统,通过对关键词进行分词以及对页面内容进行双重分词,对页面内容进行双重分词使得分词后的关键词能够匹配的页面内容更多,减少了可能遗漏的检索结果,因此能够提高检索的准确率。
附图说明
图1为一个实施例中页面内容检索方法的流程示意图;
图2为一个实施例中页面内容检索系统的结构框图;
图3为图2中的关键词获取模块的结构框图;
图4为另一个实施例中页面内容检索系统的结构框图。
具体实施方式
如图1所示,在一个实施例中,一种页面内容检索方法,包括以下步骤:
步骤S102,获取输入的关键词。
在通过Web浏览器浏览页面内容时,可通过输入预设的控制指令打开Web浏览器的搜索功能,对页面中的关键信息进行检索。进一步的,可接收遥控器上的选择键和确认键的点击指令,触发进入搜索模式。另外,搜索模式可包含内容检索模式和链接检索模式,其中,内容检索模式所得到的检索结果为页面中的文字内容,而链接检索模式所得到的检索结果为页面中带有链接的文字内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210299109.0/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法