[发明专利]网页的搜索词的获取方法和电子设备在审
申请号: | 201810402794.2 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108628992A | 公开(公告)日: | 2018-10-09 |
发明(设计)人: | 唐新楼 | 申请(专利权)人: | 上海与德通讯技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海晨皓知识产权代理事务所(普通合伙) 31260 | 代理人: | 胡丽莉 |
地址: | 201506 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索词 网页 电子设备 查询界面 目标网页 数据处理技术 快速搜索 词库 预设 搜索 | ||
1.一种网页的搜索词的获取方法,其特征在于,包括:
提供搜索词查询界面;
当从所述搜索词查询界面接收到目标网页的当前搜索词时,判断预设的词库中是否存在一组搜索词,且这组搜索词中包括所述当前搜索词;
若存在,则获取所述这组搜索词中的各搜索词,以供用户根据所述各搜索词搜索所述目标网页。
2.根据权利要求1所述的网页的搜索词的获取方法,其特征在于,所述词库的建立方式,包括:
接收用户输入的目标搜索词,并根据所述目标搜索词提供搜索结果页面;
当检测到所述搜索结果页面中的至少一网页被打开时,获取所述网页的特征词汇,作为一级搜索词;其中,所述网页对应的一组搜索词包括所述目标搜索词和所述一级搜索词,且所述词库包括至少一组搜索词。
3.根据权利要求2所述的用于搜索网页的搜索词的获取方法,其特征在于,所述一级搜索词的数量为N个,在所述获取所述网页的特征词汇,作为一级搜索词之后,还包括:
从N个所述一级搜索词中获取出现频率较高的前M个所述一级搜索词,作为M个二级搜索词;其中,所述一组搜索词还包括各所述二级搜索词;N、M均为大于零的整数且N大于M。
4.根据权利要求3所述的用于搜索网页的搜索词的获取方法,其特征在于,当所述M大于1时,在所述从N个所述一级搜索词中获取出现频率较高的前M个所述一级搜索词,作为M个二级搜索词之后,还包括:
对M个所述二级搜索词进行词义分析,选择与所述目标搜索词的词义较接近的前K个所述二级搜索词,作为K个三级搜索词;其中,所述一组搜索词还包括K个所述三级搜索词;K为大于零的整数且K小于M。
5.根据权利要求2所述的用于搜索网页的搜索词的获取方法,其特征在于,所述一级搜索词的数量为多个,在所述获取所述网页的特征词汇,作为一级搜索词之后,还包括:
从多个所述一级搜索词中获取出现频率等于或大于预设频率的所述一级搜索词,作为所述二级搜索词;其中,所述一组搜索词还包括各所述二级搜索词。
6.根据权利要求5所述的用于搜索网页的搜索词的获取方法,其特征在于,当所述二级搜索词的数量为多个时,在所述从多个所述一级搜索词中获取出现频率等于或者大于预设频率的所述一级搜索词,作为所述二级搜索词之后,还包括:
对各所述二级搜索词进行词义分析,选择与所述目标搜索词的词义最接近的所述二级搜索词,作为三级搜索词;其中,所述一组搜索词还包括所述三级搜索词。
7.根据权利要求2至6中任一项所述的网页的搜索词的获取方法,其特征在于,以所述一组搜索词中的所述目标搜索词为中心主题,采用思维导图或者树图的方式存储所述一组搜索词。
8.根据权利要求2所述的网页的搜索词的获取方法,其特征在于,所述网页的特征词汇包括以下的其中一种或多种组合:所述网页的标题、所述网页的作者、所述网页的日期、所述网页的网页描述、所述网页的关键词。
9.根据权利要求1所述的网页的搜索词的获取方法,其特征在于,所述网页的搜索词的获取方法应用于电子设备,所述词库存储在云端数据库中,所述电子设备与所述云端数据库通讯连接。
10.一种电子设备,其特征在于,包括:
至少一个处理器;
与所述至少一个处理器通信连接的词库存储模块;以及,
与所述至少一个处理器通信连接的指令存储模块;其中,
所述指令存储模块存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至9中任一所述的网页的搜索词的获取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海与德通讯技术有限公司,未经上海与德通讯技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810402794.2/1.html,转载请声明来源钻瓜专利网。