[发明专利]查询维度信息的确定方法及装置有效
申请号: | 201610094709.1 | 申请日: | 2016-02-19 |
公开(公告)号: | CN107102994B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 何鑫 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 查询 维度 信息 确定 方法 装置 | ||
本发明公开了一种查询维度信息的确定方法及装置。其中,该方法包括:获取与查询条件匹配的网页地址信息,其中,查询条件与查询维度对应;获取与网页地址信息对应的网页内容,其中,网页内容至少包括:文本信息、标签信息和文档对象模型中的一个或多个;根据网页内容,生成页面信息集合,其中,页面信息集合至少包括在网页内容中具有并列关系的页面信息;对页面信息集合中的各页面信息进行聚类分析,得到与查询维度对应的查询维度信息。本发明解决了由于查询的层次受主观影响,导致无法对查询维度进行深层次剖析的技术问题。
技术领域
本发明涉及互联网领域,具体而言,涉及一种查询维度信息的确定方法及装置。
背景技术
所谓查询维度,是指用于描述和概括一个查询中所包含的各种维度值的集合,其中,维度值是词或短语。
通常,在一个查询中,包括多个查询维度,每个查询维度从不同侧描述了查询的本身。例如,以“电脑”作为查询条件,它包括的查询维度可以包括:品牌、类型、价格等,其各查询维度的值分别为:品牌(苹果、联想、戴尔等)、类型(台式、笔记本等)、价格(5000元以下、5000-10000元、10000元以上)等。
查询维度为查询本身提供了各方面丰富的信息,一方面查询维度有助于全方面的反映查询的本身,另一方面用户可以很容易的根据某一维度,在该维度上对当前查询的内容进行更深度的查询。查询维度还可以作为例如AB测试等网页优化方法的重要参考。
目前,往往通过建立索引来确定查询目标的相关信息。首先对于查询本身进行检索,然后返回满足查询逻辑的查询列表,并不会对查询的维度进行剖析,查询到的结果往往并不能准确的反映实际情况,并且在查询结果中,存在大量无效数据。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种查询维度信息的确定方法及装置,以至少解决由于查询的层次受主观影响,导致无法对查询维度进行深层次剖析的技术问题。
根据本发明实施例的一个方面,提供了一种查询维度信息的确定方法,包括:获取与查询条件匹配的网页地址信息,其中,查询条件与查询维度对应;获取与网页地址信息对应的网页内容,其中,网页内容至少包括:文本信息、标签信息和文档对象模型中的一个或多个;根据网页内容,生成页面信息集合,其中,页面信息集合至少包括在网页内容中具有并列关系的页面信息;对页面信息集合中的各页面信息进行聚类分析,得到与查询维度对应的查询维度信息。
进一步地,对页面信息集合中的各页面信息进行聚类分析,得到与查询维度对应的查询维度信息,包括:分别将页面信息集合中的页面信息代入聚类模型得到聚类集合,并确定各页面信息与聚类集合之间的最大距离参数;根据最大距离参数小于或等于预先设置的阈值的页面信息,生成与查询维度对应的查询维度信息。
进一步地,分别将页面信息集合中的页面信息代入聚类模型得到聚类集合,并确定各页面信息与聚类集合之间的最大距离参数包括:将页面信息集合中的第一页面信息和第二页面信息代入聚类模型,确定聚类集合;将页面信息集合中的第三页面信息与聚类集合进行比对,确定第三页面信息与聚类集合之间的最大距离参数。
进一步地,在分别将页面信息集合中的页面信息代入聚类模型得到聚类集合,并确定各页面信息与聚类集合之间的最大距离参数中,采用以下方式确定页面信息间的距离参数:其中,l1,l2为具有并列关系的页面信息,d1(l1,l2)为在两个页面信息之间的距离参数,|l1∩l2|为在两个具有并列关系的页面信息中出现相同词语的词语数量;其中,dc(c1,c2)为页面信息集合中的页面信息之间的最大距离参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610094709.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用户诉求分析方法和装置
- 下一篇:一种SQL执行计划的确定方法及装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置