[发明专利]查询维度信息的确定方法及装置有效

专利信息
申请号: 201610094709.1 申请日: 2016-02-19
公开(公告)号: CN107102994B 公开(公告)日: 2020-07-31
发明(设计)人: 何鑫 申请(专利权)人: 北京国双科技有限公司
主分类号: G06F16/9535 分类号: G06F16/9535
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 韩建伟;张永明
地址: 100083 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 查询 维度 信息 确定 方法 装置
【说明书】:

发明公开了一种查询维度信息的确定方法及装置。其中,该方法包括:获取与查询条件匹配的网页地址信息,其中,查询条件与查询维度对应;获取与网页地址信息对应的网页内容,其中,网页内容至少包括:文本信息、标签信息和文档对象模型中的一个或多个;根据网页内容,生成页面信息集合,其中,页面信息集合至少包括在网页内容中具有并列关系的页面信息;对页面信息集合中的各页面信息进行聚类分析,得到与查询维度对应的查询维度信息。本发明解决了由于查询的层次受主观影响,导致无法对查询维度进行深层次剖析的技术问题。

技术领域

本发明涉及互联网领域,具体而言,涉及一种查询维度信息的确定方法及装置。

背景技术

所谓查询维度,是指用于描述和概括一个查询中所包含的各种维度值的集合,其中,维度值是词或短语。

通常,在一个查询中,包括多个查询维度,每个查询维度从不同侧描述了查询的本身。例如,以“电脑”作为查询条件,它包括的查询维度可以包括:品牌、类型、价格等,其各查询维度的值分别为:品牌(苹果、联想、戴尔等)、类型(台式、笔记本等)、价格(5000元以下、5000-10000元、10000元以上)等。

查询维度为查询本身提供了各方面丰富的信息,一方面查询维度有助于全方面的反映查询的本身,另一方面用户可以很容易的根据某一维度,在该维度上对当前查询的内容进行更深度的查询。查询维度还可以作为例如AB测试等网页优化方法的重要参考。

目前,往往通过建立索引来确定查询目标的相关信息。首先对于查询本身进行检索,然后返回满足查询逻辑的查询列表,并不会对查询的维度进行剖析,查询到的结果往往并不能准确的反映实际情况,并且在查询结果中,存在大量无效数据。

针对上述的问题,目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种查询维度信息的确定方法及装置,以至少解决由于查询的层次受主观影响,导致无法对查询维度进行深层次剖析的技术问题。

根据本发明实施例的一个方面,提供了一种查询维度信息的确定方法,包括:获取与查询条件匹配的网页地址信息,其中,查询条件与查询维度对应;获取与网页地址信息对应的网页内容,其中,网页内容至少包括:文本信息、标签信息和文档对象模型中的一个或多个;根据网页内容,生成页面信息集合,其中,页面信息集合至少包括在网页内容中具有并列关系的页面信息;对页面信息集合中的各页面信息进行聚类分析,得到与查询维度对应的查询维度信息。

进一步地,对页面信息集合中的各页面信息进行聚类分析,得到与查询维度对应的查询维度信息,包括:分别将页面信息集合中的页面信息代入聚类模型得到聚类集合,并确定各页面信息与聚类集合之间的最大距离参数;根据最大距离参数小于或等于预先设置的阈值的页面信息,生成与查询维度对应的查询维度信息。

进一步地,分别将页面信息集合中的页面信息代入聚类模型得到聚类集合,并确定各页面信息与聚类集合之间的最大距离参数包括:将页面信息集合中的第一页面信息和第二页面信息代入聚类模型,确定聚类集合;将页面信息集合中的第三页面信息与聚类集合进行比对,确定第三页面信息与聚类集合之间的最大距离参数。

进一步地,在分别将页面信息集合中的页面信息代入聚类模型得到聚类集合,并确定各页面信息与聚类集合之间的最大距离参数中,采用以下方式确定页面信息间的距离参数:其中,l1,l2为具有并列关系的页面信息,d1(l1,l2)为在两个页面信息之间的距离参数,|l1∩l2|为在两个具有并列关系的页面信息中出现相同词语的词语数量;其中,dc(c1,c2)为页面信息集合中的页面信息之间的最大距离参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610094709.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top