[发明专利]一种页面特征表示方法、装置及设备有效
申请号: | 201310749816.X | 申请日: | 2013-12-30 |
公开(公告)号: | CN103678711B | 公开(公告)日: | 2017-06-27 |
发明(设计)人: | 刘存伟;刘刚毅;吴国军 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同达信恒知识产权代理有限公司11291 | 代理人: | 黄志华 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 页面 特征 表示 方法 装置 设备 | ||
技术领域
本发明涉及移动终端互联网领域,尤其涉及一种页面特征表示方法、装置及设备。
背景技术
随着信息技术的不断发展,网络上的资源越来越丰富,用户对网络资源的需求也越来越大。目前,搜索引擎是进行网络资源搜索的主要工具。如何根据用户输入的搜索条件,从丰富的信息资源中搜索到真正符合用户需求的资源,对搜索引擎来说无疑是个挑战。搜索引擎目前仍然存在很大的局限性,存在的问题主要包括:信息丢失、返回无用信息、信息无关等。
现有技术中提出了“个性化搜索引擎”的概念,为用户提供个性化服务。通过收集和分析用户信息来学习用户的兴趣和行为,从而根据用户的兴趣和行为主动向用户推荐符合用户需求的网络资源,提高用户的访问效率。而实现个性化服务的关键问题包括:分析用户浏览信息、描述用户兴趣、以及跟踪用户兴趣的变化。现有技术中,一般通过用户兴趣的建模和挖掘来解决上述个性化服务的关键问题。
图1为现有技术中用户兴趣的建模和挖掘过程示意图,如图1所示,用户兴趣的建模和挖掘的过程,具体过程如下:
图1中的Web页面表征静态的Web页面,针对用户浏览的web页面进行页面特征表示,并根据得到的web页面的页面特征表示,采用分类和聚类方式,对文本数据集合进行聚类分析,得到web页面从属的一个或多个类别(例如,体育、娱乐等),并将该类别作为用户的兴趣;
图1中的浏览信息表征用户在浏览web页面过程中的动作,针对用户在浏 览的web页面过程中的动作、事件(例如:前进、后退、保存、书签等浏览行为)等用户事务,确定用户对该web页面的兴趣度;
针对用户访问过的多个web页面中的每个web页面,将确定的该web页面的聚类/分类结果作为用户的初始兴趣,再与确定的用户对该web页面的兴趣度相结合,通过特定的计算模式确定出用户的兴趣度序列。根据用户在预设时间段内的兴趣度序列,应用特定算法确定用户兴趣度序列迁移模型。
因此,可以根据用户兴趣度序列迁移模型,主动向用户推荐符合用户兴趣和需求的网络资源,提高用户的访问效率。上述用户兴趣的建模和挖掘的过程中,每个步骤对用户兴趣的建模和挖掘的准确性都起着非常重要的作用,其中,对web页面进行页面特征表示的精准度,是上述各步骤中的关键环节。
进一步地,针对用户浏览的web页面进行页面特征表示,通常包括页面去噪和元素表示。页面去噪主要用于过滤web页面中的噪声,例如:导航栏、链接等与用户浏览的信息无关的信息,最终保留web页面中的用户浏览的文本信息。
但是,现有技术中的页面特征表示存在如下问题:在页面去噪的过程中,由于web页面本身的构成的特殊性,例如:web页面中除了用户关心的代表性强的文本信息之外,还可以包含图片、导航条、超链接等内容,使得从web页面中抽取代表性强的文本信息比较困难。并且,即使抽取出了web页面中代表性强的文本信息,也并不能说明这些文本信息就是浏览该web页面的用户所关注、并感兴趣的文本信息,因为用户可能只是浏览了其中一句话或一段话而已。
进一步地,在根据得到的页面特征表示,对web页面进行特征表示的过程中,用户可能只是浏览了web页面中代表性强的文本信息中的一句话或者一段话,而将web页面中代表性强的整个文本信息都进行特征表示,并用于后续步骤中对用户兴趣的建模和挖掘,是不准确的。
发明内容
本发明实施例提供了一种页面特征表示方法、装置及设备,用以解决现有技术中,由于页面特征表示不准确,导致对用户兴趣的建模和挖掘不准确的问题。
第一方面,提供一种页面特征表示方法,包括:
确定页面中包含的一个或多个元素,以及各个元素在所述页面中所处的区域;并
检测用户在浏览所述页面时眼球的转动轨迹,并确定所述转动轨迹在所述页面上映射的浏览轨迹;
根据所述各个元素所处的区域,以及各个区域与所述浏览轨迹之间的位置关系,确定用户对所述各个元素的关注度;
基于所述各个元素以及所述各个元素的关注度对所述页面进行页面特征表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310749816.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:实体知识库的构建方法和装置
- 下一篇:一种基于用户行为的信息推荐方法