[发明专利]一种对网络广告进行排序的方法有效
申请号: | 200710117607.8 | 申请日: | 2007-06-20 |
公开(公告)号: | CN101097580A | 公开(公告)日: | 2008-01-02 |
发明(设计)人: | 郑峰 | 申请(专利权)人: | 精实万维软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 周国城 |
地址: | 100085北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络广告 进行 排序 方法 | ||
技术领域
本发明涉及互联网中文智能处理技术领域,尤其涉及一种对网络广告进行排序的方法。
背景技术
随着互联网的普及,网络广告出现了强劲的增长势头,选择投放网络广告的客户也是越来越多。那么,在研究某一类行业或者某一类产品的广告的时候,就会面临大量的广告,究竟哪个广告同用户的检索行为最相关,广告排序这个问题就产生了。
例如用户输入“汽车”这个关键词,和汽车相关的广告有成千上万,如何将这些广告呈现给用户,排序就显得比较重要了。本发明就是为了解决上述问题而产生的。
发明内容
(一)要解决的技术问题
有鉴于此,本发明的主要目的在于提供一种对网络广告进行排序的方法,以实现对网络广告的排序。
(二)技术方案
为达到上述目的,本发明提供了一种对网络广告进行排序的方法,该方法包括:
利用广告监控程序从网站获取广告数据,从获取的广告数据中提取出广告主的信息和广告描述信息,该步骤具体包括:
利用广告监控程序蜘蛛(spider)监控各个网站的广告投放情况,
并将原始网页内容作为网页快照保存到网页快照库中;
对网页快照库中保存的广告数据中的文字信息进行分词,得到一组文本向量;
根据所述文本向量的特征,对所述文本向量进行向量加权或向量减权;
采用空间向量模型计算所述进行了向量加权或向量减权后的文本向量的权重;
对计算出来的文本向量的权重进行排序,并根据文本向量所在网页中的上下文信息,从网页中提取出广告主的信息和广告描述信息;
分别对广告主的信息和广告描述信息进行分词得到关键词,建立该关键词的索引;
计算每个建立索引的关键词的相关性,按照计算的相关性从高到低对网络广告进行排序。
上述方案中,所述对网页快照库中保存的广告数据中的文字信息进行分词包括:将现代汉语的普通字序列文本分解为词序列的文本。
上述方案中,所述对文本向量进行向量加权或向量减权的步骤包括:
对出现在标题中的文本向量,将向量权重增至原来的5至10倍;
对出现在网页结构中内容(content)的简介的文本向量,将向量权重增至原来的2至3倍;
对出现在网页内容中版权信息类的文本向量,将向量权重增至原来的3至5倍;
对出现在网页内容中与广告主的信息有关的文本向量,将向量权重增至原来的3至5倍;
对出现的包含在停词表中的文本向量,将向量权重减至原来的1/5至1/10。
上述方案中,所述空间向量模型采用以下公式来表征:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于精实万维软件(北京)有限公司,未经精实万维软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710117607.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可充分润滑变速齿轮的变速箱
- 下一篇:斜管式旋转布料机