[发明专利]基于内容与关键词相关度给其添加附加信息的方法和系统无效
| 申请号: | 200810113828.2 | 申请日: | 2008-05-30 |
| 公开(公告)号: | CN101388021A | 公开(公告)日: | 2009-03-18 |
| 发明(设计)人: | 裘钢 | 申请(专利权)人: | 索意互动(北京)信息技术有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100089北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 内容 关键词 相关 添加 附加 信息 方法 系统 | ||
技术领域
本发明涉及给关键词添加附加信息,尤其涉及根据语义相关给文档中的关键词提供附加信息。
背景技术
随着因特网被大量应用,出现了大量的很有价值的网页信息,网页的提供方希望当用户浏览网页时可以提供与文档中的关键词相关的附加信息。现有技术中主要有两种给关键词添加附加信息的方法。一种是借助人工,由编辑通过对文档和附加信息的浏览来确定,其存在的问题是效率很低,以及大量使用人工而带来的高成本。另一种是现有附加信息的权利人购买关键词,当某个词在文档中被作为关键词显示时,拥有该关键词的权利人可以将相关的附加信息添加到该关键词,其存在的问题是只能给有限的关键词添加附加信息,没有被购买的词则无法被添加关键词。
本申请正是需要能够解决这两个问题,在不需要人工干预的情况下,根据关键词与权利人所拥有的词条的相关性,而不是根据是否与权利人所拥有的词条匹配,来自动给关键词添加最相关的附加信息。
从而,带来的有益效果是由系统自动实现提高了效率,并且无需直接匹配也可以给关键词添加相关的附加信息,大大扩展了关键词的附加信息的范围,使得更多的关键词上具有了附加信息。
发明内容
本发明的一个目的是提供:一种基于描述内容与关键词的相关度给关键词添加附加信息的方法,其中包括:根据词条向量表来计算附加信息表中每个条目的描述内容的文档向量;计算待处理的关键词的向量与附加信息表中每个条目的描述内容的文档向量的相关度;将相关度最高的附加信息表中的条目确定为待处理关键词的附加信息;当该关键词被操作时,则所述附加信息的渲染内容被渲染。
本发明更进一步的目的是:一种计算机程序产品,存储在计算机可读的介质上,该计算机程序产品具体地包括可读的程序方法,从而触发计算机执行上述的方法。
本发明更进一步的目的是:一种计算机程序,由计算机执行而实现上述方法。
本发明还有一个目的是提供:一种基于描述内容与关键词的相关度给关键词添加附加信息的系统,其中包括:文档向量计算装置,用于根据词条向量表来计算附加信息表中每个条目的描述内容的文档向量;向量比较装置,用于计算待处理的关键词的向量与附加信息表中每个条目的描述内容的文档向量的相关度;附加信息确定装置,用于将相关度最高的附加信息表中的条目确定为待处理关键词的附加信息;附加信息渲染装置,用于当该关键词被操作时,则所述附加信息的渲染内容被渲染。
附图描述
上述内容和其它方面的内容,以及本发明特定优选实施例的特征和优势将通过结合相应附图的详细说明更加清楚。其中:
图1是关于词条的表现方法和组合方式;
图2是词条-文档(term-document)矩阵;
图3是高维(r维)词条空间投影到低维(k维)词条空间的公式;
图4是词条向量表;
图5是描述了词条和文档在二维空间上的投影关系;
图6如何获得查询请求的向量;
图7是根据本发明实施例的附加信息表10;
图8是根据本发明第一个实施例的流程图20;
图9是根据本发明的一个具体实例;
图10是根据本发明第二个实施例的流程图40;
图11是实现本发明实施例的框图50。
所有附图中,同一附图标记理解为同一单元、特征和结构。
优选实施例描述
说明书中定义的内容如具体的结构和单元,是用于辅助全面理解本发明的优选实施例的。因此,根据本领域的普通技术对本申请描述的实施例进行的各种改变和修改都被认为没有脱离本发明的精神范围。同时,为了清楚和简要,省略了对公知的功能和结构的说明。
在现有技术中有大量关于基于语义搜索的技术,本领域技术人员可以利用这些技术很容易的构建词条向量,以及文档向量。其中有代表性的是潜在语义索引模型等技术。下面介绍潜在语义索引的原理,但不代表本发明一定要构建在潜在语义索引之上,本发明可以应用在所有的基于语义的搜索技术上。
潜在语义索引的原理
为了能够更加容易的解释LSI原理,下面通过一个具体例子来描述。设文档由17本书的标题组成。
图1中,有下划线的词表示词条。当然,对于本领域技术人员,存在很多其他选择词条的规则,可以增加或减少词条的数量,也可以改变词条的组合方式等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索意互动(北京)信息技术有限公司,未经索意互动(北京)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810113828.2/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





