[发明专利]一种基于多语义分析和个性化排序的语义检索方法无效
| 申请号: | 201210488572.X | 申请日: | 2012-11-26 |
| 公开(公告)号: | CN103020164A | 公开(公告)日: | 2013-04-03 |
| 发明(设计)人: | 马应龙;张潇澜;于潇 | 申请(专利权)人: | 华北电力大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 陈波 |
| 地址: | 102206 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了信息检索领域的一种基于多语义分析和优化排序的语义检索方法。其技术方案是,首先利用爬虫等技术从互联网上获取网页文档,利用支持向量机进行分类处理,借助多语义分析方法构造词向量库,并将多分类结果写到索引中,形成索引库。然后基于词向量库,将用户输入的搜索关键词形成查询向量,与索引库进行类别匹配查询,得到初始排序结果。最后,根据用户的个人定制信息和历史访问信息对初始排序结果进行优化,并将优化后的结果返回给用户。本发明通过基于多语义分析和优化排序的语义检索方法,形成语义丰富的词向量库和索引库,借助个人定制信息和历史访问信息,使得检索结果能更好地符合用户的检索需求,提高用户的检索满意度。 | ||
| 搜索关键词: | 一种 基于 语义 分析 个性化 排序 检索 方法 | ||
【主权项】:
一种基于多语义分析和个性化排序的语义检索方法,其特征在于,具体包括以下步骤:步骤1:利用爬虫技术从互联网上获取网页文档的一部分作为训练模型进行手工分类,结合多语义分析方法MSA构造词向量库,将网页文档用向量表示,并把训练模型放到支持向量机SVM分类器中对文档向量进行训练,新的网页利用此模型借助SVM进行分类;将所有网页的类别信息作为一个属性写到索引库中;步骤2:基于步骤1形成的词向量库,将用户输入的检索关键词构造各自的词向量,形成最终的查询向量,并将查询向量与索引库进行类别匹配查询,得到初始的网页检索结果;步骤3:根据用户的个人定制信息和历史访问信息对初始检索结果进行优化排序,并将最终检索结果返回给用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学,未经华北电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210488572.X/,转载请声明来源钻瓜专利网。





