[发明专利]一种数据源的选择方法及系统无效
申请号: | 201010252121.7 | 申请日: | 2010-08-06 |
公开(公告)号: | CN102135974A | 公开(公告)日: | 2011-07-27 |
发明(设计)人: | 贾江涛;胡汉强;顾翀;孟卫一 | 申请(专利权)人: | 华为软件技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 彭愿洁;李文红 |
地址: | 210012 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据源 选择 方法 系统 | ||
1.一种数据源的选择方法,其特征在于,建立数据源中结构化数据的属性索引项,所述方法包括:
接收查询请求并获取请求中的关键词;
确定所述关键词在属性索引项中的对应属性,其中,所述属性索引项为数据源中结构化数据的属性索引项;
计算所述属性在各所述数据源中对应的属性值与所述关键词的综合相似度;
选择综合相似度满足预置条件的属性值对应的数据源作为满足所述查询请求的数据源。
2.根据权利要求1所述的方法,其特征在于,若所述关键词至少为两个,则在所述确定所述关键词在所述属性索引项中的对应属性之前,还包括:
确定所述关键词间的逻辑关系;
所述计算所述属性在各所述数据源中对应的属性值与所述关键词的综合相似度,具体为:
根据与所述逻辑关系对应的计算方法计算所述属性在各所述数据源中对应的属性值与所述关键词的综合相似度。
3.根据权利要求2所述的方法,其特征在于,所述关键词间的逻辑关系包括:
向量空间查询、AND查询、OR查询、NOT查询、精确匹配、子串匹配、近似查询。
4.根据权利要求1所述的方法,其特征在于,若所述关键词在所述属性索引项中的对应属性为单属性,则所述计算所述属性在各所述数据源中对应的属性值与所述关键词的综合相似度,包括:
计算所述属性值中包含所述关键词的记录数,作为所述综合相似度;或,
计算所述属性值与所述关键词的最相似值的相似度,作为所述综合相似度。
5.根据权利要求1所述的方法,其特征在于,若所述关键词在所述属性索引项中的对应属性为至少两个属性,则所述计算所述属性在各所述数据源中对应的属性值与所述关键词的综合相似度,包括:
确定所述各属性之间的关系;
根据所述各属性之间的关系确定组合类型;
根据所述组合类型对应的计算方法计算所述属性在各所述数据源中对应的属性值与所述关键词的综合相似度。
6.根据权利要求5所述的方法,其特征在于,若所述关键词在所述属性索引项中的对应属性为两个,则所述各属性之间的关系包括:
两个属性相互独立但属于不同的主题;两个属性属于不同的主题但是不相互独立;两个属性互不包含但是属同一主题;其中一个属性是另一属性的一部分。
7.一种数据源的选择系统,其特征在于,包括:
属性创建单元,用于建立数据源中结构化数据的属性索引项;
请求接收单元,用于接收查询请求并获取请求中的关键词;
属性确定单元,用于确定所述关键词在所述属性索引项中的对应属性;
计算单元,用于计算所述属性在各所述数据源中对应的属性值与所述关键词的综合相似度;
选择单元,用于选择综合相似度满足预置条件的属性值对应的数据源作为满足所述查询请求的数据源。
8.根据权利要求7所述的系统,其特征在于,
关系确定单元,用于当所述关键词至少为两个时,在所述属性确定单元确定所述关键词在所述属性索引项中的对应属性之前,确定所述关键词间的逻辑关系;
所述计算单元,具体用于根据与所述逻辑关系对应的计算公式计算所述属性在各所述数据源中对应的属性值与所述关键词的综合相似度。
9.根据权利要求7所述的系统,其特征在于,
所述计算单元,具体用于当所述关键词在所述属性索引项中的对应属性为单属性时,计算所述属性值中包含所述关键词的记录数,作为所述综合相似度;或者,计算所述属性值与所述关键词的最相似值的相似度,作为所述综合相似度。
10.根据权利要求7所述的系统,其特征在于,当所述关键词在所述属性索引项中的对应属性为至少两个属性时,所述计算单元包括:
第一子单元,用于确定所述各属性之间的关系;
第二子单元,用于根据所述各属性之间的关系确定组合类型;
计算子单元,用于根据所述组合类型对应的计算方法计算所述属性在各所述数据源中对应的属性值与所述关键词的综合相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为软件技术有限公司,未经华为软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010252121.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:影音互动系统及其方法
- 下一篇:服务器档案管理的方法