[发明专利]基于多对象实例的对象值对齐方法有效

专利信息
申请号: 201210166855.2 申请日: 2012-05-25
公开(公告)号: CN103425711B 公开(公告)日: 2017-08-25
发明(设计)人: 姜珊珊;郑继川 申请(专利权)人: 株式会社理光
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京市柳沈律师事务所11105 代理人: 黄小临
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 对象 实例 对齐 方法
【权利要求书】:

1.一种对齐对象的异构实例的属性值的方法,包括:

对同一对象的异构实例的属性-值对的属性名执行属性规范化处理获得领域特征;

对属于所获得的领域特征下的属性-值对集合中的所有属性-值对进行排序;以及

比较属性-值对集合中的属性-值对的数量N与预定的最大规模阈值tL和最小规模阈值sL,对所有属性-值对执行自适应地过滤以消除噪声;

对过滤处理后的属性-值对的属性值执行值抽取,从而从中选择所述对象的对象值,

其中对过滤处理后的属性-值对的属性值执行值抽取,从而从中选择所述对象的对象值包括:

按照下面公式计算属性-值对集合中的属性-值对的属性值的平均长度lenavg

lenavg=ΣlenvalueSvalueN]]>

其中值长度lenvalue是属性值字符串中词的个数,Svalue是对应属性值所属属性-值对的总分值;

按照以下公式计算属性-值对集合中的属性-值对的属性值中每个词在该所有属性值中出现的频率tfword来计算每个词的分值Sword

Sword=tfwordΣwordvalueSvalue]]>

其中Svalue是一个词所在属性值所属属性-值对的总分值;

提取属性-值对集合中的属性-值对的属性值的字符串的公共子串,并将所提取的公共字串中长度小于等于lenavg的作为对象值的候选值;以及

对每个候选值的字符串中所有词分值Sword求和来获得每个候选值的分数Scandidate,并将最高分数Scandidate所对应的候选值作为最终的对象值。

2.如权利要求1所述的方法,其中对属于所获得的领域特征下的属性-值对集合中的所有属性-值对进行排序包括:

基于属性-值对集合中的每一属性-值对的对象实例的来源计算该属性-值对的重要性分值Ssource

基于属性-值对集合中的属性-值对之间的相似度计算每一属性-值对的距离分值Sdistance

基于属性-值对集合中的属性-值对中的属性值之间的相似度,计算属性-值对的频率分值Sfrequency

基于属性-值对集合中的属性-值对中的属性值和与所述对象同领域的其它对象的已有的对象值之间的相似度,计算所述属性-值对的证据分值Sevidence;以及

基于上述所计算的分值中的至少两个分值,执行加权求和,以计算所述属性-值对集合中的每个属性-值对的总分值Svalue

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社理光,未经株式会社理光许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210166855.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top