[发明专利]一种用于多义性数据对象预测建模的机器学习方法无效

专利信息
申请号: 200810020629.7 申请日: 2008-02-18
公开(公告)号: CN101226521A 公开(公告)日: 2008-07-23
发明(设计)人: 周志华;张敏灵 申请(专利权)人: 南京大学
主分类号: G06F15/18 分类号: G06F15/18;G06F17/30
代理公司: 南京苏高专利商标事务所 代理人: 柏尚春
地址: 210093江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 多义性 数据 对象 预测 建模 机器 学习方法
【说明书】:

技术领域

发明涉及一种对数据收集装置中涉及的数据对象的预测方法,特别涉及一种对多义性数据对象进行预测建模的机器学习方法。

背景技术

随着计算机技术的不断发展,计算机对真实世界对象的处理能力不断提高。机器学习技术是目前广泛采用的一种预测建模方法,该技术通过对已知概念标记的训练样本进行分析,提取出蕴含在数据中的内在规律,从而构造出相应的预测模型来对训练集之外的样本的概念标记进行预测。目前已有的机器学习技术主要用于处理单义性数据对象,这类数据对象具有单个概念标记,因此其语义是确定且没有歧义的。

然而,在真实世界中,多义性数据对象是随处可见的。例如,一幅场景图像可能同时具有山与湖泊等多个概念标记;一个基因可能同时隶属于新陈代谢、转录以及蛋白质合成等多个功能类;一篇文档可能同时包含了政府与健康等多个主题。因此,对这些广泛存在的多义性数据对象进行预测建模具有十分重要的意义。目前已有的机器学习技术主要针对非歧义的单义性数据对象,难以对多义性数据对象进行有效的处理。

发明内容

发明目的:本发明的目的是针对当前的预测建模方法只能处理单义性数据对象,而无法直接处理多义性数据对象的问题,提出一种能够同时利用多义性数据对象所蕴含的多种语义信息的方法,从而有效地考察各语义信息之间的内在联系,构建出具有高性能的预测模型,提高对数据收集装置中涉及的多义性数据对象的预测精度。

技术方案:为实现上述目的,本发明所述的对多义性数据对象进行预测建模的机器学习方法,包括以下步骤:(1)如果预测模型尚未建立,执行步骤2,否则转入步骤5;(2)获取多义性数据对象的多义信息,每个对象由多个向量进行特征表示且对应于若干概念标记;(3)使用构造性聚类的方法生成分类模型的第一层结构,以反映数据集中数据对象的空间分布信息;(4)基于生成的第一层结构,采用预设的机器学习与数据挖掘中常见的学习方法(例如支持向量机)学习得到第二层的分类结构;(5)利用得到的两层预测模型对多义性数据进行预测并给出预测结果;(6)结束。

有益效果:本发明给出了一种用于多义性对象预测建模的机器学习方法,该方法基于多示例多标记学习技术,可以有效地处理多义性对象。本发明解决了目前大部分建模方法只能处理单义性对象的局限,给出了一种从多义性对象中构造高性能预测模型的方法。

附图说明

图1是数据收集装置的工作流程图。

图2是本发明方法的流程图。

图3是本发明使用的聚类方法的训练流程图。

图4是本发明基于聚类结果训练分类结构的流程图。

具体实施方式

下面将结合附图对最佳实施例进行详细说明。

如图1所示,真实世界的数据对象存放于数据对象收集装置中,假设该装置中存储了N个数据对象,同时用户给出了各数据对象的多义信息。计算机通过预设的对象生成机制得到对象的特征表示,然后采用多示例多标记学习技术对多义性数据对象进行预测建模,如图2所示。该技术采用两层的分类结构,在第一层中利用聚类方法获得数据集的空间分布信息,然后在第二层中基于聚类结果训练生成相应的分类结构。最后利用训练所得的预测模型对新的数据对象进行预测,输出预测结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810020629.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top