[发明专利]一种用于多义性数据对象预测建模的机器学习方法无效
申请号: | 200810020629.7 | 申请日: | 2008-02-18 |
公开(公告)号: | CN101226521A | 公开(公告)日: | 2008-07-23 |
发明(设计)人: | 周志华;张敏灵 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F15/18 | 分类号: | G06F15/18;G06F17/30 |
代理公司: | 南京苏高专利商标事务所 | 代理人: | 柏尚春 |
地址: | 210093江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 多义性 数据 对象 预测 建模 机器 学习方法 | ||
技术领域
本发明涉及一种对数据收集装置中涉及的数据对象的预测方法,特别涉及一种对多义性数据对象进行预测建模的机器学习方法。
背景技术
随着计算机技术的不断发展,计算机对真实世界对象的处理能力不断提高。机器学习技术是目前广泛采用的一种预测建模方法,该技术通过对已知概念标记的训练样本进行分析,提取出蕴含在数据中的内在规律,从而构造出相应的预测模型来对训练集之外的样本的概念标记进行预测。目前已有的机器学习技术主要用于处理单义性数据对象,这类数据对象具有单个概念标记,因此其语义是确定且没有歧义的。
然而,在真实世界中,多义性数据对象是随处可见的。例如,一幅场景图像可能同时具有山与湖泊等多个概念标记;一个基因可能同时隶属于新陈代谢、转录以及蛋白质合成等多个功能类;一篇文档可能同时包含了政府与健康等多个主题。因此,对这些广泛存在的多义性数据对象进行预测建模具有十分重要的意义。目前已有的机器学习技术主要针对非歧义的单义性数据对象,难以对多义性数据对象进行有效的处理。
发明内容
发明目的:本发明的目的是针对当前的预测建模方法只能处理单义性数据对象,而无法直接处理多义性数据对象的问题,提出一种能够同时利用多义性数据对象所蕴含的多种语义信息的方法,从而有效地考察各语义信息之间的内在联系,构建出具有高性能的预测模型,提高对数据收集装置中涉及的多义性数据对象的预测精度。
技术方案:为实现上述目的,本发明所述的对多义性数据对象进行预测建模的机器学习方法,包括以下步骤:(1)如果预测模型尚未建立,执行步骤2,否则转入步骤5;(2)获取多义性数据对象的多义信息,每个对象由多个向量进行特征表示且对应于若干概念标记;(3)使用构造性聚类的方法生成分类模型的第一层结构,以反映数据集中数据对象的空间分布信息;(4)基于生成的第一层结构,采用预设的机器学习与数据挖掘中常见的学习方法(例如支持向量机)学习得到第二层的分类结构;(5)利用得到的两层预测模型对多义性数据进行预测并给出预测结果;(6)结束。
有益效果:本发明给出了一种用于多义性对象预测建模的机器学习方法,该方法基于多示例多标记学习技术,可以有效地处理多义性对象。本发明解决了目前大部分建模方法只能处理单义性对象的局限,给出了一种从多义性对象中构造高性能预测模型的方法。
附图说明
图1是数据收集装置的工作流程图。
图2是本发明方法的流程图。
图3是本发明使用的聚类方法的训练流程图。
图4是本发明基于聚类结果训练分类结构的流程图。
具体实施方式
下面将结合附图对最佳实施例进行详细说明。
如图1所示,真实世界的数据对象存放于数据对象收集装置中,假设该装置中存储了N个数据对象,同时用户给出了各数据对象的多义信息。计算机通过预设的对象生成机制得到对象的特征表示,然后采用多示例多标记学习技术对多义性数据对象进行预测建模,如图2所示。该技术采用两层的分类结构,在第一层中利用聚类方法获得数据集的空间分布信息,然后在第二层中基于聚类结果训练生成相应的分类结构。最后利用训练所得的预测模型对新的数据对象进行预测,输出预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810020629.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:建筑基础桩
- 下一篇:含抗幽门螺杆菌及其毒素特异性免疫球蛋白的牛初乳蛋白
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置