[发明专利]基于增量式凸局部非负矩阵分解的数据处理方法有效
| 申请号: | 201510968381.7 | 申请日: | 2015-12-21 |
| 公开(公告)号: | CN105389291B | 公开(公告)日: | 2018-08-21 |
| 发明(设计)人: | 同鸣;李海龙;席圣男;陶士昌 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06F17/16 | 分类号: | G06F17/16 |
| 代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;韦全生 |
| 地址: | 710071*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 增量 局部 矩阵 分解 数据处理 方法 | ||
本发明公开了一种基于增量式凸局部非负矩阵分解的数据处理方法,主要解决基本非负矩阵分解无法对含负值数据进行处理及在处理增量数据时,计算消耗过大和占用存储空间较多的问题。其实现步骤是:1.将初始数据表达为初始矩阵;2.利用凸局部非负矩阵分解方法对初始矩阵分解,得到初始基矩阵和初始系数矩阵;3.接收新数据,并构造新数据矩阵;4.结合初始基矩阵和初始系数矩阵,利用增量式凸局部非负矩阵分解方法,对新数据矩阵进行分解,实现对增量数据的处理。本发明可以处理含负值的数据,拓展了基本非负矩阵分解的应用领域,分解结果物理意义明确,具有良好的正交性、稀疏性和高效性,可用于图像、视频和网络访问记录的增量数据处理。
技术领域
本发明属于数据处理技术领域,涉及增量数据的处理方法,可用于图像、视频和网络访问记录的数据处理。
背景技术
随着物联网、传感器和计算机等相关技术的飞速发展,数据以爆炸式的速度动态增长,如监控视频、网络访问等,且数据维数越来越高,人们不得不面临分析和处理各种大规模海量高维数据的任务。如何从浩如烟海的数据海洋里迅速且准确地获取有用或最需要的信息,成为迫在眉睫的问题。数据降维是解决“维数灾难”的一种有效方法。传统的降维方法包括:主成分分析、独立成分分析、Fisher判别分析等,该类方法允许结果为负,但负值元素在处理图像、视频等高维数据时,缺乏直观的物理意义,而非负矩阵分解(Non-negativeMatrix Factorization,NMF)成功解决了这个难题。
Lee D D,Seung H S.等人于1999年在著名的Nature上提出了一种非负矩阵分解NMF方法[Learning the parts of objects with nonnegative matrixfactorization.Nature,401(6755):788-791],该方法能够大大降低数据特征的维数,挖掘数据潜在的内部结构特征,大幅度节省存储空间和计算资源,具有明确的物理意义,同时具备局部感知全局的智能特性。
而基本非负矩阵分解NMF方法在处理增量数据时,需要对历史数据和新增数据全部分解处理,消耗了大量的计算资源和存储资源,大大降低了方法的效率,同时,输入矩阵的严格非负性要求,极大地限制了该类方法的应用领域。
发明内容
本发明针对上述已有技术的不足,提出了基于增量式凸局部非负矩阵分解的数据处理方法,以解决基本非负矩阵分解方法不能处理负值数据的缺陷,同时解决常规方法在处理增量式数据时效率不高、严重消耗计算资源和存储资源的问题。
本发明的技术关键是:首先,对基本非负矩阵分解NMF方法进行了核拓展,构成凸非负矩阵分解CNMF方法的目标函数;其次,对此目标函数引入正交约束和稀疏约束,构成凸局部非负矩阵分解CLNMF方法的目标函数;最后,对该方法进行增量处理,构成本发明的增量式凸局部非负矩阵分解ICLNMF方法,其实现方案包括如下:
(1)获取固定大小p×n的数据,作为初始数据,并表示成初始矩阵V0,其中,p表示单个样本的维数,n表示样本个数;
(2)对基本非负矩阵分解NMF目标函数进行核拓展,构成凸非负矩阵分解CNMF的目标函数:
其中,W0和H0分别是对初始矩阵V0进行分解期望得到的基矩阵和系数矩阵,表示矩阵的F范数的平方;
(3)对步骤(2)中目标函数的基矩阵W0施加正交约束,系数矩阵H0施加稀疏约束,构成凸局部非负矩阵分解CLNMF的目标函数FCLNMF(V0||V0W0H0):
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510968381.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文本相似度处理方法
- 下一篇:一种1553总线序列表中插入周期命令的方法





