[发明专利]一种基于忆阻器阵列的球形数据分类装置及其操作方法在审
申请号: | 202110037230.5 | 申请日: | 2021-01-12 |
公开(公告)号: | CN112819036A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 李祎;周厚继;缪向水 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G11C8/14 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 忆阻器 阵列 球形 数据 分类 装置 及其 操作方法 | ||
本发明公开了一种基于忆阻器阵列的球形数据分类装置及其操作方法,属于数据挖掘与数据分析领域,包括分类器和辅助控制模块;其中,分类器包括输入控制模块、忆阻器阵列、字线控制模块、比较模块和输出缓存模块;本发明利用球形数据的原生优势,在数据模长为“1”时,将数据之间的距离等价转化为向量之间的点乘结果,并将数据距离计算的过程映射到忆阻器阵列中,利用忆阻器阵列高效的乘加操作,实现并行的数据距离计算的过程,极大的简化了距离计算的复杂性,计算复杂度低。且与传统的非单位化数据的聚类过程相比,可以在硬件电路上实现数据之间距离的完整计算与表达,能够更加精准的刻画数据之间的距离特征,保证聚类结果的精度。
技术领域
本发明属于数据挖掘与数据分析领域,更具体地,涉及一种基于忆阻器阵列的球形数据分类装置及其操作方法。
背景技术
数据聚类以其快速、有效的特点在数据挖掘、数据分析等领域具有十分重要的作用。以K-means为代表的聚类算法通常是利用增大内间间距减小类内间距的原则来实现聚类过程,数据之间的距离度量方法包含余弦距离、欧式距离等。伴随着互联网技术的普及,数据的维度急剧增大,利用传统冯诺依曼构架计算数据之间的距离所带来的巨大的时间和功耗的消耗已经成为限制数据聚类过程的主要瓶颈。忆阻器作为一种新兴的存储器件,其交叉杆阵列结构可以通过欧姆定律和基尔霍夫定律实现高效、并行的矩阵向量乘法的过程,被认为是有望突破冯诺依曼构架的有效候选者之一。通过忆阻器阵列可以极大的加速数据之间的距离计算过程,并进一步的加速数据聚类的过程。特别地,现有的一些研究中,基于欧氏距离的数据聚类算法以及硬件数据分类器已经表现出良好的效果。
对于模长为“1”的单位向量,其在高维数据空间中分布在半径为“1”的超球体表面上,故被称为球形数据。作为一种通用的数据预处理方式,球形数据通常是通过自然界中获取的原始数据经过数据预处理的过程得到,例如在自然语言处理过程中得到的TF-IDF方法得到的特征向量等。球形数据的聚类过程利用竞争学习网络算法,能够主动发掘数据之间的内在联系,实现数据的特征学习并完成分类的过程。该算法表现出算法简单、数据处理能力强、收敛速度快、可调参数少等优势,并在自然语言处理、数据推荐系统等领域表现出巨大的应用前景。与传统K-means聚类算法类似,球形数据聚类的核心是通过计算样本数据与特征数据的样本点之间的距离,并将样本点划分到聚类最近的特征数据所表征的类别上,以达到分类的目的。特别地,针对于球形数据,数据之间的距离可以通过数据之间的点乘结果表征。但是,以应对传统非单位数据向量的距离计算方法来实现聚类的过程不能很好利用数据的本身特性,会造成更多冗余的消耗。
在现有的研究中,基于非监督的竞争学习网络实现球形数据在硬件电路上分类过程的问题主要表现在:(1)随着数据量的不断增大与数据维度的不断增长,数据之间的距离比较过程需要消耗大量的时间和能耗,分类效率较低;非单位化的数据向量在忆阻器阵列中的距离计算比较方式相对复杂,不能充分的利用球形数据本身的数据特性,进而会造成额外的计算消耗。(2)现有的基于忆阻器阵列的分类方法大多依赖于数据的在线数据计算与离线更新相配合的方式实现完整的聚类过程,缺少基于忆阻器阵列的全硬件的数据分类器和分类方法,难以形成系统级专用加速集成电路;(3)对于球形聚类算法,在数据训练过程中,需要保持聚类中心的模长保持在单位化状态,硬件电路中数据单位化的过程困难且实现复杂;(4)对于高稀疏性数据,大多数数据的值都为0值,利用传统的欧氏距离表征不能够很好的区分数据之间的差异,需要通过余弦距离的方式刻画数据之间的距离,利用忆阻器阵列计算数据之间的余弦距离方案尚未成熟。
综上所述,提供一种以余弦距离表征的计算复杂度低、计算速度快的球形数据分类装置及其分类方法是亟待解决的问题。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于忆阻器阵列的球形数据分类装置及其操作方法,其目的在于解决球形数据聚类全阵列实现过程以及数据的余弦相似度表征困难、计算复杂度高的技术问题。
为实现上述目的,第一方面,本发明提供了一种基于忆阻器阵列的球形数据分类装置,包括:分类器和辅助控制模块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110037230.5/2.html,转载请声明来源钻瓜专利网。