[发明专利]一种基于数据物理特征和隐含风格特征的新颖分类方法在审
| 申请号: | 201910205905.5 | 申请日: | 2019-03-18 |
| 公开(公告)号: | CN109977150A | 公开(公告)日: | 2019-07-05 |
| 发明(设计)人: | 顾苏杭;王惠宇;高佳琴;王士同 | 申请(专利权)人: | 常州轻工职业技术学院 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62;G06Q50/00 |
| 代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 朱晓凯 |
| 地址: | 213164 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 风格特征 测试样本 社交网络 隐含 标签类型 数据物理 子网络 机器学习技术 人工智能 模式识别 数据距离 双层结构 效率确定 最大节点 数据集 分类 映射 构建 挖掘 网络 | ||
本发明涉及模式识别与人工智能、机器学习技术领域,具体地说,是一种基于数据物理特征和隐含风格特征的新颖分类方法,包括以下步骤:(1)利用K近邻算法将数据集映射成包含C个子网络的社交网络;(2)在构建的社交网络中挖掘数据隐含风格特征—权威性和影响力;(3)根据数据距离特征和权威性风格特征计算每一个测试样本与社交网络中每个节点之间的双层结构效率确定测试样本每个子网络的允许连接集;(4)根据允许连接集计算每个允许连接集中所有节点的影响力之和;(5)将测试样本标签类型判别为与具有最大节点影响力之和对应的子网络标签类型。
技术领域
本发明涉及模式识别与人工智能、机器学习技术领域,具体地说,是一种基于数据物理特征和隐含风格特征的新颖分类方法。
背景技术
数据分类技术在机器学习、模式识别以及数据挖掘等领域一直都是研究的热点问题,尤其将数据分类技术与实际应用相结合,如智能医疗、人脸识别、智能交通监控、市场动态分析等,更是深远推动了数据分类技术的发展,拓宽了数据分类技术在军工业、民生等领域的运用前景。数据分类技术的关键就在于选取合适的数据特征通过分类方法构建具有高精度性能的数据分类模型。
传统分类方法,如支持向量机、K近邻、随机森林、贝叶斯、决策树、人工神经网络以及Takagi-Sugeno-Kang(TSK)模糊分类器等,利用数据物理特征(如距离、颜色以及相似性等)训练数据分类模型。然而,大多数实际数据集中的数据样本之间暗含着关联,每一类数据样本呈现独特的隐含风格特征,典型的数据集包括:(1)癫痫脑电信号:正常人群的脑电信号波形明显不同于患有癫痫人群的脑电信号;(2)手写体数据集:每一位作者的字体风格明显不同于其他作者;(3)元音识别:英文中的每个元音发音互不相同。目前,传统分类方法在训练数据分类模型的过程中仅考虑数据物理特征,并没有涉及数据隐含风格特征,在国内外发表的文献中未见有一种数据分类方法能够挖掘数据隐含风格特征,并同时利用数据物理特征和数据隐含风格特征训练数据分类模型。因而,现有的数据分类方法并不符合数据集包含数据隐含风格特征的事实。
发明内容
本发明的目的旨在提供一种落脚于社交网络的基于数据物理特征和隐含风格特征的新颖分类方法,能够符合大多数实际数据集包含数据隐含风格特征的事实,并通过社交网络挖掘数据隐含风格特征用于改善数据分类行为,提高数据分类精度。而且,该方法在训练阶段不需要生成数据分类模型,确定社交网络中节点隐含风格特征后便可进入分类阶段。
为实现上述目的,本发明的实例提出了一种基于数据物理特征和隐含风格特征的新颖分类方法,包括以下步骤:利用K近邻算法将数据集映射成包含C个子网络的社交网络;在构建的社交网络中挖掘数据隐含风格特征—权威性和影响力;根据数据距离特征和权威性风格特征计算每一个测试样本与社交网络中每个节点之间的双层结构效率确定测试样本每个子网络的允许连接集;根据允许连接集计算每个允许连接集中所有节点的影响力之和;将测试样本标签类型判别为与具有最大节点影响力之和对应的子网络标签类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州轻工职业技术学院,未经常州轻工职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910205905.5/2.html,转载请声明来源钻瓜专利网。





