[发明专利]一种基于特征选择和分类模型的体质识别方法在审
| 申请号: | 201910105155.4 | 申请日: | 2019-02-01 |
| 公开(公告)号: | CN109919196A | 公开(公告)日: | 2019-06-21 |
| 发明(设计)人: | 文贵华;李杨辉 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G16H20/90;G16H50/70 |
| 代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 体质 分类模型 判定 随机数生成算法 特征选择算法 特征选择 体质类型 中医 分类 诊断 判定标准 设计分类 有效地 引入 保证 | ||
本发明公开了一种基于特征选择和分类模型的体质识别方法,包括步骤:通过随机数生成算法生成《中医体质分类与判定表》中全部问题的回答;根据《中医体质分类与判定表》的判定方法和判定标准,计算出当前回答下对应的体质类型;通过特征选择算法,从《中医体质分类与判定表》的全部问题中,选出具有代表性的部分问题;设计分类模型,利用部分问题的回答和对应的体质类型,训练得到一个体质识别模型;本发明引入了随机数生成算法、特征选择算法和分类模型等技术,有效地降低诊断时间,提高诊断效率,且保证了体质识别的有效性,具有一定的市场价值和推广价值。
技术领域
本发明涉及模式识别技术领域,具体涉及一种基于特征选择和分类模型的体质识别方法。
背景技术
人体体质是在先天遗传和后天获得的基础上表现出来的形态结构、生理功能、心理状态等多个方面的综合。王琦教授把体质分为平和质、气虚质、阳虚质、阴虚质、痰湿质、湿热质、血瘀质、气郁质、特禀质九大体质类型[王琦.9种基本中医体质类型的分类及其诊断表述依据[J].北京中医药大学学报,2005(04):1-8.],这种体质划分方法在2009年写入了《中医体质分类判定标准》。人体体质与性别、年龄、遗传等因素相关,表现出一定的稳定性,但人体体质的稳定性是相对的,它会因为营养、锻炼、疾病、精神、环境等内外环境中等因素的影响而发生变化[孙萌.基于应激理论开展中医体质内外环境适应性研究的意义[J].中医药通报,2013,12(01):29-31.]。
人体体质识别是中医体质学研究的基础,它在健康管理上有着巨大的应用价值[王济.中医体质学基础实验方法和研究现状[J].中华中医药杂志,2012,27(01):10-13.]。人们通过识别自己的体质类型,可以有针对性地进行养生保健,对与中医体质相关疾病作出防治。当今社会里,不少人的生活方式变得越来越不合理,处于亚健康的人越来越多。人们尽早发现自己的体质类型,才能明晰自己是否健康,从而及时对症下药,调整自己的生活方式,改善身体状况。
《中医体质分类判定标准》上有61道题目,每道题目按5级评分(没有、很少、有时、经常、总是),分别对应1分、2分、3分、4分、5分。通过回答《中医体质分类判定标准》的61道题目,对照其中的平和质与偏颇体质判定标准表,人们可以判定自己的体质类型。但是,现代人的生活节奏快,工作压力大,人们很难有时间认真地回答完61道题目,而且问题数量偏多,容易导致答题的质量下降。如何减少人们进行体质识别的时间,是非常迫切的需求,为了达到这个目的,从《中医体质分类判定标准》的61道题目中选出具有代表性的部分问题具有极大的意义。
在过去,人们常通过人工的方法对高维特征进行压缩,但是需要花费巨大的人力和时间,而且在特定的领域,这些工作需要具备相应知识背景的人,成本是非常高的。特征选择是模式识别任务里处理高维数据的一项重要技术,主要作用是从原始特征集中选出具有代表性的特征子集,提升分类、聚类、检索等任务的效果。模式识别的许多任务有着非常高维的数据,有的数据有几百维甚至几千维。在一些情况中,特别是在数据量不足够大的情况下,高维数据不仅增加了处理数据的时间,而且提高了训练模型以及分析结果的难度,此外,模型会因为数据维度过高但数据量少而容易过拟合,模型的性能受到了严重的影响。通过特征选择方法,研究人员不仅可以降低数据的维度,同时可以保留原始的特征信息,对往后的分析工作有非常大的帮助。
特征选择的原则是,在不显著降低分类效果的前提下,获取尽可能小的特征子集。特征选择的方法主要有Filter、Wrapper、Embedding三种方法。Filter方法通过卡方检验、信息增益等方法对每个特征进行重要性评分,特征的得分越高,说明这个特征越重要。Wrapper方法通过一个确定的模型去评估特征选择的效果,它需要迭代地进行特征选择、训练模型、评估模型效果三个阶段,因而需要的时间和计算都比Filter方法的多。Embedding方法也需要一个确定的模型,与Filter方法不同的是,Embedding方法从这个在原始特征集上训练好的模型得到各个特征的权重,分别作为各个特征的重要性,根据权重的大小进行特征选择。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910105155.4/2.html,转载请声明来源钻瓜专利网。





