[发明专利]基于聚类-决策树的玉米良种选育方法无效
申请号: | 200910233447.2 | 申请日: | 2009-10-30 |
公开(公告)号: | CN101697167A | 公开(公告)日: | 2010-04-21 |
发明(设计)人: | 邱建林;季丹;陈建平;顾翔;李芬 | 申请(专利权)人: | 邱建林;季丹;陈建平;顾翔;李芬 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;A01H1/04 |
代理公司: | 南通市永通专利事务所 32100 | 代理人: | 葛雷 |
地址: | 226019 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 决策树 玉米 良种 选育 方法 | ||
技术领域:
本发明涉及一种玉米良种选育方法。
背景技术:
聚类是一种常见的数据分析工具,是指用数学的方法研究和处理给定对象,是多元统计分析的一种。基于“物以类聚”的思想,它把大量数据点的集合分成若干类或簇,使得每个类中的数据之间最大程度地相似,而不同类中的数据最大程度地不同,从而发现全局的分布模式以及数据属性之间的相互关系。聚类分析的一个突出特点是处理巨大、复杂的数据集,而且还可作为其他算法的预处理步骤。目前常用的聚类算法还有k-平均、k-模、k-中心点、DIANA、AGNES、STING、COBWEB等。
这些经典的聚类算法只能处理简单的、一般的数据,对于大型的、复杂的数据集效果欠佳,于是很多改进的和新的算法不断被提出。比如,有文献提出了一种进化的基于多中心的动态聚类算法,其中簇的数目不用预先制定,对于不同的簇可选择多个中心点,且由两个目标函数进行评估,提高了算法对于具有特殊特性和特殊分布的数据集的应用;CUZ算法改进了代表点的计算,不仅能有效地鉴别非圆形、非矩形形状的数据,还可以处理表面非凸起形状的簇;GriDBSCAN算法通过在数据空间构造网格,先局部采用密度算法,后聚合产生真正的簇,大大提高了DBSCAN的效率,降低了复杂度。还有一些新的算法,比如Yu Wei等人 提出的凝聚层次聚类算法,采用了84维的空间序列来表示对象,通过对由两两对象间的皮尔森系数构成的矩阵进行凝聚,最终可获得较有效的系统树图;在种群算法和智能体的基础上提出的较新颖的蚂蚁算法,不必事先规定簇的数目,并且可通过计算局部的对象而非全部对象的方法来减少算法整个的计算量,能够发现任意形状的簇。
决策树方法是分类方法中应用较广泛的逻辑方法之一,它从一组无次序、无规则的实例中推理出决策树表示形式的分类规则,它采用自顶向下的递归方式,利用信息论中的互相信息(信息增益)寻找数据库中具有最大信息量的字段,建立决策树的一个结点,再根据字段的不同取值检查树的分支,在每一个分支子集中,重复建立树的下层结点和分支的过程。从决策树的根到叶节点的一条路径就对应着一条合取规则,整棵决策树就对应着一组析取表达式。常用的方法有C4.5、ID3、CLS等。
目前已经提出了很多改进的决策树算法,比如Ding Rongtao等人在计算信息熵以鉴别属性的相关度时引入了用户的兴趣参数以减少属性间的冗余,加快了信息熵减少的速度;Fadila Bentayeb等人提出一种新的基于决策树的数据挖掘算法,通过在数据挖掘处理之前对数据进行的预处理,建立一张可能性表,并对此实施新的ID3算法和信息增益公式,简化了算法的复杂度,最终达到决策树分类的目的;关系分类方法RDC算法,使用ID数组传播来更新多关系决策树,可防止建立过大冗余的关系表,有效地防止了信息的丢失,优化了树结构,增强了算法的正确性。
信息技术已经在我国农业生产中得到广泛的应用,它大大推进了我国农业生产的发展,成为发展现代农业生产的重要支撑力量。在玉米良种的选育方面,存储着大量信息,如株高、穗高、全生育期、小区产量等,若能从中挖掘出正确的、可靠的、有用的规则,将对农业的发展与改革产生指导性的作用。
发明内容:
本发明的目的在于提供一种可根据要求对玉米的生育信息、生长信息和收获信息等进行玉米良种的优选,可达到降低劳动强度,提高决策效率的基于聚类-决策树的玉米良种选育方法。
本发明的技术解决方案是:
一种基于聚类-决策树的玉米良种选育方法,其特征是:包括下列步骤:
(1)数据预处理:将选择的三个属性对应成空间中的三维点,利用聚类算法中的k-平均算法,计算子女表中所有的记录点和重心之间的距离,比较大小,最终将所有的记录聚为两个簇,并使每个簇内的记录有较大的相似度,而不同的簇有较大的相异度;
(2)建立决策树:先离散化所选的三个属性的属性值,将它们分区成三类,并将千粒重作为分类属性,划分类别标记为低产、中产、高产,在输入全生育期、千粒重和小区产量这三个属性之后,根据欧氏距离公式:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于邱建林;季丹;陈建平;顾翔;李芬,未经邱建林;季丹;陈建平;顾翔;李芬许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910233447.2/2.html,转载请声明来源钻瓜专利网。