[发明专利]基于聚类-决策树的玉米良种选育方法无效
申请号: | 200910233447.2 | 申请日: | 2009-10-30 |
公开(公告)号: | CN101697167A | 公开(公告)日: | 2010-04-21 |
发明(设计)人: | 邱建林;季丹;陈建平;顾翔;李芬 | 申请(专利权)人: | 邱建林;季丹;陈建平;顾翔;李芬 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;A01H1/04 |
代理公司: | 南通市永通专利事务所 32100 | 代理人: | 葛雷 |
地址: | 226019 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于聚类-决策树的玉米良种选育方法,包括数据预处理、建立决策树、根据形成的决策树,系统判断所输入的属性值属于哪个分类,并通过计算这个三维点和所属分类中其他点的距离,得到一个距离最小的点,这个点所具有的属性就是最接近于输入玉米品种的玉米属性,从子女表中查询出这个玉米品种的父类和母类,即完成玉米选育的功能。本发明结合聚类和决策树算法,可根据要求对玉米的生育信息、生长信息和收获信息等进行玉米良种的优选,可达到降低劳动强度,提高决策效率的目的。 | ||
搜索关键词: | 基于 决策树 玉米 良种 选育 方法 | ||
【主权项】:
一种基于聚类-决策树的玉米良种选育方法,其特征是:包括下列步骤:(1)数据预处理:将选择的三个属性对应成空间中的三维点,利用聚类算法中的k-平均算法,计算子女表中所有的记录点和重心之间的距离,比较大小,最终将所有的记录聚为两个簇,并使每个簇内的记录有较大的相似度,而不同的簇有较大的相异度;(2)建立决策树:先离散化所选的三个属性的属性值,将它们分区成三类,并将千粒重作为分类属性,划分类别标记为低产、中产、高产,在输入全生育期、千粒重和小区产量这三个属性之后,根据欧氏距离公式: d ( x i , y j ) = ( Σ k = 1 m ( x ik - x jk ) 2 ) 1 2 即可判断这个三维点属于哪个聚类簇,得出结论后,对这个簇进行ID3算法的数据挖掘,计算出全生育期属性和小区产量属性的信息增益值,并将具有较大增益的属性作为测试属性,在测试属性分段的子节点处,引出分支,划分整个记录集,再依次进行即可形成一个精简的决策树,其中属性Sk的信息增益公式为: G ( S K ) = h s ( s j ) - Σ k = 1 K ( n k n j × ( - Σ i = 1 c n ik n k × log 2 ( n ik n k ) ) ) 其中nj是总节点的出现次数,nk是预测属性值为Vk的子节点的出现次数,nik是分类属性为Ci的预测属性值为Vk的子节点的出现次数;(3)根据形成的决策树,系统判断所输入的属性值属于哪个分类,并通过计算这个三维点和所属分类中其他点的距离,得到一个距离最小的点,这个点所具有的属性就是最接近于输入玉米品种的玉米属性,从子女表中查询出这个玉米品种的父类和母类,即完成玉米选育的功能。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于邱建林;季丹;陈建平;顾翔;李芬,未经邱建林;季丹;陈建平;顾翔;李芬许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910233447.2/,转载请声明来源钻瓜专利网。