[发明专利]一种基于模糊演化计算的文本聚类方法无效
| 申请号: | 201010144226.0 | 申请日: | 2010-04-12 |
| 公开(公告)号: | CN102214181A | 公开(公告)日: | 2011-10-12 |
| 发明(设计)人: | 宋威;梁久祯 | 申请(专利权)人: | 无锡科利德斯科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/12 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 214125 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 模糊 演化 计算 文本 方法 | ||
1.一种基于模糊演化计算的文本聚类方法,其特征在于,其包括:
A、在搜索空间中对每个聚类的解决方案以染色体的形式进行编码,其中每条染色体由位于不同基因位的基因组成;
B、随机建立前述染色体的初始种群并计算种群中每一染色体的适应度;
C、对上述种群进行模糊演化计算,包括:
C1、利用期望值模型选择初始种群中适应度高的染色体后,将适应度高的染色体复制到后续种群中;
C2、计算初始种群中每条染色的交叉概率并通过随机数字生成器来确定每条染色体是否为需要交叉的染色体,之后将需要交叉的每两条染色体的相同基因位进行单点或多点交叉以形成新的染色体,并放入所述后续种群中;
C3、计算初始种群中每条染色体的变异概率并通过随机数字生成器来确定每条染色体是否为需要变异的染色体,之后将需要变异的染色体进行基因变异以产生新的染色体个体,并将新的染色体放入所述后续种群中;和
C4、计算上述步骤演化的后续种群的最佳染色体的适应度;和
D、根据后续种群的最佳染色体的适应度来判断是否演化过程结束,若演化过程结束,完成文本聚类,否则用后续种群作为初始种群并计算每条新产生染色体的适应度后返回步骤C继续迭代。
2.根据权利要求1所述的基于模糊演化计算的文本聚类方法,其特征在于,所述步骤D中判断演化过程结束的条件为当后续种群的最佳染色体的适应度经过连续预定的迭代次数均未提高。
3.根据权利要求1所述的基于模糊演化计算的文本聚类方法,其特征在于,所述适应度定义为:
其中,DB为Davies-Bouldin索引,K为种群中聚类的个数,这里dij为聚类Ci和聚类Cj之间的距离,具体定义为:
di,j=simcos(zi,zj)
其中,zi和zj分别为聚类Ci和聚类Cj的中心;这里Si为第i个聚类的内部对象平均分布,具体定义为:
其中|Ci|代表聚类Ci中对象的个数。那么,Si表示聚类Ci中所有对象与其中心zi间相似性(Cosine值)的平均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡科利德斯科技有限公司,未经无锡科利德斯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010144226.0/1.html,转载请声明来源钻瓜专利网。





