基本遗传算法的缺陷分析:设一套题共需5种题型,共20道题目。设每道题在题库中有100道侯选题目。那么总共的组卷空间大小大约是10020 ,假设遗传算法的种群大小为1000,叠代1000次,那么最多搜索个体数量为1003 ,可见传统遗传算法的整个搜索空间相对组卷空间的大小来说,是一个非常小的区域。所以传统遗传算法搜索后期效率低并极易出现末成熟收敛的情况。

 

   

1.渐进式的遗传算法的具体步骤

(1) 先将试题按各属性粗略分类,例如将难度按0.2的间隔分为5个等级,处于同一个等级内的试题,可以看作是难度大致相同。将区分度分为5个等级。试题按这两种属性只有5*5=25种不同类型的题。同理也可将其他属性加入。通过这样一个粗略的分类,将很大程度的降低试题的类型数。

(2) 根据实际的试题库,算出每个类的参数指标。其中包括类中的试题数目N,类中试题各属性的平均值,类中试题各属性的方差。

(3) 用类中试题各属性的平均值代表类所对应的试题属性,组卷首先在类上进行。根据类组出的试卷,本文称作组卷模式。

(4) 对于每种组卷模式,计算它的总目标函数值记为f(X),并引入罚函数g(X),表示它的模式优劣性(例如:统计一套组卷模式中属于每个类的试题数目,若它大于步骤2中统计出来的类的试题数目N,那么此模式不可行。若某个类中试题数目很多,则可以多选用此类中的试题,因为它在细化的时候有更多的选择)。根据这两个函数值计算出组卷模式的适应度,并使用遗传算法来得到较优的组卷模式。

(5) 在每个组卷模式基础上,将每个类进一步划分成更细的类,用遗传算法得到更细致的组卷模式。

(6)将组卷模式中每一个类换成类中具体的试题,用遗传算法得到最终组卷方案。

 

 

2.渐进式遗传算法应用于智能组卷系统的优点

(1)如果想组出一套难度适中的试卷,那么由大部分试题属于难度非常大(或非常小)的类的组卷模式将不会采用,这样可以去掉许多无用的搜索空间,从而节约时间。

(2)由属性相近的题互换而产生的不同组卷方案在模式中都算作一种,因此每种模式都是合并了大量相似方案后的一个等价类代表,这样就减少了搜索的范围。

(3)不同组卷模式下的组卷方案相对独立,这样即可以保证遗传算法中种群的多样性,又可以避免由于模式交叉而产生的无用组卷方案。

 

 

       

广西桂圆

 

淘宝掌柜:广西桂圆


 

 

 

 

 

 

 

 

 

posted on 2010-05-05 12:20  feathersky  阅读(606)  评论(0编辑  收藏  举报