計(jì)算機(jī)有關(guān)自動(dòng)機(jī)的論文

時(shí)間：2016-12-21 12:43:23 堅(jiān)烘964由分享

　　自動(dòng)機(jī)原來(lái)是模仿人和動(dòng)物的行動(dòng)而做成的機(jī)器人的意思。但是現(xiàn)在已被抽象化為如下的機(jī)器。時(shí)間是離散的(t=0，1，2……)，在每一個(gè)時(shí)刻它處于所存在的有限個(gè)內(nèi)部狀態(tài)中的一個(gè)。對(duì)每一個(gè)時(shí)刻給予有限個(gè)輸入中的一個(gè)。那么下一個(gè)時(shí)刻的內(nèi)部狀態(tài)就由現(xiàn)在的輸入和現(xiàn)在的內(nèi)部狀態(tài)所決定。下面是學(xué)習(xí)啦小編給大家推薦的計(jì)算機(jī)有關(guān)自動(dòng)機(jī)的論文，希望大家喜歡!

　　計(jì)算機(jī)有關(guān)自動(dòng)機(jī)的論文篇一

　　《基于遺傳算法的自動(dòng)組卷系統(tǒng)設(shè)計(jì)》

　　摘要：自動(dòng)組卷系統(tǒng)是計(jì)算機(jī)輔助教學(xué)的重要組成部分，而遺傳算法以其全局尋優(yōu)和智能搜索的特性，得到了廣泛的運(yùn)用。根據(jù)自動(dòng)組卷系統(tǒng)的特點(diǎn)，將遺傳算法合理應(yīng)用于自動(dòng)組卷中，在遺傳算法中，設(shè)計(jì)了雙種群機(jī)制，并以試卷難度、試卷區(qū)分度、試卷的估計(jì)用時(shí)、知識(shí)點(diǎn)分布為基礎(chǔ)構(gòu)造適應(yīng)度函數(shù)，通過(guò)輪盤(pán)賭選擇方法、多點(diǎn)交叉和變異，較好地解決了自動(dòng)組卷的多重目標(biāo)尋優(yōu)問(wèn)題。

　　關(guān)鍵詞：自動(dòng)組卷;遺傳算法;適應(yīng)度函數(shù)

　　0引言

　　考試是教學(xué)過(guò)程中的一個(gè)重要環(huán)節(jié)，我們用它來(lái)檢測(cè)教學(xué)效果，以期提高教學(xué)質(zhì)量。傳統(tǒng)的手工方式，都是以教師的經(jīng)驗(yàn)與知識(shí)的積累為依據(jù)出題，帶有一定的主觀性，考試命題質(zhì)量和科學(xué)性不能保證。另外，對(duì)于有些課程，我們希望平時(shí)能夠在計(jì)算機(jī)機(jī)房通過(guò)上機(jī)完成測(cè)驗(yàn)。所以，伴隨人工智能的廣泛應(yīng)用，自動(dòng)組卷技術(shù)成為我們必須深入探討的一個(gè)課題。現(xiàn)有不少自動(dòng)組卷系統(tǒng)，但其算法存在時(shí)間復(fù)雜度和空間復(fù)雜度偏大、程序結(jié)構(gòu)復(fù)雜、試題缺乏隨機(jī)性等缺陷\[1\]。將遺傳算法應(yīng)用于自動(dòng)組卷系統(tǒng)中，并將試卷難度、試卷區(qū)分度、試卷的估計(jì)用時(shí)、知識(shí)點(diǎn)分布作為綜合優(yōu)化目標(biāo)，對(duì)上述缺陷作出了改進(jìn)。

　　1基于遺傳算法的自動(dòng)組卷算法設(shè)計(jì)

　　遺傳算法的操作步驟為編碼、隨機(jī)產(chǎn)生初始種群、構(gòu)建適應(yīng)度函數(shù)、對(duì)初始種群迭代執(zhí)行選擇、交叉、變異等遺傳操作產(chǎn)生下一代種群，獲取最優(yōu)解、解碼\[2\]。本自動(dòng)組卷算法設(shè)計(jì)如下。

　　1.1編碼設(shè)計(jì)

　　整數(shù)編碼直接采用解空間的形式進(jìn)行編碼，意義明確，易于引入特定領(lǐng)域的信息，而且能大大縮短串長(zhǎng)，遺傳操作無(wú)須頻繁地編碼、解碼，改善了遺傳算法的計(jì)算復(fù)雜性，提高了算法效率\[3\]。本算法采用整數(shù)編碼將現(xiàn)實(shí)問(wèn)題映射到染色體即個(gè)體形式。

　　實(shí)現(xiàn)時(shí)，按試卷的題型對(duì)個(gè)體進(jìn)行分段編碼。比如試卷由L種題型的試題組成，則染色體編碼劃分成L個(gè)子段，每個(gè)子段對(duì)應(yīng)一種題型。每個(gè)子段中基因個(gè)數(shù)為該題型要求的題目個(gè)數(shù)。

　　試題庫(kù)中每道題目，都有一個(gè)編號(hào)與其對(duì)應(yīng)。比如現(xiàn)在生成了兩張?jiān)嚲韨€(gè)體ExaPaper1、ExaPaper2。分別由選擇、填空、判斷、問(wèn)答、綜合5道題組成。

　　1.2產(chǎn)生兩個(gè)初始種群

　　在初始種群產(chǎn)生時(shí)，應(yīng)采用某種算法，使優(yōu)秀、中等的、劣質(zhì)的個(gè)體基本同概率存在。以保證初始種群產(chǎn)生的多樣性和分布均勻性。并且采用產(chǎn)生2個(gè)初始種群的方法，同時(shí)對(duì)解空間內(nèi)多個(gè)區(qū)域進(jìn)行搜索，并互相交流信息。這種設(shè)置方法，雖然每次需執(zhí)行與種群規(guī)模n成2倍的計(jì)算量，但實(shí)質(zhì)上可進(jìn)行大約O (n\+3)個(gè)解的有效搜索。因此，這種2種群的設(shè)置方法，成本雖提高一倍，效率則以指數(shù)形式上升。

　　實(shí)現(xiàn)時(shí)，本算法采用隨機(jī)的方法產(chǎn)生320個(gè)個(gè)體，將他們分為40個(gè)子空間，則每個(gè)子空間中有8個(gè)個(gè)體。然后從每個(gè)子空間中隨機(jī)獲取5個(gè)個(gè)體，這樣就形成了200個(gè)個(gè)體，對(duì)這200個(gè)個(gè)體再隨機(jī)劃分到兩個(gè)初始種群中。

　　1.3構(gòu)造適應(yīng)度函數(shù)

　　一份卷子設(shè)計(jì)是否合理，通常從3個(gè)方面考察：第一，題型比例配置是否適當(dāng);第二，題目難、中、易比例是否合理;第三，干擾項(xiàng)是否有效，能不能反映考生的典型錯(cuò)誤。本算法將試卷難度、試卷區(qū)分度、試卷的估計(jì)用時(shí)、知識(shí)點(diǎn)分布4個(gè)目標(biāo)作為綜合優(yōu)化目標(biāo)，因此也將其作為構(gòu)造適應(yīng)度函數(shù)的主要依據(jù)。適應(yīng)度函數(shù)的構(gòu)造過(guò)程為，首先以各目標(biāo)為基礎(chǔ)分別構(gòu)造各自的目標(biāo)函數(shù)，然后使用加權(quán)的方法對(duì)各目標(biāo)函數(shù)進(jìn)行組合獲得適應(yīng)度函數(shù)。

　　1.3.1各目標(biāo)函數(shù)構(gòu)造

　　(1)試卷難度目標(biāo)函數(shù)。

　　針對(duì)不同的考生，試卷難度要求也不同，因此將試卷難度作為構(gòu)造適應(yīng)度函數(shù)的一個(gè)依據(jù)。

　　Fc(X)=1-1[]total_score∑N[]i=1fc(i)*p(i)-Exp_Difficulty(1)

　　其中，X為種群中個(gè)體，N為X的長(zhǎng)度，i表示X中第i個(gè)位置。對(duì)應(yīng)到自動(dòng)組卷中，N為題目的個(gè)數(shù)，total_score為試卷的總分，i表示X這份試卷中第幾道題目。f\-c(i)為i這道題目對(duì)應(yīng)的難易度，p(i)為這道題目對(duì)應(yīng)的分值。Exp_Difficulty為對(duì)試卷的難度期望值。由此可知，F(xiàn)\-c(X)值越大，說(shuō)明試卷難度符合要求的可能性越大。

　　(2)試卷區(qū)分度目標(biāo)函數(shù)、試卷估計(jì)用時(shí)目標(biāo)函數(shù)。

　　區(qū)分度是指試題對(duì)被試者情況的分辨能力的大小。區(qū)分度適當(dāng)?shù)脑嚲砟馨褍?yōu)秀、一般、差三個(gè)層次的學(xué)生真正區(qū)分開(kāi)。試卷區(qū)分度目標(biāo)函數(shù)、試卷估計(jì)用時(shí)目標(biāo)函數(shù)構(gòu)造方法與試卷難度目標(biāo)函數(shù)構(gòu)造方法類似。試卷區(qū)分度目標(biāo)函數(shù)構(gòu)造如式(2)所示。

　　Fd(X)=1-1[]total_score∑N[]i=1fd(i)*p(i)-Exp_Difficulty(2)

　　其中，X為種群中個(gè)體，N為X的長(zhǎng)度，i表示X中第i個(gè)位置。對(duì)應(yīng)到自動(dòng)組卷中，N為題目的個(gè)數(shù)，f\-d(i)為i這道題目對(duì)應(yīng)的區(qū)分度，p(i)為這道題目對(duì)應(yīng)的分值。total_score為試卷總分值。Exp_Different為對(duì)試卷的區(qū)分度的望值。由此可知，F(xiàn)\-d(X)值越大，說(shuō)明試卷難度符合要求的可能性越大。

　　試卷估計(jì)用時(shí)目標(biāo)函數(shù)構(gòu)造如式(3)、式(4)所示。

　　Ft(X)=T(X)T(X)<11[]T(X)T(X)>1(3)

　　T(X)=∑N[]i=1ft(i)[]Exp_Time(4)

　　其中，X為種群中個(gè)體，N為X的長(zhǎng)度i表示X中第i個(gè)位置。對(duì)應(yīng)到自動(dòng)組卷中，N為題目的個(gè)數(shù)，f\-t(i)為完成i這道題目的期望時(shí)間。Exp_Time為完成本試卷估計(jì)用時(shí)的期望值。由此可知，F(xiàn)\-t(X)值越大，說(shuō)明試卷難度符合要求的可能性越大。

　　(3)知識(shí)點(diǎn)分布目標(biāo)函數(shù)。

　　教學(xué)大綱中，對(duì)不同章節(jié)知識(shí)點(diǎn)的掌握程度要求也不同。因此，設(shè)計(jì)知識(shí)點(diǎn)分布目標(biāo)函數(shù)，用來(lái)把握考察的知識(shí)點(diǎn)是否全面合理。

　　知識(shí)點(diǎn)分布目標(biāo)函數(shù)構(gòu)造如式(5)、式(6)所示。

　　Fn(X)=(∑M[]j=1fw(j)*∑N[]i=1Fs(i))/total_score(5)

　　Fs(i)=fs(i)第i題目屬于第j章內(nèi)容0第i題目不屬于第j章內(nèi)容(6)

　　其中，X為種群中個(gè)體，N為X的長(zhǎng)度，i表示X中第i個(gè)位置。對(duì)應(yīng)到自動(dòng)組卷中，M為本試卷要考察到的章節(jié)總數(shù)。fw(j)為課本第j章在試卷中占用的權(quán)重。N為題目的個(gè)數(shù)，fs(j)為第i題目的分值。若第i題目是第j章節(jié)的內(nèi)容，F(xiàn)\-s(i)才存儲(chǔ)f\-s(i)的值，以便參與實(shí)際試卷中第j章節(jié)權(quán)重的計(jì)算。total_score為試卷總分值。由此可知，F(xiàn)\-n(X)值越大，說(shuō)明試卷難度符合要求的可能性越大。

　　1.3.2適應(yīng)度函數(shù)構(gòu)造

　　使用加權(quán)的方法對(duì)各目標(biāo)函數(shù)進(jìn)行組合，形成適應(yīng)度函數(shù)。適應(yīng)度函數(shù)如式(7)所示：

　　F(X)=1Fc(X)+2Fd(X)+3Ft(X)+4Fn(X)(7)

　　其中，F(xiàn)\-c(X)、F\-d(X)、F\-t(X)、F\-n(X)分別為試卷難度、試卷區(qū)分度、試卷的估計(jì)用時(shí)、知識(shí)點(diǎn)分布的目標(biāo)函數(shù)。1、2、3、4分別為試卷難度、試卷區(qū)分度、試卷的估計(jì)用時(shí)、知識(shí)點(diǎn)分布目標(biāo)函數(shù)的權(quán)值。并且1+2+3+4=1。權(quán)值1、2、3、4的取值應(yīng)依據(jù)具體試卷考核目標(biāo)而定。

　　1.4遺傳操作

　　1.4.1選擇操作設(shè)計(jì)

　　在本算法中，應(yīng)用輪盤(pán)賭選擇方法進(jìn)行選擇操作，決定將哪些個(gè)體復(fù)制到新種群中\(zhòng)[4\]。并進(jìn)一步根據(jù)適應(yīng)度值對(duì)t+1代和t代種群最優(yōu)個(gè)體進(jìn)行比較及選取，確保在t+1種群中，最優(yōu)個(gè)體的適應(yīng)度并不低于t種群的最優(yōu)個(gè)體適應(yīng)度。

　　1.4.2交叉操作設(shè)計(jì)

　　本文使用多點(diǎn)交叉操作。針對(duì)兩個(gè)個(gè)體即兩份試卷中的選擇、填空、判斷、問(wèn)答、綜合5類題型，分別進(jìn)行20%的基因點(diǎn)交叉。比如假設(shè)生成了表3、表4所示兩份試題。黑邊框處為交叉點(diǎn)。交叉操作后，試卷1、卷2轉(zhuǎn)換為表5、表6所示內(nèi)容。

　　1.4.3變異操作設(shè)計(jì)

　　變異操作為對(duì)群體中某些個(gè)體的基因進(jìn)行小概率擾動(dòng)。本變異的操作如下：以題型為基礎(chǔ)，將個(gè)體分段，每段隨機(jī)選擇一個(gè)變異位置，并從同題型題庫(kù)中隨機(jī)選擇一個(gè)題目替換該變異位置題目，條件是新選的題目不能與當(dāng)前試卷中同題型其它題目重復(fù)。

　　1.4.4種群競(jìng)爭(zhēng)設(shè)計(jì)

　　本算法采用產(chǎn)生2個(gè)初始種群的方法，同時(shí)對(duì)解空間內(nèi)多個(gè)區(qū)域進(jìn)行搜索，并互相交流信息。種群競(jìng)爭(zhēng)的具體設(shè)計(jì)思想為：對(duì)兩個(gè)初始種群K11、K21分別進(jìn)行遺傳操作產(chǎn)生新的種群，各經(jīng)過(guò)T代(不同問(wèn)題T的設(shè)定不同)后，獲取到新種群K1T、K2T。將K1T、K2T兩個(gè)種群中個(gè)體合并，按適應(yīng)度排序。前一半個(gè)體形成新的K1T種群，后一半個(gè)體形成新的K2T種群。將新K1T、K2T再反復(fù)執(zhí)行上述過(guò)程，直到滿足終止條件時(shí)進(jìn)化結(jié)束。本算法的終止條件是當(dāng)達(dá)到規(guī)定的最大迭代次數(shù)HMAX或者最好個(gè)體的適應(yīng)度函數(shù)值HMAX/5次達(dá)到了要求。

　　1.5選擇最優(yōu)解及解碼

　　通過(guò)遺傳算法最終可獲得一組個(gè)體，對(duì)這組個(gè)體分別計(jì)算適應(yīng)度值，獲取適應(yīng)度最優(yōu)的個(gè)體，作為最終解。因?yàn)槭钦麛?shù)編碼，個(gè)體中基因值即為題庫(kù)中被選中題的題號(hào)。因此，從最優(yōu)個(gè)體可直接得到最終生成的試卷。

　　2結(jié)語(yǔ)

　　本文圍繞自動(dòng)組卷存在的問(wèn)題，重點(diǎn)研究了遺傳算法的改進(jìn)及其在自動(dòng)組卷算法中的應(yīng)用。通過(guò)運(yùn)行基于該遺傳算法的組卷程序，證明了該設(shè)計(jì)的可行性、有效性。

　　參考文獻(xiàn)：

　　[1]黎軍.基于遺傳算法的自動(dòng)組卷設(shè)計(jì)[J].電腦學(xué)習(xí)，2009(3).

　　[2]陳國(guó)良，王煦法，莊鎮(zhèn).遺傳算法及其應(yīng)用[M].北京：人民郵電出版社，1996.

　　[3]張超群，鄭建國(guó)，錢(qián)潔.遺傳算法編碼方式比較[J].計(jì)算機(jī)應(yīng)用，2011(3).

　　[4]丁承層，強(qiáng)傳生，張輝.遺傳算法縱橫談[J].信息與控制，1997(1).

　　計(jì)算機(jī)有關(guān)自動(dòng)機(jī)的論文篇二

　　《基于改進(jìn)遺傳算法的自動(dòng)組卷研究》

　　摘要：通過(guò)詳細(xì)分析試卷的各項(xiàng)約束條件，建立了一個(gè)以知識(shí)點(diǎn)、難度系數(shù)、區(qū)分度等為核心屬性的自動(dòng)組卷數(shù)學(xué)模型，并利用改進(jìn)的遺傳算法實(shí)現(xiàn)了自動(dòng)組卷。

　　關(guān)鍵字：自動(dòng)組卷;數(shù)學(xué)模型;遺傳算法

　　自動(dòng)組卷就是根據(jù)用戶的要求，采用一定的算法自動(dòng)地從試題庫(kù)中抽取一定數(shù)量的試題組成試卷。自動(dòng)組卷算法的好壞直接影響到試卷的質(zhì)量，如何從試題庫(kù)中選出試題組成符合用戶要求的試卷，并使組卷具有較高的效率和成功率是當(dāng)前研究的熱門(mén)課題。現(xiàn)有的自動(dòng)組卷算法一般有三種：隨機(jī)選取法、回溯試探法和遺傳算法。遺傳算法是一種新發(fā)展起來(lái)的并行優(yōu)化算法，它很適合解決自動(dòng)組卷問(wèn)題。

　　1 試題核心屬性的確定

　　在自動(dòng)組卷系統(tǒng)中，一些試題庫(kù)設(shè)置了試題的各類屬性，如章節(jié)、層次、要求、題型、難度系數(shù)、難度級(jí)別、各章節(jié)分值等屬性，其實(shí)過(guò)多的屬性會(huì)增加實(shí)際組卷的難度，降低效率。以教育學(xué)理論為指導(dǎo)，選擇以下屬性作為試題的核心屬性。

　　(1) 題號(hào)。試題的編號(hào)，用來(lái)唯一標(biāo)識(shí)試題。

　　(2) 題型。試題的類型。

　　(3) 知識(shí)點(diǎn)。某道題屬于某門(mén)課程的哪個(gè)知識(shí)點(diǎn)，知識(shí)點(diǎn)的設(shè)置不以章節(jié)為依據(jù)，從而可以避免教材的不同對(duì)組卷造成影響。

　　(4) 難度系數(shù)。難度系數(shù)[1]是表示某一試題的難易程度，通常用未通過(guò)率來(lái)表示，即一次考試中未答對(duì)某道試題的考生數(shù)在其總體中所占的比例。一般來(lái)說(shuō)，難度系數(shù)值為0.5時(shí)，是中等難度，如果小于0.3試題太簡(jiǎn)單，如果大于0.7試題太難，對(duì)考生都會(huì)做或都不會(huì)做(難度系數(shù)為0或?yàn)?)的試題，屬于無(wú)意義的試題，必須淘汰。

　　(5) 區(qū)分度。區(qū)分度[2]是指某道題對(duì)不同水平考生加以區(qū)分的能力。區(qū)分度高的試題，對(duì)學(xué)生水平有較好的鑒別力。區(qū)分度的計(jì)算公式為：

　　其中，B表示試題的區(qū)分度，H表示樣本中高分組在某題上所得的平均分，L表示樣本中低分組在某題上所得的平均分，K表示某題滿分。高分組和低分組一般各占樣本的25%～30%，最好取27%。一般來(lái)說(shuō)，試題的區(qū)分度在0.4以上就被認(rèn)為是很好的。在0.3～0.39之間，認(rèn)為良好;在0.2～0.29之間，認(rèn)為可以;在0.19以下，認(rèn)為差，必須淘汰或加以修改。對(duì)在校學(xué)生的達(dá)標(biāo)考試，試卷的區(qū)分度不宜太高，因?yàn)樗皇沁x拔性質(zhì)的考試。但也不能過(guò)低，否則對(duì)學(xué)生的鑒別效果差，不能很好的達(dá)到考試的目的。一般區(qū)分度控制在0.2～0.3之間為宜。

　　(6) 分值。某小題的分?jǐn)?shù)。

　　(7) 答題時(shí)間。完成某題估計(jì)所需的時(shí)間。

　　2 自動(dòng)組卷數(shù)學(xué)模型的建立

　　自動(dòng)組卷中決定一道試題，其實(shí)就是決定一個(gè)包含題號(hào)、題型、知識(shí)點(diǎn)、難度系數(shù)、區(qū)分度、分值、答題時(shí)間的七維向量(a 1，a 2，a 3， a4，a 5，a 6，a 7)。假設(shè)一套試卷中包含n道試題，一套試卷就決定了一個(gè)n×7的矩陣S：

　　這就是問(wèn)題求解中的目標(biāo)矩陣，其中a i1 、a i2 、 a i3 、a i4、a i5、 a i6 、a i7分別表示試卷中第i道題的題號(hào)、題型、知識(shí)點(diǎn)、難度系數(shù)、區(qū)分度、分值、答題時(shí)間。從矩陣S可以看出組卷問(wèn)題是一個(gè)多重約束目標(biāo)的問(wèn)題求解，且目標(biāo)狀態(tài)不是唯一的。

　　在實(shí)際組卷時(shí)，用戶會(huì)對(duì)試卷提出多方面的要求，用戶的每一個(gè)要求對(duì)應(yīng)試卷的一個(gè)約束條件。要組成一份符合要求的、高質(zhì)量的試卷，目標(biāo)矩陣的分布要滿足以下試卷約束條件。

　　(1) 試卷中包含的題型以及每種題型的題量要與用戶的設(shè)置相符。

　　k種題型的題量=

　　(2) 試卷中包含知識(shí)點(diǎn)即考核知識(shí)點(diǎn)以及各考核知識(shí)點(diǎn)所占分?jǐn)?shù)的比例要與用戶設(shè)置相符。

　　K種考核知識(shí)點(diǎn)所占分?jǐn)?shù)=

　　(3) 試卷的難度系數(shù)要滿足用戶的要求，試卷的難度系數(shù)一般用試卷中每道試題的難度系數(shù)的加權(quán)平均來(lái)計(jì)算。

　　即：試卷的難度系數(shù)=

　　(4) 試卷的區(qū)分度要滿足用戶的要求，試卷的區(qū)分度一般用試卷中每道試題的區(qū)分度的加權(quán)平均來(lái)計(jì)算。

　　即：試卷的區(qū)分度=

　　(5) 試卷的總分要與設(shè)置相符。

　　即：試卷的總分=

　　(6) 試卷的總答題時(shí)間要與用戶設(shè)置相符。

　　即：試卷的總答題時(shí)間=

　　在實(shí)際組卷時(shí)，試卷的總分、考核知識(shí)點(diǎn)、各題型每小題分值、試卷中包含的題型、各題型的題量都應(yīng)該是精確達(dá)到的。試卷中各考核知識(shí)點(diǎn)所占的分?jǐn)?shù)、試卷的難度系數(shù)、區(qū)分度和試卷的總答題時(shí)間這四個(gè)約束條件可以存在一定的誤差。誤差的大小由用戶的期望值和各約束條件的重要性決定。在實(shí)際應(yīng)用中，各約束條件的重要性是不同的，因此，目標(biāo)函數(shù)就取各項(xiàng)誤差的加權(quán)和。目標(biāo)函數(shù)f可以表示為：

　　為了不至于各項(xiàng)誤差相互抵消，實(shí)際值與用戶要求值的誤差都取絕對(duì)值。其中，試卷中各考核知識(shí)點(diǎn)所占的分?jǐn)?shù)和試卷的總答題時(shí)間這兩項(xiàng)的誤差為實(shí)際值與用戶要求值的誤差絕對(duì)值與用戶要求值的比，試卷的難度系數(shù)和區(qū)分度這兩項(xiàng)的誤差為實(shí)際值與用戶要求值的誤差的絕對(duì)值。w i表示第i個(gè)約束條件的權(quán)值，w i通常由專家經(jīng)驗(yàn)或試驗(yàn)給出，0≤w i ≤1。由上式可知，目標(biāo)函數(shù)f的值越小，即誤差越小，問(wèn)題的解越優(yōu)，即生成的試卷越接近用戶的需求。

　　3 遺傳算法

　　遺傳算法[3，4，5]是以適應(yīng)度函數(shù)(或目標(biāo)函數(shù))為依據(jù)，通過(guò)對(duì)群體中的個(gè)體進(jìn)行遺傳操作實(shí)現(xiàn)群體內(nèi)個(gè)體結(jié)構(gòu)重組的迭代處理過(guò)程。在這一過(guò)程中，群體中的個(gè)體一代一代地得以優(yōu)化，并逐漸地逼近最優(yōu)解，最終獲得最優(yōu)解。傳統(tǒng)遺傳算法的主要步驟包括初始染色體群體生成、適應(yīng)度評(píng)估和檢測(cè)、選擇操作、交叉操作和變異操作。傳統(tǒng)遺傳算法流程圖如圖1所示(其中t為進(jìn)化代數(shù)，t0為最大進(jìn)化代數(shù))。

　　4 基于改進(jìn)遺傳算法的自動(dòng)組卷

　　傳統(tǒng)的遺傳算法采用二進(jìn)制編碼，用1表示某題被選中，0表示某題沒(méi)有被選中，這種編碼非常簡(jiǎn)單，但在進(jìn)行交叉和變異操作時(shí)，各題型的題量很難控制，而且當(dāng)試題庫(kù)題量很大時(shí)編碼很長(zhǎng)。傳統(tǒng)的遺傳算法以進(jìn)化代數(shù)等于最大進(jìn)化代數(shù)作為終止條件，但是在實(shí)際組卷過(guò)程中并不知道種群進(jìn)化到第幾代就能得到試卷的最優(yōu)組合。因此用遺傳算法實(shí)現(xiàn)自動(dòng)組卷時(shí)，要對(duì)傳統(tǒng)遺傳算法進(jìn)行一些改進(jìn)。

　　4.1 改進(jìn)的遺傳算法

　　4.1.1 染色體編碼

　　通過(guò)對(duì)編碼的大量分析，提出了一種分段實(shí)數(shù)編碼機(jī)制，首先將染色體分成若干段，每一段對(duì)應(yīng)一種題型，組成試卷的各道試題題號(hào)直接映射為基因，編碼時(shí)將同一題型的試題放在同一段，同一段內(nèi)題號(hào)各不相同。以題號(hào)編碼的方法所表達(dá)的意義清楚、明確、不需解碼，從而可以提高算法性能，提高運(yùn)算效率。而且交叉和變異操作都在各段內(nèi)部進(jìn)行，因此可以保證組卷過(guò)程中各題型題量的正確匹配。

　　4.1.2 適應(yīng)度函數(shù)設(shè)計(jì)遺傳算法在進(jìn)化搜索中僅以適應(yīng)度函數(shù)為依據(jù)，利用種群中每個(gè)個(gè)體的適應(yīng)度值來(lái)進(jìn)行搜索。因此，適應(yīng)度函數(shù)的選擇至關(guān)重要，一般而言，適應(yīng)度函數(shù)是由目標(biāo)函數(shù)變換而成的。上面提出的自動(dòng)組卷模型是最小化問(wèn)題，采用如下方法可將目標(biāo)函數(shù)f轉(zhuǎn)換成適應(yīng)度函數(shù)F。

　　由上式可知，F(xiàn)的取值范圍為0～1，適應(yīng)度函數(shù)F的值越大，說(shuō)明個(gè)體越好，個(gè)體越接近問(wèn)題的最優(yōu)解。

　　4.1.3 初始化染色體群體

　　隨機(jī)生成初始染色體群體，在初始染色體群體中，染色體的長(zhǎng)度為n，群體的大小為m，m太小時(shí)，難以求出最優(yōu)解，太大時(shí)則增長(zhǎng)收斂時(shí)間。群體的大小一般根據(jù)需要，按經(jīng)驗(yàn)或試驗(yàn)給出，一般m=30～160。

　　4.1.4 遺傳算子

　　(1) 選擇算子

　　在遺傳操作中，為了保留較優(yōu)的個(gè)體，以概率1完全地復(fù)制每一代群體中按適應(yīng)度值從大到小依次排列的前面2個(gè)個(gè)體。為了保持群體大小不變，同時(shí)刪除適應(yīng)度排列的后面的2個(gè)個(gè)體。然后從排列在前面的m-2個(gè)個(gè)體中隨機(jī)抽取p(p≤m-2)個(gè)個(gè)體進(jìn)行交叉和變異操作。這種選擇策略使得適應(yīng)度小的個(gè)體也有可能被選中，這樣有助于增加下一代群體的多樣性。

　　(2) 交叉算子

　　在遺傳操作中，采用了分段的思想，交叉的時(shí)候按題型段進(jìn)行交叉，因此交叉后不存在段內(nèi)試題重復(fù)的問(wèn)題，也不會(huì)改變每種題型的題量。交叉概率p c太小時(shí)難以向前搜索，太大時(shí)則容易破壞高適應(yīng)度的結(jié)構(gòu)。一般p c=0.4～0.6。 (3)變異算子在遺傳操作中，變異在染色體的題型段內(nèi)進(jìn)行。變異概率p m太小時(shí)難以產(chǎn)生新的基因結(jié)構(gòu)，太大時(shí)使遺傳算法成了單純的隨機(jī)搜索。一般p m=0.01～0.2。

　　4.1.5 終止條件

　　在改進(jìn)的遺傳算法中，設(shè)置了期望適應(yīng)度值，把每一代計(jì)算出來(lái)的最高適應(yīng)度個(gè)體的適應(yīng)度值與期望適應(yīng)度值相比較，當(dāng)適應(yīng)度最高的個(gè)體的適應(yīng)度值大于或等于期望適應(yīng)度值時(shí)則停止進(jìn)化，否則繼續(xù)進(jìn)行遺傳操作、計(jì)算適應(yīng)度值、反復(fù)迭代直到組卷成功。

　　4.2 主要算法描述

　　基于改進(jìn)遺傳算法的自動(dòng)組卷的主要算法描述如算法1所示。

　　算法1：

　　int GJGA(p c，p m，m，f0)

　　{

　　t=0;

　　initialize(p(t));//隨機(jī)產(chǎn)生初始染色體群體

　　計(jì)算初始染色體群體的適應(yīng)度值;

　　while (maxf

　　{

　　selection(p(t));//選擇操作

　　crossover(p(t));//交叉操作

　　mutation(p(t));//變異操作

　　得到下一代染色體群體q(t+1)，計(jì)算下一代染色體群體的適應(yīng)度值;

　　t++;

　　}

　　輸出當(dāng)前染色體群體中適應(yīng)度最高的染色體;

　　}

　　4.3 遺傳算法復(fù)雜度分析

　　在遺傳算法中，絕大部分處理都集中在適應(yīng)度的計(jì)算上，因此可以用計(jì)算個(gè)體適應(yīng)度操作的時(shí)間復(fù)雜度作為算法的時(shí)間量度。遺傳算法的時(shí)間復(fù)雜度為O(t*m*n)。因?yàn)樵囶}庫(kù)中的題量一般都很大，所以改進(jìn)后的遺傳算法的時(shí)間復(fù)雜度一般要比傳統(tǒng)遺傳算法的時(shí)間復(fù)雜度小。遺傳算法的空間復(fù)雜度可以用初始染色體群體所占的空間來(lái)衡量，遺傳算法的空間復(fù)雜度為O(m*n)。因?yàn)楦倪M(jìn)后的遺傳算法的染色體的長(zhǎng)度遠(yuǎn)比傳統(tǒng)遺傳算法的染色體的長(zhǎng)度小，所以改進(jìn)后的遺傳算法的空間復(fù)雜度遠(yuǎn)比傳統(tǒng)遺傳算法空間復(fù)雜度小。

　　5 結(jié)論

　　算法的改進(jìn)往往不能顧及問(wèn)題每一個(gè)方面，如果算法設(shè)計(jì)的核心是提高解的精度，則算法可能在搜索范圍和搜索精度上花去更多的時(shí)間，如果算法的設(shè)計(jì)主要在于盡快收斂，得到結(jié)果，則在解的精度上考慮很少，算法往往側(cè)重于減少進(jìn)化代數(shù)。改進(jìn)后的遺傳算法使生成試卷的質(zhì)量得到了保證，但要使組卷的收斂速度得到進(jìn)一步改進(jìn)，還需進(jìn)一步研究。

　　參考文獻(xiàn)

　　[1] 文海英. 智能型試卷自動(dòng)生成系統(tǒng)中試卷難度控制技術(shù)的研究(J).湖南科技學(xué)院學(xué)報(bào)，2005，26(5)：153-156

　　[2] 常振江. 學(xué)生成績(jī)分布與一種簡(jiǎn)便的評(píng)估試卷命題質(zhì)量的方法(J). 遼寧師范大學(xué)學(xué)報(bào)：自然科學(xué)版，2003，26(1)：109-112

　　[3] 丁衛(wèi)平. 基于遺傳算法的智能組卷應(yīng)用研究.電氣電子教學(xué)學(xué)報(bào)(J)，2005，27(2)：93-95

　　[4] 朱黎明. 基于單親遺傳算法的試題生成及其應(yīng)用研究(D). 長(zhǎng)沙：湖南大學(xué)，2005

　　[5] T.Lynda，C.Chrisment，Boughanem Mohand. Multiple Query Evaluation Based on Enhanced Genetic Algorithm. Information Processing and Management，2003，39(2)：215-231

計(jì)算機(jī)有關(guān)自動(dòng)機(jī)的論文

相關(guān)文章

熱門(mén)文章