畢業(yè)論文標(biāo)準(zhǔn)格式范文
大學(xué)生畢業(yè)論文是教學(xué)環(huán)節(jié)中的重要內(nèi)容,具有重要的現(xiàn)實(shí)意。下面是小編為大家推薦的畢業(yè)論文標(biāo)準(zhǔn)格式范文,供大家參考。
范文一:計(jì)算機(jī)網(wǎng)絡(luò)安全隱患與防范策略探討
當(dāng)代,計(jì)算機(jī)網(wǎng)絡(luò)猶如一把“雙刃劍”般,在改變?nèi)祟惿鐣?huì)的同時(shí),也帶來了很多不安全因素?;诖耍W(wǎng)絡(luò)安全成為一大焦點(diǎn)問題,只有確保網(wǎng)絡(luò)系統(tǒng)軟、硬件和數(shù)據(jù)受到保護(hù),保證系統(tǒng)運(yùn)行正常,方可真正實(shí)現(xiàn)用戶信息安全。
1 計(jì)算機(jī)網(wǎng)絡(luò)及其安全問題概述
1.1 計(jì)算機(jī)網(wǎng)絡(luò)概述
計(jì)算機(jī)網(wǎng)絡(luò)主要是指在空間上相互獨(dú)立的計(jì)算機(jī),利用外設(shè)備和網(wǎng)絡(luò)進(jìn)行相互之間的連接,以達(dá)到網(wǎng)絡(luò)信息交流、共享的目的。近些年,計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)在全球的發(fā)展都極為迅速,根據(jù)相關(guān)調(diào)查可以發(fā)現(xiàn),我國(guó)于2010年計(jì)算機(jī)網(wǎng)絡(luò)設(shè)備生產(chǎn)廠家的數(shù)量就超過了170家,與上一年相比增加了約15%;而2011年我國(guó)計(jì)算機(jī)網(wǎng)絡(luò)設(shè)備銷售額與上一年相比增加了約20%,且不增出現(xiàn)頹勢(shì)。根據(jù)2014年的上半年數(shù)據(jù)顯示,我國(guó)的網(wǎng)民數(shù)量已達(dá)6.3億,互聯(lián)網(wǎng)的普及率大于46%,尤其是農(nóng)村人口所占的比例已經(jīng)大于28%,人數(shù)也有將近2億,可見計(jì)算機(jī)網(wǎng)絡(luò)發(fā)展之迅猛、普及范圍之廣[1]。
1.2 計(jì)算機(jī)網(wǎng)絡(luò)安全概述
計(jì)算機(jī)網(wǎng)絡(luò)安全可謂是計(jì)算機(jī)發(fā)展中必然要面對(duì)的問題,其自身系統(tǒng)中存在的漏洞以及網(wǎng)絡(luò)的脆弱,導(dǎo)致計(jì)算機(jī)網(wǎng)絡(luò)安全受到威脅。例如,部分網(wǎng)絡(luò)攻擊者處于好奇、報(bào)復(fù)或是牟取不法利益的目的,采取多種方式對(duì)計(jì)算機(jī)系統(tǒng)及其網(wǎng)絡(luò)展開攻擊,包括:制造系統(tǒng)病毒、發(fā)送垃圾郵件、黑客攻擊等,竊取一些重要信息或是篡改數(shù)據(jù)。當(dāng)前,網(wǎng)絡(luò)安全問題日益嚴(yán)重,各種破壞方式層出不窮,涉及范圍也越來越廣。根據(jù)相關(guān)調(diào)查顯示,目前全球每20s就會(huì)出現(xiàn)一起黑客攻擊,美國(guó)每一年在此方面的損失都高達(dá)百億美元,而我國(guó)的網(wǎng)絡(luò)安全問題也不容小覷,如2012年1-5月間,就有超過五萬多個(gè)網(wǎng)絡(luò)遭受黑客攻擊。
基于此,計(jì)算機(jī)網(wǎng)絡(luò)安全受到廣泛的重視,其主要是通過網(wǎng)絡(luò)管理及控制措施,以保證網(wǎng)絡(luò)環(huán)境內(nèi)數(shù)據(jù)的完整性與機(jī)密性。計(jì)算機(jī)的網(wǎng)絡(luò)安全主要可以分為兩個(gè)部分:一是物理方面的安全,其主要是確保計(jì)算機(jī)系統(tǒng)設(shè)備的安全,避免遭受主、客觀的損失;二是邏輯方面的安全,其主要是確保網(wǎng)絡(luò)信息的完整、機(jī)密。
2 計(jì)算機(jī)網(wǎng)絡(luò)安全隱患
隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的快速發(fā)展,信息時(shí)代已經(jīng)到來,信息的保存、交流方式與效率都有了極大地改變與提高。但是,計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)在給人們帶來極大便利的同時(shí),也引發(fā)了嚴(yán)重的網(wǎng)絡(luò)安全問題,給人們的生活與工作帶來大量損失。如下所示即為計(jì)算機(jī)網(wǎng)絡(luò)安全隱患的主要表現(xiàn):
2.1 計(jì)算機(jī)網(wǎng)絡(luò)自身漏洞
對(duì)于計(jì)算機(jī)網(wǎng)絡(luò)安全而言,其所面對(duì)的一個(gè)最大隱患即為自身漏洞,根據(jù)相關(guān)調(diào)查數(shù)據(jù)顯示,目前基本超過七成的電腦都存在漏洞。一方面,目前市場(chǎng)上主要使用的系統(tǒng)為windows系列,但是由于很多并不是正版系統(tǒng),也沒有配置相應(yīng)的安全裝置,造成系統(tǒng)在運(yùn)行的過程中產(chǎn)生各種安全問題。通常計(jì)算機(jī)在使用之前都需進(jìn)行安全級(jí)別的鑒定,很多計(jì)算機(jī)都處于D級(jí),也就意味著其操作系統(tǒng)基本不具備安全防范能力,安全風(fēng)險(xiǎn)十分大。另一方面,遠(yuǎn)程調(diào)控與后門程序也是計(jì)算機(jī)網(wǎng)絡(luò)的一大重要漏洞,其中遠(yuǎn)程調(diào)控所涉及到的環(huán)節(jié)十分多,若是某一環(huán)節(jié)遭受攻擊,則必然會(huì)導(dǎo)致整個(gè)調(diào)控出現(xiàn)安全事故;后門程序則是管理員為了方面系統(tǒng)維護(hù)而布置的,若是防范不力,則必然會(huì)因?yàn)椴《镜娜肭只蚴呛诳偷墓?,致使?jì)算機(jī)網(wǎng)絡(luò)安全性大大受損[2]。
2.2 人為攻擊
人為攻擊是計(jì)算機(jī)網(wǎng)絡(luò)安全中的另一個(gè)重大隱患。當(dāng)前,信息網(wǎng)絡(luò)在各個(gè)領(lǐng)域中的應(yīng)用十分廣泛,部分組織或是個(gè)人出于經(jīng)濟(jì)上、政治上或是其余方面的因素,會(huì)對(duì)個(gè)人、企業(yè)或是國(guó)家的計(jì)算機(jī)系統(tǒng)展開攻擊,以獲得相應(yīng)的利益。此種安全隱患的危害十分嚴(yán)重,例如:部分人員通過攻擊企業(yè)網(wǎng)絡(luò),獲得一些商業(yè)機(jī)密,其一旦得手,必然會(huì)導(dǎo)致被入侵者的利益受損,甚至是引發(fā)市場(chǎng)競(jìng)爭(zhēng)的紊亂。
2.3 病毒入侵
計(jì)算機(jī)作為一種能夠不斷自動(dòng)復(fù)制的可執(zhí)行程序,曾經(jīng)一度引發(fā)全球恐慌,具有蔓延范圍廣、傳播速度快等特點(diǎn)。由于計(jì)算機(jī)染上病毒后,其運(yùn)行效率會(huì)大幅降低,大量數(shù)據(jù)丟失,甚至是系統(tǒng)損壞,給個(gè)人或是相應(yīng)的組織帶來巨大的損失,影響十分惡劣。病毒的來源主要可以分為兩種:一是偶然導(dǎo)致的,如部分研究人員因?yàn)槭韬觯瑢?dǎo)致病毒的出現(xiàn);二是人為主動(dòng)編寫的,一些程序員為了凸顯自身能力或是出于不正當(dāng)?shù)哪康?,進(jìn)行一些違反了互聯(lián)網(wǎng)規(guī)定的應(yīng)用程序編寫,導(dǎo)致病毒的產(chǎn)生。病毒的傳播主要可以分為兩個(gè)途徑:一是用戶在公共計(jì)算機(jī)上下載了攜帶病毒的程序;二是因?yàn)閁盤的交換使用,導(dǎo)致病毒的感染。
2.4 非法訪問
非法訪問主要指的是在未經(jīng)由計(jì)算機(jī)用戶同意的情況下,直接使用非法工具或是程序,進(jìn)行超出權(quán)限的訪問,該種行為直接侵害了用戶隱私,甚至可以對(duì)用戶的銀行賬號(hào)、密碼等信息進(jìn)行盜用,影響到人們的財(cái)產(chǎn)安全,不利于社會(huì)安穩(wěn)。
3 計(jì)算機(jī)網(wǎng)絡(luò)安全隱患原因分析
3.1 網(wǎng)絡(luò)安全系統(tǒng)薄弱
當(dāng)前,面對(duì)計(jì)算機(jī)網(wǎng)絡(luò)安全隱患頻發(fā)的現(xiàn)象,我國(guó)網(wǎng)絡(luò)安全系統(tǒng)的部分環(huán)節(jié)表現(xiàn)得十分薄弱,例如:在預(yù)測(cè)、恢復(fù)、反應(yīng)、防范等環(huán)節(jié)的工作均存在不到位的問題。根據(jù)部分網(wǎng)絡(luò)組織對(duì)世界各國(guó)網(wǎng)絡(luò)防護(hù)能力的評(píng)估結(jié)果可看到,我國(guó)屬于防護(hù)能力最低的國(guó)家之一。
3.2 缺乏核心軟件技術(shù)
我國(guó)計(jì)算機(jī)網(wǎng)絡(luò)一直有一個(gè)稱呼——“玻璃網(wǎng)”,其凸顯了計(jì)算機(jī)網(wǎng)絡(luò)的易竊聽、打擊等特性。根據(jù)相關(guān)的調(diào)查可以發(fā)現(xiàn),我國(guó)很多計(jì)算機(jī)設(shè)備與軟件均是由國(guó)外引入,缺乏自主的核心軟件技術(shù),導(dǎo)致整個(gè)網(wǎng)絡(luò)十分脆弱,極易受到各種網(wǎng)絡(luò)安全隱患的威脅[3]。
3.3 安全意識(shí)淡薄
當(dāng)前,我國(guó)大多數(shù)的網(wǎng)絡(luò)用戶,甚至是一些網(wǎng)絡(luò)經(jīng)營(yíng)者都未能夠樹立主動(dòng)防范、積極應(yīng)對(duì)的網(wǎng)絡(luò)安全意識(shí)。一方面,很多網(wǎng)絡(luò)用戶使用計(jì)算機(jī)主要是為了娛樂、工作,也就往往無暇顧及到安全問題;另一方面,網(wǎng)絡(luò)經(jīng)營(yíng)者最為重視的是短期利益,這就導(dǎo)致其在網(wǎng)絡(luò)安全防范領(lǐng)域的投入不達(dá)要求,往往只是被動(dòng)的封堵漏洞,在預(yù)警、反應(yīng)、防范等方面缺乏主動(dòng)。
3.4 安全措施不到位
計(jì)算機(jī)網(wǎng)絡(luò)安全隱患出現(xiàn)的一大重要原因即為網(wǎng)絡(luò)的綜合性、動(dòng)態(tài)性。但是,很多網(wǎng)絡(luò)使用者并未意識(shí)到這一問題,往往在非安全模式下操作,造成一些數(shù)據(jù)被暴露,影響到操作系統(tǒng)的安全。此外,很多用戶往往不能夠及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)安全漏洞,進(jìn)行相應(yīng)的查堵,導(dǎo)致計(jì)算機(jī)安全風(fēng)險(xiǎn)大大增加。
4 計(jì)算機(jī)網(wǎng)絡(luò)安全隱患防范策略
4.1 訪問控制
在計(jì)算機(jī)網(wǎng)絡(luò)安全的維護(hù)中,訪問控制是一個(gè)重要的措施,其主要是通過在網(wǎng)絡(luò)資源邊界設(shè)置認(rèn)證系統(tǒng),確保去不會(huì)被非法訪問。認(rèn)證系統(tǒng)的主要作用如下所示:(1)用戶在進(jìn)行網(wǎng)絡(luò)資源的使用時(shí),必須要通過身份認(rèn)證,確定用戶信息,一旦出現(xiàn)問題能夠立即追查;(2)具有基于連接時(shí)段的ACL功能,能夠?qū)Σ煌脩艟W(wǎng)絡(luò)資源使用情況進(jìn)行調(diào)控;(3)能夠?qū)Ω鱾€(gè)網(wǎng)絡(luò)地址流量進(jìn)行規(guī)劃,根據(jù)實(shí)際情況進(jìn)行過濾;(4)對(duì)用戶的訪問進(jìn)行限制,主要可以分成兩步:a.利用IP地址進(jìn)行限制;b.利用超級(jí)用戶口令進(jìn)行限制,該口令只有系統(tǒng)管理員知道,且定期更換。此外,將一些不必要的服務(wù)端口關(guān)閉,以實(shí)現(xiàn)網(wǎng)絡(luò)威脅的有效杜絕。
4.2 采用防火墻技術(shù)
防火墻的應(yīng)用目的主要是為了防止本地系統(tǒng)受到外界的攻擊,其由軟件與硬件共同組成,位于網(wǎng)絡(luò)安全最底層,各個(gè)方向的數(shù)據(jù)都需要通過防火墻設(shè)置的關(guān)卡方可進(jìn)入本地計(jì)算機(jī),極大地增強(qiáng)了內(nèi)部網(wǎng)絡(luò)的安全,降低風(fēng)險(xiǎn)。根據(jù)防火墻所應(yīng)用的技術(shù)可將其分成三種:一是封包過濾型;二是封包檢驗(yàn)型;三是應(yīng)用層閘通道型。其中,封包過濾型主要是通過檢查進(jìn)入防火墻的所有封包標(biāo)頭內(nèi)容,例如:IP地址、使用協(xié)定、TCP/UDP的Port等信息,達(dá)到控制網(wǎng)絡(luò)安全的目的;封包檢驗(yàn)型則是利用檢驗(yàn)?zāi)=M檢驗(yàn)封包中的各層次,簡(jiǎn)單地說封包檢驗(yàn)型是封包過濾型加強(qiáng)版,但是因?yàn)榉獍鼨z驗(yàn)的主要是個(gè)別封包,所以會(huì)存在一定的不安全。
4.3 安裝防病毒、殺毒軟件
在計(jì)算機(jī)網(wǎng)絡(luò)安全控制中,防范病毒的侵襲是一個(gè)十分重要的內(nèi)容,可通過安裝防病毒軟件的方式降低安全風(fēng)險(xiǎn)。防病毒軟件可以分成兩種:一是單機(jī)防病毒軟件,其主要是通過分析掃描的手段對(duì)本地與本地工作站相互連接的遠(yuǎn)程資源進(jìn)行檢測(cè),以達(dá)到清除病毒的目的;二是網(wǎng)絡(luò)防病毒軟件,其更加重視的是網(wǎng)絡(luò)病毒的防范,一旦發(fā)現(xiàn)有病毒侵入網(wǎng)絡(luò),或是從網(wǎng)絡(luò)向其他的計(jì)算機(jī)上傳播,則會(huì)立即將其刪除。一個(gè)好的殺毒軟件,可以為用戶提供最佳網(wǎng)絡(luò)病毒防御措施,只需要幾分鐘的時(shí)間就可以安裝至組織中的任何一個(gè)NT服務(wù)器中,和操作系統(tǒng)以及其他的安全管理措施相結(jié)合,加強(qiáng)網(wǎng)絡(luò)安全管管理力度。
4.4 數(shù)據(jù)加密
數(shù)據(jù)加密是保證數(shù)據(jù)安全的重要措施,其核心技術(shù)為加密算法,主要可以分為三種形式:一是對(duì)稱加密,該種方法的應(yīng)用較早,其主要是由數(shù)據(jù)的發(fā)信方利用加密算法對(duì)明文與加密密鑰進(jìn)行處理,使其更為復(fù)雜,若是入侵者想要對(duì)原文進(jìn)行解讀,則需具有加密用的密鑰方可;二是不對(duì)稱加密,其主要是利用兩把不同卻可以匹配的公、私鑰對(duì)文件進(jìn)行加密,只有同時(shí)擁有兩把密鑰方可實(shí)現(xiàn)解密;三是不可逆加密,其主要優(yōu)勢(shì)為不需要使用密鑰,只要將明文輸入,就可以由系統(tǒng)實(shí)施加密算法形成密文,此密文是無法進(jìn)行解密的,只有將明文重新輸入,方可利用相同不可逆加密算法獲取原文件。
4.5 建立屬性安全控制、備份及恢復(fù)機(jī)制
屬性安全控制主要是通過給定的屬性與網(wǎng)絡(luò)服務(wù)器中的網(wǎng)絡(luò)設(shè)備相聯(lián)系,從而確保權(quán)限安全的前提下,提供安全保證。網(wǎng)絡(luò)屬性能夠向某些文件進(jìn)行寫數(shù)據(jù)、執(zhí)行、拷貝、刪除等操作,并可保護(hù)重要文件,以免被誤刪。同時(shí),通過熱插拔SCSI硬盤構(gòu)成磁盤容錯(cuò)陣列,采用RAID5方式對(duì)系統(tǒng)進(jìn)行實(shí)時(shí)的備份,避免儲(chǔ)存設(shè)備出現(xiàn)異常的損壞。利用數(shù)據(jù)庫(kù)觸發(fā)器與恢復(fù)重要數(shù)據(jù)的措施,能夠最大限度地保證數(shù)據(jù)安全。
4.6 加強(qiáng)信息網(wǎng)絡(luò)安全管理
在計(jì)算機(jī)網(wǎng)絡(luò)安全防范中,強(qiáng)化管理人員的安全意識(shí)是必不可缺的。很多計(jì)算機(jī)網(wǎng)絡(luò)安全隱患的出現(xiàn),究其根本是由于管理人員忽視了對(duì)網(wǎng)絡(luò)內(nèi)各種IP地址資源的管理,對(duì)此網(wǎng)絡(luò)管理人員必須樹立高度的安全意識(shí),根據(jù)自身職責(zé)權(quán)限設(shè)立操作口令,操作應(yīng)用程序數(shù)據(jù),避免出現(xiàn)安全隱患,保證網(wǎng)絡(luò)安全。
綜上所述,計(jì)算機(jī)網(wǎng)絡(luò)安全及其防范是一個(gè)系統(tǒng)性的工作,具有長(zhǎng)期性、復(fù)雜性。當(dāng)前,計(jì)算機(jī)網(wǎng)絡(luò)的絕對(duì)安全是不可能實(shí)現(xiàn)的,但是可以通過網(wǎng)絡(luò)管理人員、用戶的共同努力,設(shè)置訪問控制、防火墻,安裝防病毒、殺毒軟件,進(jìn)行數(shù)據(jù)加密,建立屬性安全控制、備份及恢復(fù)機(jī)制,加強(qiáng)信息網(wǎng)絡(luò)安全管理,真正將不安全因素降至最低。
參考文獻(xiàn)
[1]邢娜,馬文惠,馮紅嬋.淺析計(jì)算機(jī)網(wǎng)絡(luò)安全隱患及防范技術(shù)[J].科學(xué)大眾:科學(xué)教育,2009,11:155.
[2]次旦羅布.計(jì)算機(jī)網(wǎng)絡(luò)安全隱患與應(yīng)急響應(yīng)技術(shù)研究[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2013,4:230.
[3]付欣,郭鵬.計(jì)算機(jī)網(wǎng)絡(luò)安全隱患與防范措施研究[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2013,22:161.
作者簡(jiǎn)介:侯峰(1983-),女,河南許昌人,河南財(cái)政稅務(wù)高等??茖W(xué)校,實(shí)驗(yàn)師,研究方向:計(jì)算機(jī)及多媒體技術(shù)等方面。
范文二:數(shù)據(jù)挖掘技術(shù)在高校成績(jī)分析中的應(yīng)用研究
摘 要:成績(jī)是考核學(xué)生學(xué)習(xí)情況和對(duì)知識(shí)掌握程度的重要標(biāo)準(zhǔn)。在高校的教務(wù)成績(jī)管理系統(tǒng)中,保存著大量的學(xué)生成績(jī),這是一筆很寶貴的信息財(cái)富。這里借助數(shù)據(jù)挖掘技術(shù)從此數(shù)據(jù)中篩選出有用的信息,希望通過對(duì)數(shù)據(jù)信息的分析來指導(dǎo)以后的決策。文中利用數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則的Apriori算法對(duì)系統(tǒng)中保留的學(xué)生成績(jī)進(jìn)行綜合分析,不僅可以了解學(xué)生對(duì)知識(shí)的掌握程度,還可以發(fā)現(xiàn)課程之間的彼此內(nèi)在聯(lián)系,從而對(duì)人才培養(yǎng)方案的制定提供重要的參考依據(jù)。
關(guān)鍵詞:數(shù)據(jù)挖掘 成績(jī)分析 Apriori算法 應(yīng)用研究
中圖分類號(hào):TP39 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2015)11(c)-0157-03
每學(xué)期學(xué)校都要組織各種各樣的考試,然后把這些成績(jī)綜合起來作為學(xué)生期末考核的一個(gè)最終成績(jī)。由教師錄入到教務(wù)處的成績(jī)管理系統(tǒng)中,這些成績(jī)只是作為一個(gè)數(shù)據(jù)長(zhǎng)久保留,以備學(xué)生和教師查詢統(tǒng)計(jì)。但卻沒有發(fā)揮和挖掘出其真正隱含的價(jià)值。可以利用數(shù)據(jù)挖掘技術(shù)深入地挖掘這些數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,找出成績(jī)之間和課程之間存在什么聯(lián)系,通過這些數(shù)據(jù)可以制定出更合理的教學(xué)任務(wù)和教學(xué)計(jì)劃,對(duì)提高教學(xué)工作起到積極的指導(dǎo)作用[1]。
1 數(shù)據(jù)挖掘概念
數(shù)據(jù)挖掘(Data mining)就是從大量的隨機(jī)數(shù)據(jù)中提取出隱含的、不被人們所知道的、但對(duì)工作卻是有用的一些潛在的知識(shí)或信息的過程。要從大量模糊的、不完全的、有噪聲的數(shù)據(jù)中挖掘出有用的信息,通常要經(jīng)歷數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)選擇、數(shù)據(jù)變換、數(shù)據(jù)挖掘、模式評(píng)估、知識(shí)表示這幾個(gè)步驟。(如圖1所示)
2 目標(biāo)數(shù)據(jù)
該文中以該校計(jì)算機(jī)信息管理專業(yè)學(xué)生的成績(jī)作為研究對(duì)象,成績(jī)分別從《計(jì)算機(jī)文化基礎(chǔ)》《C程序設(shè)計(jì)》《數(shù)據(jù)結(jié)構(gòu)》《操作系統(tǒng)》《SQL》5門課程中獲得。利用Apriori算法挖掘出這些課程之間的潛在關(guān)系,如對(duì)某一門課程成績(jī)等級(jí)的分析來確定對(duì)其他課程的關(guān)聯(lián)影響程度[2],從中得出各課程之間的聯(lián)系緊密度。圖2中的數(shù)據(jù)是從該校的教務(wù)管理系統(tǒng)中導(dǎo)出在校學(xué)生的真實(shí)成績(jī),經(jīng)作者整理并保存到“學(xué)生成績(jī)分析”電子表格中。
3 數(shù)據(jù)預(yù)處理
首先要做的工作就是對(duì)存在問題的數(shù)據(jù)進(jìn)行清理和修正,保持?jǐn)?shù)據(jù)的一致性,對(duì)缺失的數(shù)據(jù)要填補(bǔ)或預(yù)測(cè),采用的方法是取該門課程的平均值進(jìn)行人工填補(bǔ),也可以使用數(shù)據(jù)挖掘的工具來實(shí)現(xiàn)。對(duì)于考試成績(jī)有初考、補(bǔ)考和重修的,采用初考的成績(jī)。
數(shù)據(jù)清理后,對(duì)現(xiàn)存的數(shù)據(jù)進(jìn)行轉(zhuǎn)換。既把課程映射成字符串,把成績(jī)用等級(jí)區(qū)間來表示。這樣每名學(xué)生的每門課程和成績(jī)就可以用一個(gè)字符串表示出來,為后續(xù)的統(tǒng)計(jì)工作提供便利條件,同時(shí)也完成了數(shù)據(jù)模型的建立。具體的執(zhí)行過程如以下幾點(diǎn)。
3.1 課程名稱映射
可以把上述的5門課程用A、B、C、D、E五個(gè)英文字母來代替,具體的映射過程如表1所示。
3.2 成績(jī)映射
把成績(jī)按照優(yōu)秀、良好、中等、及格和不及格分成5個(gè)等級(jí),每個(gè)等級(jí)分別對(duì)應(yīng)數(shù)字是“1、2、3、4、5”,這樣“1”就表示“優(yōu)秀”,“2”就表示“良好”,依次類推。其中成績(jī)?cè)?0分及以上為“優(yōu)秀”,80~89分為“良好”,70~79分為“中等”,60~69分為“及格”,60分以下為“不及格”。具體映射關(guān)系(如表2所示)。
3.3 原表映射結(jié)果
利用表1和表2的映射關(guān)系,可以把原來的“學(xué)生成績(jī)分析”表進(jìn)行重新整理和轉(zhuǎn)換,用“A~E”5個(gè)英文字母和“1~5”5個(gè)數(shù)字及他們組成的字符串來表示,轉(zhuǎn)換的結(jié)果(如表3所示)。
例如:B3表示“C程序設(shè)計(jì)”成績(jī)?yōu)橹械取?/p>
4 算法構(gòu)建和規(guī)則提取
Apriori算法是數(shù)據(jù)挖掘中經(jīng)常使用的經(jīng)典算法,通過逐層搜索的方法找出各數(shù)據(jù)項(xiàng)之間的關(guān)聯(lián)關(guān)系,也就是通常所說的迭代方法。首先,通過掃描事務(wù)(交易)記錄,找出所有的頻繁1項(xiàng)集,該集合記做L1,然后利用L1找頻繁2項(xiàng)集的集合L2,L2找L3,如此下去,直到不能再找到任何頻繁k項(xiàng)集。最后,再在所有的頻繁集中找出強(qiáng)規(guī)則,即產(chǎn)生用戶感興趣的關(guān)聯(lián)規(guī)則[3-5]。
算法Apriori使用逐層迭代方法基于候選找出頻繁項(xiàng)集。
輸入:D:事務(wù)數(shù)據(jù)庫(kù);min—sup:最小支持度技術(shù)閾值。
輸出:L:D中的頻繁項(xiàng)集方法,如圖3所示。
Aprior_gen做2個(gè)動(dòng)作:連接和剪枝;has_infrequent_subset用來做非頻繁自己測(cè)試。
具體實(shí)施步驟如以下幾點(diǎn)。
(1)建立數(shù)據(jù)表,將處理過的數(shù)據(jù)存入數(shù)據(jù)表中。
(2)調(diào)用find_frequently_1-itemsets,統(tǒng)計(jì)數(shù)據(jù)表中成績(jī)等級(jí)累計(jì)出現(xiàn)的次數(shù),將結(jié)果存入頻繁1項(xiàng)集中,即L1中。
(3)重復(fù)上述操作,找出全部的頻繁項(xiàng)集。
(4)從得到的頻繁項(xiàng)集入手,計(jì)算出頻繁n-項(xiàng)集的所有非空子集的置信度,將置信度大于最小置信度閾值的記錄篩選出來,并存入到數(shù)據(jù)表DM_Rules中,從而生成最終的關(guān)聯(lián)規(guī)則。
5 數(shù)據(jù)挖掘
通過Apriori算法分析后,產(chǎn)生{B2,E1}和{C3,E1}2 個(gè)頻繁項(xiàng)目集,根據(jù)這2個(gè)頻繁項(xiàng)集確定其子集,使用關(guān)聯(lián)規(guī)則挖掘算法,設(shè)最小置信度為70%,從而得出以下4個(gè)關(guān)聯(lián)規(guī)則,如表4所示。
由以上規(guī)則表4可知“C程序設(shè)計(jì):良好→數(shù)據(jù)結(jié)構(gòu):優(yōu)秀”支持度為70%,置信度為100%,表明C程序設(shè)計(jì)學(xué)生成績(jī)?cè)诹己脮r(shí),數(shù)據(jù)結(jié)構(gòu)應(yīng)該100%都是優(yōu)秀,說明學(xué)好《C程序設(shè)計(jì)》課程對(duì)學(xué)好《數(shù)據(jù)結(jié)構(gòu)》課程起到至關(guān)重要的作用,所以在安排教學(xué)計(jì)劃時(shí)應(yīng)該先把《C程序設(shè)計(jì)》課程安排在《數(shù)據(jù)結(jié)構(gòu)》之前,作為他的前導(dǎo)課程來開設(shè)。
6 結(jié)語(yǔ)
通過對(duì)教務(wù)管理系統(tǒng)中現(xiàn)存大量的學(xué)生成績(jī)數(shù)據(jù)進(jìn)行深度挖掘,利用Apriori算法合理地進(jìn)行分析和預(yù)處理,找出學(xué)生成績(jī)之間和各課程之間的彼此內(nèi)在聯(lián)系。為學(xué)院人才培養(yǎng)的制定和課程的安排和設(shè)置提供參考,為提高學(xué)校的管理提供幫助。
參考文獻(xiàn)
[1] 唐松.基于數(shù)據(jù)挖掘的高效評(píng)教系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].成都:電子科技大學(xué),2010.
[2] 姜永亮,符傳誼.數(shù)據(jù)挖掘技術(shù)在選課系統(tǒng)中的應(yīng)用[J].微型電腦應(yīng)用,2009(8):61-62.
[3] 毛國(guó)軍.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2005.
[4] Jiawei Han,Micheline Kamber.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2001.
[5] 劉瑞祥,鄒海.對(duì)挖掘關(guān)聯(lián)規(guī)則中的Apriori算法的一種改進(jìn)[J].計(jì)算機(jī)與現(xiàn)代化,2009(7):5-8,21