近年來,數(shù)據(jù)挖掘技術(shù)得到了飛躍式發(fā)展,其應(yīng)用領(lǐng)域也涉及到商業(yè)零售、電信數(shù)據(jù)分析、金融數(shù)據(jù)分析、生物醫(yī)學(xué)分析、教育管理分析等多個領(lǐng)域。隨著各行各業(yè)信息化建設(shè)的不斷完善,大量的信息數(shù)據(jù)為數(shù)據(jù)挖掘技術(shù)的應(yīng)用提供了基礎(chǔ)和保障。本文將以教學(xué)為例,利用數(shù)據(jù)挖掘技術(shù)對學(xué)生學(xué)習(xí)成績進(jìn)行深入分析。
1、數(shù)據(jù)挖掘在教育教學(xué)中應(yīng)用的可行性分析
數(shù)據(jù)驅(qū)動學(xué)校,分析變革教育的大數(shù)據(jù)時代已經(jīng)帶來,利用數(shù)據(jù)挖掘技術(shù)對教育領(lǐng)域的相關(guān)數(shù)據(jù)進(jìn)行分析,探索教育變量之間的關(guān)系,為教育教學(xué)的科學(xué)決策提供有力支撐,已經(jīng)成為教育發(fā)展的趨勢之一。大數(shù)據(jù)時代的到來,將掀起人類教與學(xué)的又一次變革。對此,美國國家教育部于2016 年就已經(jīng)發(fā)布了《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》的報告。報告中,列舉了大數(shù)據(jù)教育應(yīng)用的案例、領(lǐng)域、應(yīng)用中所面臨的困難以及應(yīng)采取的態(tài)度和對策等。計算機(jī)技術(shù)和互聯(lián)網(wǎng)技術(shù)在我國起步較晚,但發(fā)展迅速,尤其是近幾年“互聯(lián)網(wǎng)+”時代的到來,極大的促進(jìn)了各行各業(yè)的發(fā)展;ヂ(lián)網(wǎng)的發(fā)展同樣會促進(jìn)學(xué)校信息化的建設(shè),加強(qiáng)教育教學(xué)領(lǐng)域的大數(shù)據(jù)研究和應(yīng)用分析,具有重要的實踐意義。教育學(xué)者在信息技術(shù)和網(wǎng)絡(luò)技術(shù)的影響下,逐漸加大了對數(shù)據(jù)挖掘技術(shù)的研究力度,通過一系列研究,就“國家和地方應(yīng)在技術(shù)層面、管理體制、法律制度上加大對大數(shù)據(jù)研究和應(yīng)用力度,按照發(fā)展現(xiàn)狀及未來規(guī)劃,整合現(xiàn)有資源,發(fā)揮后勁優(yōu)勢,真正推動我國教育教學(xué)工作的改革進(jìn)程。大數(shù)據(jù)給各個行業(yè)的發(fā)展帶來的變革和挑戰(zhàn)是前所未有的,就教育行業(yè)而言,教師的教學(xué)行為、學(xué)生的學(xué)習(xí)活動、教學(xué)管理工作、科學(xué)研究等數(shù)據(jù)都能為學(xué)校領(lǐng)導(dǎo)者制定決策提供依據(jù),數(shù)據(jù)挖掘技術(shù)在教育教學(xué)領(lǐng)域具有廣泛應(yīng)用價值。
2、數(shù)據(jù)挖掘技術(shù)對學(xué)生成績的分析
在教學(xué)領(lǐng)域,學(xué)習(xí)分析是其中最為重要的組成部分。學(xué)習(xí)分析就是收集與學(xué)習(xí)者有關(guān)的信息數(shù)據(jù),然后構(gòu)建數(shù)據(jù)模型,從中發(fā)現(xiàn)數(shù)據(jù)中隱含的規(guī)律;還可利用該技術(shù)對學(xué)習(xí)者的行為表現(xiàn)進(jìn)行分析,根據(jù)學(xué)生表現(xiàn)制定合適的學(xué)習(xí)計劃,提高學(xué)生的學(xué)習(xí)效率;總之,學(xué)習(xí)分析是涉及到社會學(xué)、心理學(xué)、計算機(jī)科學(xué)和信息技術(shù)等多種學(xué)科的一種理論方法,是利用海量數(shù)據(jù)的收集、分析、處理,發(fā)現(xiàn)影響學(xué)習(xí)者學(xué)校結(jié)果的因素,評價學(xué)生學(xué)習(xí)情況,根據(jù)分析反饋結(jié)果,對教學(xué)內(nèi)容、教學(xué)計劃和教學(xué)方式進(jìn)行調(diào)整和改進(jìn),以此推進(jìn)教學(xué)和學(xué)習(xí)的整體效率。
3、數(shù)據(jù)挖掘技術(shù)應(yīng)用過程
(1)數(shù)據(jù)選取 數(shù)據(jù)是數(shù)據(jù)挖掘的基礎(chǔ),也是整個數(shù)據(jù)挖掘流程中耗費時間和精力最多的環(huán)節(jié),大概占整個數(shù)據(jù)挖掘項目的60%-80%。在這一環(huán)節(jié)中,若數(shù)據(jù)類型沒有完成轉(zhuǎn)換,則數(shù)據(jù)類型與模型中的算法匹配度就會受到影響;數(shù)據(jù)中存在的噪聲過多或不完整度過高,就會影響模型的準(zhǔn)確性,由此可見,數(shù)據(jù)選取工作具有十分重要的地位,應(yīng)對其引起足夠的重視。數(shù)據(jù)質(zhì)量越高,越有利于實現(xiàn)挖掘目標(biāo),分析出來后所得出的規(guī)律結(jié)論更可靠。
(2)數(shù)據(jù)挖掘過程 學(xué)生成績數(shù)據(jù)可通過學(xué)校教學(xué)平臺獲取,其挖掘過程如下: a數(shù)據(jù)準(zhǔn)備階段。首先,先數(shù)據(jù)導(dǎo)入操作,選擇類型為Excel 表格后,執(zhí)行查詢操作。然后,對數(shù)據(jù)進(jìn)行清理。將原始數(shù)據(jù)中異常數(shù)據(jù)、噪聲數(shù)據(jù)或不合理數(shù)據(jù)進(jìn)行清除;對不完整數(shù)據(jù)進(jìn)行字段補(bǔ)償,待數(shù)據(jù)符合數(shù)據(jù)挖掘要求后,將其導(dǎo)入數(shù)據(jù)庫。最后,數(shù)據(jù)轉(zhuǎn)換。將以百分制記錄的原始數(shù)據(jù)分為1-10 個檔次的成績備用。
現(xiàn)代企業(yè)經(jīng)常會搜集大量的數(shù)據(jù),這些數(shù)據(jù)涵蓋了市場、客戶、供貨商,及其競爭對手等重要信息,但是由于信息超載與無結(jié)構(gòu)化,企業(yè)的決策者無法充分利用這些龐大的數(shù)據(jù)資源,僅能使用其中的一小部分,這可能導(dǎo)致決策失誤,甚至出現(xiàn)決策錯誤。而借助數(shù)據(jù)挖掘技術(shù),企業(yè)完全有能力從浩瀚的數(shù)據(jù)海洋中,挖掘出全面而又有價值的信息和知識,并作為決策支持之用,進(jìn)而形成企業(yè)獨有的競爭優(yōu)勢。 ..
|