學術堂首頁 | 文獻求助論文范文 | 論文題目 | 參考文獻 | 開題報告 | 論文格式 | 摘要提綱 | 論文致謝 | 論文查重 | 論文答辯 | 論文發表 | 期刊雜志 | 論文寫作 | 論文PPT
學術堂專業論文學習平臺您當前的位置:學術堂 > 教育論文 > 教育學論文

教育數據分析的三個層次分析

時間:2020-03-13 來源:教育導刊 作者:鄭煥 本文字數:8480字

  摘    要: 在大數據時代,很多國家已經把教育大數據的重要性提升到國家戰略層面,目前人們主要是從技術的角度研究教育大數據;诮逃龜祿奶厥庑,從專業發展內涵的角度研究教育數據分析,提出教育數據分析的三個層次:第一層是基于個別指標的分析;第二層是基于模式的分析;第三層是基于對象的分析。探討每個層次的特征及其在教育領域中的使用,以便人們對教育數據分析的專業發展內涵有清晰的結構化認識。

  關鍵詞: 教育大數據; 指標分析; 基于模式的分析; 基于對象的分析;

  隨著計算機的普及和信息技術的快速發展,數據的收集和處理方式也發生了根本性的改變,聯合國在2012年發布的大數據白皮書《Big Data for Development:Challenges&Opportunities》中指出大數據時代已經到來,大數據的出現將會對社會各個領域產生深刻影響[1]。大數據的方法和技術已經成功地應用于商業、金融業和市場營銷等領域。大數據得到了世界各國學術界、工業界和政府機構的高度重視。

  各國政府已經意識到發展教育大數據對提高教育信息化水平,加快推進教育現代化建設具有重要意義。各式各樣的教育系統和教育信息數據庫中積累了大量的數據,如果將大數據方法和技術應用于教育教學領域,就能從這些數據中挖掘出大量有價值的規律來指導和發展教育,從而促進教育教學決策的科學化。

  目前,大數據分析和教育產生交集主要有這六個領域:(1)課堂,生成性教學課堂即時反饋;(2)學生,學生成長記錄電子檔案;(3)教學,個性化學習智能數據處理;(4)教師,教師發展與評測;(5)管理,智慧校園教育管理;(6)決策,學業與職業抉擇輔助。

  雖然很多國家已經把教育大數據的重要性提升到國家戰略層面,但是人們對教育大數據的研究及使用依然是處于起步階段。國內外關于教育大數據的文獻主要是從技術的角度去分析大數據方法怎么應用于教育領域,文獻中出現比較頻繁的詞是:數據挖掘、學習分析、智慧校園,表明人們關注的主要是如何收集更加詳細的信息,并對這些信息進行有效管理,或者模仿大數據在商業中的應用模式,對某些教育行為進行數據挖掘。但由于教育數據的獨特性,使這些應用很難得到推廣,這個問題在基礎教育領域更加明顯。

  在大數據時代,我們需要重新審視教育數據分析的內涵和特征,才能更好地利用教育大數據。筆者通過文獻研究發現,很少有文章從教育數據分析的專業內涵角度,研究它的目標、需求、方法和發展規律等等。限于篇幅,本文不能全面地論述教育數據分析的專業內涵。而任何研究領域的專業化都會經歷從低層次到高層次的發展過程,本文嘗試從層次性的角度來闡述教育數據分析的專業發展內涵及其在教育領域中的使用,以便人們對教育數據分析的專業發展內涵有更加清晰的結構化認識。根據筆者長期的實踐和思考,本文把教育數據分析分為三個層次:第一層是基于個別指標的分析;第二層是基于模式的分析;第三層是基于對象的分析。下面分別對這三個層次進行論述。

  一、基于個別指標的分析及其使用

  基于個別指標的分析主要是指根據某些指標的實測值,判斷其達標情況,或比較不同對象之間相應指標的差異。

  在教育測量與評估的發展過程中,人們很大程度上受自然科學領域測量方法的影響,習慣把測量的對象分解成不同的維度(或者影響因素),每個維度都有可量化的指標,然后設計相應的量表對這些指標進行測量并賦值。例如,最早的智力理論之一是英國心理學家和統計學家查爾斯·斯皮爾曼(Charles Spearman)在1927年提出的雙因素理論。斯皮爾曼認為智力包含兩個因素:一般智力,他稱之為g因素;以及某個具體測試中包含的某種因素,他稱之為s因素[2]。又如,我國教育部基礎教育質量監測中心自2015年起,每三年一個周期開展國家義務教育質量監測工作,監測以四年級、八年級學生為對象。監測中心組織研發了義務教育階段德育、語文、數學、科學、體育與健康、藝術六個學科領域的監測指標體系。其中,數學學業質量監測分為運算能力、推理能力、空間想象力、問題解決能力、數據分析能力等五個維度[3]。
 

教育數據分析的三個層次分析
 

  基于指標體系的測評是教育評價比較常見的形式,因此指標分析是教育數據分析的基礎。在日常生活中,人們如果想了解一個對象的物理特征,常常只需測量該對象的幾個物理屬性即可。例如,只需測量一個長方體的長、寬和高,就可以知道它的大小。在教育領域,人們也常常通過個別指標來了解對象在某方面的發展水平。所以,基于個別指標的分析在教育領域中的使用比較廣泛;趥別指標的分析的有效性完全依賴于指標體系設計的科學性;蛘哒f,基于個別指標的分析在多大程度上能說明問題取決于這些指標在多大程度上體現測量對象的真實屬性。

  基于個別指標的數據分析主要用到描述性統計,也就是把原始數據組織并整理成更容易處理、更容易理解的形式,例如,把數據做成圖表,描述數據的集中趨勢等等。

  由于教育測量與評價在我國基礎教育領域的起步相對較晚,許多教育工作者并沒有接受過專業的測評培訓,缺乏對學生測評數據的內涵的理解。所以,很多教育工作者對教育數據分析的認識僅停留在這個層次,認為教育數據分析就是計算各個指標值,然后對這些指標值進行比較或排名。

  教育數據分析的目的之一是向學生提供反饋信息,使學生能夠將反饋融入學習過程,并讓教師評估學生的學習需求,探索導致學生學習困難的原因。但如果對教育數據分析的認識僅局限于個別指標分析,就很容易導致對數據分析結果的使用簡單化、片面化。雖然很多教育測評都有相應的指標體系,但由于指標體系中各指標之間的關聯性不是很明確,人們使用測評結果的時候,往往只關注個別指標值。如,在現實中,考試成績是學校教育中的主要數據,很多學校領導評價教師的教學質量的主要依據是考試平均分和優秀率(或上線率),教師評價學生的學業水平的主要依據是成績排名。學校普遍缺乏對測評數據的二次分析,包括不同學生群體差異化分析,不同學科之間的配合情況分析,對結果進行適當的情境化分析,整體水平的穩定性分析等等。這樣,即使測評的次數比較頻繁,對改進課堂教學質量的效果也是很有限的。

  由于教育領域的數據主要涉及人的教育行為和認知發展,其結構的復雜性是商業領域的營銷數據不可比擬的,因此基于個別指標的分析也容易導致人們誤以為數據結果是抽象的、機械的、乏味的,與人性化教育相去甚遠。很多教師面對這些數據結果往往無所適從,因為他們看不到任何規律,也缺乏結果使用的詳細指導和說明。

  在使用基于個別指標的分析時,為了避免只關注個別指標或使用個別指標對整體作定性判斷,首先要確保測評指標體系具有良好的結構,各指標解釋的范圍和程度要做明確的界定,數據分析結果的報告必須要清晰化、情境化、結構化,這樣才有助于促進學生學習,并為教育系統不同層面的決策提供信息;其次,必須向教師提供深入的專業學習機會,提升教師實施測評和使用測評結果的能力。這樣才能充分利用測評數據分析結果來改進教育教學。

  二、基于模式的分析及其使用

  模式是主體行為的一般方式,具有一般性、簡單性、重復性、結構性、穩定性、可操作性的特征。

  與基于個別指標的分析相比,基于模式的分析主要是在數據分析方法和技術上的提升,也就是在數據的描述性統計分析和數據分類的基礎上,通過更加科學的方法和先進的技術來分析數據的結構和尋找數據的內在規律。

  基于模式的分析主要有兩種情況,一種是理論實驗模式,另一種是數據挖掘模式。

  (一)理論實驗模式

  理論實驗模式主要是指先提出理論假設,然后通過實驗數據進行論證。教育和心理現象中的數量關系與空間形式是非常復雜的,大量因素或變量很難清晰界定、關聯性復雜多變,于是人們往往是先通過理論研究提出某種模型假設,然后設計實驗來檢驗理論假設。檢驗的方式之一是定量分析,即通過收集樣本資料,使用統計方法尋求整體性規律。

  這種情況的數據分析主要用到推斷性統計,即運用概率與統計的理論進行分析、論證,在一定可靠程度上,對總體的特征進行估計或推測。推斷統計主要內容包括概率與概率分布、參數估計、假設檢驗、抽樣調查、方差分析、相關與回歸分析、因子分析、統計預測、統計決策等。

  理論實驗模式的使用在學術界比較常見,因為實驗是教育與心理研究的一種重要實證方法。例如,在認知能力研究中,心理學家們從各種不同的角度對人的智力提出假設,然后通過因子分析方法來確定智力不同的維度,形成了眾多不同的理論。

  國際上標準化教育測評的發展趨勢是除了測試學生的學習成果,還通過問卷調查的形式收集可能影響學生學習成果的信息,包括學生家庭背景、個人能力及態度、教學的組織形式及傳達效果、學校實踐及教育系統的特點。然后從學生、教師、學校和教育系統等層面對測試結果進行深層次分析[4]。這一類數據分析從技術方法的角度也屬于理論實驗模式的范疇,因為標準化教育測評首先必要有一個明確的理論框架,所有的數據分析都基于該理論框架,例如,不同學生群體的學業成就差異性分析,不同影響因素與學業成就的相關性分析等等。

  理論實驗模式的使用比較容易忽視的一個問題是:統計分析方法前提條件的充分性。因為推斷統計往往是建立在邏輯嚴密的概率與統計理論上的,每種統計分析方法都受到一定條件的限制,例如,進行方差分析的前提條件是:總體服從正態分布、變異的相互獨立性、各實驗處理內的方差要一致。如果不能滿足某種統計分析方法的前提條件,原則上是不能進行這種分析的。在實際使用中,許多人往往不太關心前提條件的充分性,只在乎結果是否符合預期的目的。

  另外,因為理論假設一般都有嚴謹的邏輯結構,所以理論實驗模式對數據質量的要求比較高。數據質量是指數據的完整性、一致性、準確性。在數據收集過程中,被試可能會受到一些不相關因素的干擾,導致某些數據產生偏差。為了保證數據分析的科學性和合理性,必須進行前期的數據清理工作,主要是對錯誤或異常值、缺省值進行處理。

  (二)數據挖掘模式

  數據挖掘(Data Mining)指從大型數據庫中提取出有意義的、隱含的、先前未知并有潛在價值的信息或模式的非平凡過程[5]。這里的數據挖掘模式主要是指數據挖掘在教育領域中的應用。

  教育信息化的發展,特別是網絡教育資源的開發,導致教育領域的數據迅速增長,常規的數據分析方法已經很難應對海量的數據和復雜多變的數據類型。于是人們開始研究如何把已經成功應用于商業、金融業和市場營銷等領域的數據挖掘方法應用到教育領域中,目的是從教育大數據中挖掘出對教育者和學習者有用的信息,發現數據中隱藏的教育規律和模式,提高教育管理績效和學習效率。

  教育數據挖掘常用的技術方法有分類分析、聚類分析、貝葉斯模型、關系挖掘和用模型來發現數據中有意義的信息。

  在大數據時代到來之前,教育數據分析主要是屬于教育統計學的范疇,教育統計學是對教育現象進行定量分析的統計學與教育學互相融合的交叉學科,F在教育數據分析又與數據科學這個新興的研究領域產生融合。并且這種融合不僅僅是技術上的,還有思維上的。例如,數據挖掘應用于教育領域,不但豐富了教育數據分析的技術方法,也給教育數據分析帶來了新的視角。

  數據挖掘應用于教育領域的一個典型案例是在線學習系統的研究和開發。研究者通過采集學習者與在線學習系統的交互數據,包括學習者系統應答正確率、回答問題花費時間、請求幫助的數量和性質,以及錯誤應答的重復率等,這部分數據可以是課程層面的、學習單元層面的或知識點層面的。通過數據挖掘和分析,構建學習者知識模型,然后通過自動或人工反饋,為學習者在合適的時間,選擇合適的方式,提供合適的學習內容[6]。這方面的研究為將來實現大范圍的個性化學習提供了技術上的保障和發展的方向。這些學習者信息在傳統課堂中是很難收集的,并且如果不借助大數據的技術方法,很難從這些數據中挖掘出對學習者有用的信息。

  雖然數據挖掘在某些教育情境中的應用已經有成功的案例,但是數據挖掘在教育領域所產生的效益還遠遠比不上其在商業領域中的應用。因為教育領域許多對象的屬性難以量化描述,大多數量化信息也具有隱含性和模糊性,很多情況下即使通過數據挖掘能夠獲知學習者的行為方式,也很難解釋學習者產生這種行為的原因,從而提不出合理的預測和解決方案。這需要人們站在更高的層面來整合教育領域的知識、方法和行為,從可量化的角度去理解和分析教育的內在規律,才能使得數據挖掘更好地為教育教學服務。

  三、基于對象的分析及其使用

  基于對象的分析是指把相關的數據和方法組織為一個整體來看待,從更高的層次進行系統建模,使分析結果更貼近事物的自然運行模式。簡單來說,就是用什么數據和什么方式來描述和分析一個對象。對象可以是客觀世界中存在的人、事、物體等實體,也可以是行動或思考時的目標。對象可能包含各種屬性的指標、各種行為方式的一個或多個模型,關鍵是如何把這些構成統一的整體。從教育評價的角度,就是要關注活生生的人、把學?醋饕粋有機的整體。

  基于個別指標的分析主要是分析對象的某些屬性;基于模式的分析主要是分析對象的結構特征或某些行為方式。雖然基于模式的分析經常會建立各種模型,這些模型也可以看作一個對象,但很多時候建立模型(對象)不是最終目的,最終目的是這個模型是否能解釋或解決現實問題。而基于對象的分析不完全是為了解釋某些現象,主要是為了促進對象的發展。因此,與前面兩個層次相比,基于對象的分析更多的是觀念的提升,其次才是技術水平的提高。所以教育數據分析的第三個層次主要是回歸教育的本質,但這并不是拋開數據,回到經驗主義,而是在充分的數據分析的基礎上,思考如何培養人,如何促進人的發展。有些人可能認為這是數據分析結果使用者考慮的問題,數據分析只需提供相關結果。但筆者在實踐的過程中意識到,如果沒有經歷數據分析的過程,就很難對數據的內在聯系形成深刻的感受,從而很難產生對數據的洞察力。同樣,如果數據分析工作者不具備一定的教育學和心理學的學科素養,就很難理解教育數據背后的含義,從而導致數據結果很難說明問題。所以,只把教育專家和數據分析師撮合在一起很難解決教育領域的根本性問題。

  基于對象的分析在技術方面的提升主要是教育領域人工智能的研究及應用,也就是盡可能模擬人類的思維方式,使得數據分析盡可能接近人類認識世界、解決現實問題的方法和過程,呈現的結果盡可能與客觀世界中的實體相一致。但基于對象的分析也不是完全依托人工智能,因為人工智能側重的是機器模仿人類的思維方式解決現實中的問題,而不是讓機器來研究人如何培養。人工智能主要是在解決問題的方式和方法上給教育數據分析帶來新的視角,促使教育數據分析朝著智能化的方向發展,這樣產生的分析結果更加容易被人們接受。即使教育領域完全實現了智能化,關于人的發展的問題又將會面臨新的挑戰。因此,基于對象的分析不是在技術層面就能完全解決的問題。它是一個螺旋上升的過程,在這個過程中需要不斷提升理念,牢牢抓住問題的本質,綜合使用多種數據來源,從不同的角度對目標對象進行分析。雖然很多時候我們還不能對目標對象建立完全的模型,但是通過不同角度的綜合分析,我們可以對目標對象形成相對完整的感知,并在這個基礎上做出相對合理的判斷或決策。所以,基于對象的分析并不一定是要給目標對象建立一個獨立的模型,而是要以目標對象為中心開展相對全面的分析,并在分析的基礎上形成對目標對象的整體性認識或者認識的深化。

  目前,在教育領域中基于對象的分析的案例還比較少,但人們已經逐漸意識到這方面的重要性。例如,經濟合作與發展組織(OECD)在研究國際化的教育測評發展趨勢時指出:“評估和測量的全部潛力只有在框架被完全整合并被視為一個統一整體時,才能實現。這需要一個整體的方法來建立一個統一的評估和測評框架,以期在其組成部分之間產生協同作用,避免程序重復和目標不一。”[4]測評框架的整體性其實就是要以測評對象為中心,使用多種方法整合對象各方面的信息,做出整體上可靠的判斷。

  使用基于對象的分析的一個典型案例是智慧校園建設。智慧校園建設是以學校為對象,通過信息化手段有效集成、整合和優化校園內各類資源,實現資源的有效配置和充分利用、校務管理過程更優化協調。2018年6月,國家市場監督管理總局中國國家標準化管理委員會公布了《智慧校園總體框架(GB/T36342-2018)》,對智慧校園的總體架構及建設進行了明確規范。從文件中的智慧校園總體架構圖(如圖1所示)可以看出,數據處理與數據管理是總體架構的核心,為智慧校園的各類應用服務提供驅動和支持[8]。在智慧校園的總體架構中,數據分析是為了促進學校各組成部分的協同發展,而不僅僅是為了解決某一方面的問題。

  圖1 智慧校園總體架構圖
圖1 智慧校園總體架構圖

  面向未來的智慧校園是教育信息化發展的主要趨勢,但目前還處于技術實現階段。如果不站在較高的層次來審視教育領域的問題,那么很多技術性的工作只是達到提高效率的目的,而沒有解決人在高效的環境中如何更好發展的問題。例如,許多教育科技公司推出的智慧課堂對知識的呈現確實比傳統課堂要高效和豐富,課堂表現的反饋也更加及時。但學生對知識能內化多少、能力比以往是否有大的提升,這些很多時候只是停留在人們的想象中,還缺乏充分的實證研究。高效有時候帶來的只是疲于應對更多的信息來源,而沒有閑暇思考這些信息的內涵與功能。

  基于對象的分析要避免面面俱到的分析方式,類似于數學建模的過程,數學模型一般不是反映現實問題的一切具體特征,它的建立常常既需要人們對現實問題做細微的觀察和深入的分析,又需要人們對事物特征和變化規律進行簡化和抽象,使得模型更普遍、更集中、更深刻地描述事物的特征。面面俱到的分析往往容易使人糾結于一些非本質的細節,失去對主要關系的把握,從而覺得問題無章可循。

  四、結語

  本文主要是從教育數據分析的層次性角度理清技術、方法和觀念之間的關系。在實際應用中,這三個層次并沒有絕對的優劣之分,只是在不同的需求和情境中發揮各自的作用。例如,如果只是判斷一個學生的體重是否正常,可能基于這項指標的分析即可。另外,這三個層次通常是相互轉化、相互依存的。例如,基于模式的分析建立好一個預測模型后,在模型使用過程中,可能只需計算相應的指標值(或參數),然后代入模型即可進行預測;而基于對象的分析往往也需要計算各種指標值,或建立各種模型。

  無論人類社會發展到什么程度,都不可能完全解決人的發展的問題,從不同的方面、用不同的方式解決教育領域中的問題將是一個長期的過程。但在這個過程中,關注研究對象的整體性將對教育數據分析工作起到引領性的作用。

  教育數據分析的第三個層次主要是體現了教育領域的特殊性。與一般的商業行為不同,教育行為的最終指向是人的發展,而人的發展是一個緩慢且復雜的過程,很難有快速的投入產出模式。這是目前為什么很多大數據方法在教育領域沒有產生明顯效益的原因之一。而這里也關系到教育數據分析的人才需求和培養。在很多行業,做數據分析可能只要熟悉相關的業務,和掌握一定的大數據分析方法或工具即可。但在教育領域,只熟悉相關業務和掌握大數據分析方法或工具很多時候還不夠,必須要對人的發展規律有較廣泛的了解和深入思考,形成一定的教育直覺,才能從數據中分析出更多有用的信息。正如耶魯大學計量經濟學家伊恩·艾瑞斯所說:“超級大數據分析的崛起并不意味著直覺判斷的消亡,也不是說工作中累計的經驗不重要。相反,我們將看到一個嶄新的時代:最優秀、最聰明的人對于運用統計與直覺都游刃有余。”[9]例如,進行教育測評數據分析時,如果只是熟悉教育測評流程和數據統計要求,并掌握了相關的統計方法和工具,而對數據的內涵沒有深入的理解,可能得出的數據結果很難有效地說明問題或解決問題。當我們從培養的人的角度重新審視教育測評,就會發現很多結果不是那么絕對的,我們應該在結果相對可解釋的范圍內尋求改進教學的更有效的方法,而不是給事情下定性的結論。所以,教育數據分析的人才需求和培養必須結合教育領域的特殊性,才能充分發揮教育大數據的價值。

  在大數據時代,教育數據分析的涉及面將越來越廣,可能還有很多領域沒有關注到,筆者將在后續的研究中加以完善。

  參考文獻

  [1]United Nations Global Pulse.Big Data for Development:Challenges & Opportunities[DB/OL].(2012-05-01)[2019-11-25].http://www.unglobalpulse.org/sites/default/files/BigDataforDevelopme nt-UNGlobal Pulse June2012.pdf.
  [2](美)羅伯特·M.桑代克,特雷西·桑代克-克萊斯特.教育評價(第八版)[M].方群,吳瑞芬,陳志新,譯.北京:商務印書館,2018:399.
  [3] 教育部基礎教育質量監測中心.中國義務教育質量監測報告[R].北京,2018:1-9.
  [4][7]經濟合作與發展組織編.為了更好的學習---教育評價的國際新視野[M].竇衛霖,等譯.上海:上海教育出版社,2019:87,108.
  [5]李婷,傅鋼善.國內外教育數據挖掘研究現狀及趨勢分析[J].現代教育技術,2010(10):21-25.
  [6]徐鵬,王以寧,劉艷華,張海遠.大數據視角分析學習變革---美國《通過教育數據挖掘和學習分析促進教與學》報告解讀及啟示[J].遠程教育雜志,2013(6):11-17.
  [8]中國國家標準化管理委員會.智慧校園總體框架(GB/T36342-2018)[S].
  [9](美)伊恩·艾瑞斯.大數據思維與決策[M].宮相真,譯.北京:人民郵電出版社,2014:18.

    鄭煥.教育數據分析的層次性及其使用[J].教育導刊,2020(01):35-41.
      相關內容推薦
    相近分類:
    • 成都網絡警察報警平臺
    • 公共信息安全網絡監察
    • 經營性網站備案信息
    • 不良信息舉報中心
    • 中國文明網傳播文明
    • 學術堂_誠信網站
    河南11选5走势图vr彩票官网