摘要:在教育信息化1.0時代,各類信息系統(tǒng)積累了大量數(shù)據(jù),但同時也產(chǎn)生了一個個“信息孤島”。如何優(yōu)化數(shù)據(jù)使用環(huán)境、提升數(shù)據(jù)質(zhì)量、實(shí)現(xiàn)信息資源的互聯(lián)互通成為教育領(lǐng)域迫切需要解決的問題,而這也是教育信息化從1.0時代邁向2.0時代的必要條件。文章在回顧數(shù)據(jù)治理相關(guān)研究的基礎(chǔ)上,闡述了教育數(shù)據(jù)治理的必要性、主要面臨的問題以及實(shí)施路線,并以江西省教育廳為例,介紹了其在數(shù)據(jù)治理方面的具體實(shí)踐。
關(guān)鍵詞:數(shù)據(jù)治理;治理框架;方法論
近年來,隨著物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、5G網(wǎng)絡(luò)等新一代信息技術(shù)的發(fā)展和成熟,技術(shù)驅(qū)動教育變革的時代已經(jīng)到來,從數(shù)字教育向智慧教育的轉(zhuǎn)變正成為全球教育發(fā)展的主要趨勢。教育領(lǐng)域各類信息系統(tǒng)、媒介網(wǎng)每天都在持續(xù)記錄學(xué)生、教師日常教育活動的信息行為,引發(fā)教育數(shù)據(jù)規(guī)模的爆發(fā)式增長和數(shù)據(jù)類型不斷復(fù)雜化,但由于教育領(lǐng)域早期信息系統(tǒng)建設(shè)缺乏統(tǒng)一的標(biāo)準(zhǔn)規(guī)范指導(dǎo),導(dǎo)致系統(tǒng)數(shù)據(jù)分布散亂、質(zhì)量較低、集成共享困難等問題不斷凸顯,亟待開展數(shù)據(jù)治理活動加以解決。
1.數(shù)據(jù)治理的概念
對于數(shù)據(jù)治理的概念,目前國內(nèi)外學(xué)術(shù)界還未形成統(tǒng)一的定義。國外關(guān)于數(shù)據(jù)治理的研究文獻(xiàn)較多,也取得了良好的進(jìn)展,比較常見的以DGI(國際數(shù)據(jù)治理研究所)、DAMA(國際數(shù)據(jù)管理協(xié)會)、IBM DG Council(IBM數(shù)據(jù)治理委員會)等機(jī)構(gòu)提出的最具權(quán)威性。DGI認(rèn)為數(shù)據(jù)治理是與信息相關(guān)流程的權(quán)責(zé)體系,根據(jù)協(xié)商一致的模型確定誰在什么時間,依據(jù)什么方法對什么信息進(jìn)行什么樣的操作,并創(chuàng)造性地提出了由10項(xiàng)要素組成的DGI框架;DAMA則認(rèn)為,數(shù)據(jù)治理是一系列數(shù)據(jù)資產(chǎn)管理和控制活動的集合,并描述了數(shù)據(jù)治理的具體活動;IBM認(rèn)為,數(shù)據(jù)治理是通過對組織內(nèi)的人員、策略、流程和技術(shù)的最佳組合來持續(xù)優(yōu)化企業(yè)的數(shù)據(jù)資產(chǎn),以從企業(yè)數(shù)據(jù)中獲取最大價值的過程,并提出了一整套數(shù)據(jù)治理方法論。
國內(nèi)關(guān)于數(shù)據(jù)治理的研究起步雖然晚,但隨著數(shù)據(jù)被企業(yè)重視程度的不斷上升,數(shù)據(jù)質(zhì)量成為企業(yè)賴以生存的關(guān)鍵因素,而數(shù)據(jù)治理作為提升數(shù)據(jù)質(zhì)量的根本途徑,逐漸開始受到IT領(lǐng)域工作者們的重視。楊琳等認(rèn)為數(shù)據(jù)治理的本質(zhì)是對企業(yè)數(shù)據(jù)的管理和使用進(jìn)行指導(dǎo)、評價和監(jiān)管的過程,基于不斷創(chuàng)新的數(shù)據(jù)服務(wù)為企業(yè)創(chuàng)造價值;李青等認(rèn)為數(shù)據(jù)治理是關(guān)于數(shù)據(jù)管理的綜合實(shí)踐,并從標(biāo)準(zhǔn)體系、技術(shù)體系、管理體系三個維度對數(shù)據(jù)治理實(shí)踐進(jìn)行了描述;孫嘉睿認(rèn)為數(shù)據(jù)治理是在多重機(jī)制保障下,確保數(shù)據(jù)管理活動始終保持規(guī)范可控的狀態(tài)。
綜合上述概念,筆者認(rèn)為數(shù)據(jù)治理是在組織領(lǐng)導(dǎo)下,基于制度章程和技術(shù)平臺,圍繞企業(yè)數(shù)據(jù)資產(chǎn)開展的一系列管理活動,是數(shù)據(jù)全生命周期的管理,其價值在于通過一整套治理體系對數(shù)據(jù)資源進(jìn)行規(guī)劃、使用和監(jiān)督,從而降低企業(yè)數(shù)據(jù)的產(chǎn)出成本,提升數(shù)據(jù)質(zhì)量,為企業(yè)帶來更多的競爭優(yōu)勢。
2.教育數(shù)據(jù)治理現(xiàn)狀研究
我國教育行業(yè)經(jīng)過十余年的信息化建設(shè),目前大部分教育行政主管部門和學(xué)校已完成教育網(wǎng)絡(luò)、信息系統(tǒng)和網(wǎng)上辦事服務(wù)大廳的建設(shè)。在建設(shè)初期,由于缺少一個組織從教育全局視角對數(shù)據(jù)進(jìn)行規(guī)劃和管理,各部門根據(jù)自身業(yè)務(wù)發(fā)展和社會需求,逐步建立了一批信息系統(tǒng),系統(tǒng)的運(yùn)行產(chǎn)生了大量教育數(shù)據(jù),但普遍存在數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范缺失、數(shù)據(jù)質(zhì)量低下、數(shù)據(jù)集成與共享程度不足、缺乏數(shù)據(jù)全生命周期管理、數(shù)據(jù)挖掘與應(yīng)用力度不足等問題,這些問題嚴(yán)重影響了教育大數(shù)據(jù)平臺的建設(shè)和政務(wù)數(shù)據(jù)的公開共享。因此需要結(jié)合教育行業(yè)的個性化需求,建立一套以用戶為中心的數(shù)據(jù)治理體系來管理數(shù)據(jù),幫助教育行業(yè)快速完成數(shù)字化轉(zhuǎn)型。
?。?)教育領(lǐng)域研究現(xiàn)狀
與其他行業(yè)相比,教育領(lǐng)域數(shù)據(jù)治理的研究才剛剛起步,且主要集中在高等教育階段。章浩等闡述并總結(jié)了目前高校數(shù)據(jù)治理的研究現(xiàn)狀和實(shí)施思路,并以同濟(jì)大學(xué)為例,介紹了其在數(shù)據(jù)治理方面的具體實(shí)踐;彭雪峰等通過案例分析對美國高校數(shù)據(jù)治理工作的實(shí)施背景、核心要素及實(shí)踐特點(diǎn)進(jìn)行了總結(jié),以期對我國高校數(shù)據(jù)治理實(shí)踐的開展提供參考和借鑒;李青等通過借鑒數(shù)據(jù)治理先發(fā)領(lǐng)域的成功經(jīng)驗(yàn),總結(jié)出數(shù)據(jù)治理的方法和實(shí)現(xiàn)路徑,進(jìn)而針對教育行業(yè)的實(shí)際特點(diǎn)提出了一套由組織機(jī)制、業(yè)務(wù)領(lǐng)域、技術(shù)及平臺組成的教育數(shù)據(jù)治理框架;許曉東等通過案例分析闡述了數(shù)據(jù)治理是如何提高大學(xué)教育質(zhì)量和管理效率的,并以“全國高校教學(xué)基本狀態(tài)數(shù)據(jù)庫系統(tǒng)”為例介紹了高等教育數(shù)據(jù)治理的實(shí)施過程;吳剛從基礎(chǔ)價值和具體價值兩個方面對高校大數(shù)據(jù)治理的價值結(jié)構(gòu)進(jìn)行了概括,兩者相輔相成,共同促進(jìn)高校治理體系和治理能力的現(xiàn)代化。
?。?)教育領(lǐng)域?qū)嵺`現(xiàn)狀
鑒于數(shù)據(jù)治理在電子政務(wù)、醫(yī)療健康、金融等行業(yè)取得的突出成效,教育領(lǐng)域也陸續(xù)開始實(shí)施數(shù)據(jù)治理并積累了一些經(jīng)典案例。
2018年,教育部印發(fā)《教育信息化2.0行動計劃》以推進(jìn)新時代教育信息化發(fā)展,其中“教育治理能力優(yōu)化行動”指出要以“互聯(lián)互通、信息共享、業(yè)務(wù)協(xié)同”為發(fā)展目標(biāo),打破數(shù)據(jù)壁壘,推進(jìn)教育政務(wù)信息系統(tǒng)整合以及政務(wù)數(shù)據(jù)分級分層有效共享。麻省理工學(xué)院以規(guī)范和制度為約束、工具為輔助、系統(tǒng)為支撐,提出了全面數(shù)據(jù)質(zhì)量管理體系(MIT-TDQM),從數(shù)據(jù)產(chǎn)生、傳輸、使用等各環(huán)節(jié)發(fā)現(xiàn)數(shù)據(jù)質(zhì)量問題并及時進(jìn)行治理,防止問題的重復(fù)出現(xiàn),從而有效地提升了學(xué)校數(shù)據(jù)質(zhì)量。圣母大學(xué)基于“質(zhì)量及一致性”、“政策和標(biāo)準(zhǔn)”、“安全與隱私”、“合規(guī)”、“保存與歸檔”五項(xiàng)基本原則對數(shù)據(jù)進(jìn)行全生命周期管理,旨在向有業(yè)務(wù)需求的個人或組織,提供及時、可靠的教育數(shù)據(jù)。美國堪薩斯州的教育數(shù)據(jù)管理部門根據(jù)EDEN的數(shù)據(jù)需求和標(biāo)準(zhǔn)格式,制定了一整套數(shù)據(jù)采集和轉(zhuǎn)換規(guī)范,對各類教育數(shù)據(jù)進(jìn)行采集,并定期評估數(shù)據(jù)質(zhì)量,有效地解決了之前向EDEN上報數(shù)據(jù)時數(shù)據(jù)質(zhì)量差、格式不統(tǒng)一、傳輸時間慢的問題。華中農(nóng)業(yè)大學(xué)基于微服務(wù)架構(gòu),以大數(shù)據(jù)和互聯(lián)網(wǎng)架構(gòu)的智慧校園平臺結(jié)構(gòu)為基礎(chǔ),對現(xiàn)有數(shù)據(jù)中心進(jìn)行全面升級改造,構(gòu)建了全新的高校數(shù)據(jù)中心軟件平臺及數(shù)據(jù)治理體系,實(shí)現(xiàn)了各部門之間的業(yè)務(wù)協(xié)同和信息融合。北京建筑大學(xué)通過數(shù)據(jù)匯聚、統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)清洗轉(zhuǎn)換、數(shù)據(jù)質(zhì)量稽核、數(shù)據(jù)API服務(wù)、數(shù)據(jù)可視化分析等一系列流程優(yōu)化全校數(shù)據(jù)環(huán)境,為學(xué)校大數(shù)據(jù)挖掘分析提供了有利條件。江南大學(xué)以“治理服務(wù)”為核心,通過調(diào)研咨詢和服務(wù)實(shí)施,實(shí)現(xiàn)了校內(nèi)數(shù)據(jù)可見、可用和數(shù)據(jù)質(zhì)量的溯源提升,再通過數(shù)據(jù)開放平臺實(shí)現(xiàn)數(shù)據(jù)的統(tǒng)一開放和管控,大大降低了各方進(jìn)行數(shù)據(jù)對接的成本,實(shí)現(xiàn)了數(shù)據(jù)“一次治理、多次使用”。
1.教育數(shù)據(jù)治理面臨的問題
當(dāng)前,我國的教育信息化正處在一個歷史時期——從1.0時代邁向2.0時代,這是基于教育信息化歷史成就基礎(chǔ)上的一次全新跨越?!叭珒筛咭淮蟆钡陌l(fā)展目標(biāo)離不開“數(shù)據(jù)”的強(qiáng)力支持,數(shù)字資源服務(wù)普及行動、教育治理能力優(yōu)化行動的落地都對教育數(shù)據(jù)的全面性、有效性和可共享提出了更高的要求,亟待加強(qiáng)數(shù)據(jù)治理。國內(nèi)教育領(lǐng)域的數(shù)據(jù)治理雖然已經(jīng)積累了一定成果,但從整體上看,仍存在以下問題。
?。?)數(shù)據(jù)治理保障機(jī)制缺失
數(shù)據(jù)治理作為一項(xiàng)龐大而復(fù)雜的工程,離不開領(lǐng)導(dǎo)層的支持以及各部門、各層級之間的相互支持和協(xié)作。在教育領(lǐng)域,多數(shù)系統(tǒng)的開發(fā)建設(shè)和管理職能分散在各個不同的部門,致使數(shù)據(jù)來源不明確、權(quán)責(zé)邊界模糊不清的現(xiàn)象出現(xiàn),由于缺少一個基于全局視角對數(shù)據(jù)采集、傳輸、使用進(jìn)行管理的組織,致使數(shù)據(jù)治理工作不被重視。即使部分教育行政部門和高校建立了數(shù)據(jù)治理組織架構(gòu),但由于缺少配套的管理制度、流程和認(rèn)責(zé)管理機(jī)制,數(shù)據(jù)治理工作也得不到有效推進(jìn)。
?。?)數(shù)據(jù)資產(chǎn)不清晰
盡管教育行業(yè)經(jīng)過多年的信息化發(fā)展,積累了海量數(shù)據(jù),但由于專業(yè)化管理的需要,數(shù)據(jù)分布于不同的業(yè)務(wù)系統(tǒng)中。從業(yè)務(wù)視角出發(fā),所有數(shù)據(jù)都不是孤立存在的,數(shù)據(jù)的生產(chǎn)到數(shù)據(jù)歸檔以及數(shù)據(jù)的流向,反映了業(yè)務(wù)流程的輸入輸出。全方位的業(yè)務(wù)梳理以及數(shù)據(jù)資產(chǎn)盤點(diǎn)工作的缺失,致使很多教育部門無法準(zhǔn)確回答單位內(nèi)部的數(shù)據(jù)全貌、數(shù)據(jù)的格式、數(shù)據(jù)與業(yè)務(wù)之間的關(guān)系、數(shù)據(jù)發(fā)揮的效用等一系列問題,更無法有效判斷數(shù)據(jù)中心是否存儲了解決自身所面臨業(yè)務(wù)問題的關(guān)鍵數(shù)據(jù),這一現(xiàn)象在高校更是屢見不鮮。
?。?)缺乏統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)
數(shù)據(jù)標(biāo)準(zhǔn)缺失是從傳統(tǒng)數(shù)據(jù)倉庫建設(shè)以來就存在的問題,只是在大數(shù)據(jù)時代這一問題更加凸顯。教育信息化1.0時期,由于缺乏統(tǒng)一的信息系統(tǒng)建設(shè)標(biāo)準(zhǔn)規(guī)范,造成信息系統(tǒng)之間各自為政,所謂“信息孤島”形成?!靶畔⒐聧u”的形成導(dǎo)致了不同部門對同一事物的認(rèn)知存在差異,主要表現(xiàn)為不同部門在進(jìn)行數(shù)據(jù)統(tǒng)計時,由于統(tǒng)計口徑、加工方法的不同,導(dǎo)致報表結(jié)果相差甚遠(yuǎn),歸根結(jié)底還是數(shù)據(jù)標(biāo)準(zhǔn)不一致造成的。數(shù)據(jù)標(biāo)準(zhǔn)化作為教育數(shù)據(jù)中心建設(shè)中的一個重要環(huán)節(jié),能夠統(tǒng)一業(yè)務(wù)部門和技術(shù)部門對數(shù)據(jù)定義和使用的一致性,促進(jìn)各部門數(shù)據(jù)的有序共享。
(4)數(shù)據(jù)質(zhì)量不高
隨著教育信息系統(tǒng)復(fù)雜程度的不斷增加以及全域數(shù)據(jù)量的逐步擴(kuò)增,教育行業(yè)對全域數(shù)據(jù)價值的重視達(dá)到了前所未有的高度,尤其是在構(gòu)建全域數(shù)據(jù)中心、提供靈活的數(shù)據(jù)查詢、教育數(shù)據(jù)深度挖掘、數(shù)據(jù)相關(guān)運(yùn)營等需求上。而這些需求都離不開高質(zhì)量的數(shù)據(jù)支撐。目前,教育行業(yè)普遍缺乏專業(yè)的數(shù)據(jù)質(zhì)量管理團(tuán)隊以及相配套的制度,缺乏統(tǒng)一的,包括問題識別、分析評估、跟蹤治理、監(jiān)控預(yù)警的閉環(huán)管理流程,無法保證數(shù)據(jù)的質(zhì)量,無法從源頭發(fā)現(xiàn)質(zhì)量問題并解決。比較典型的就是系統(tǒng)操作員在信息錄入時操作錯誤,從而造成學(xué)生信息缺失或錯誤;又如信息系統(tǒng)在設(shè)計之初沒有對關(guān)鍵信息項(xiàng)進(jìn)行質(zhì)量控制,致使很多數(shù)據(jù)分析挖掘的結(jié)論不準(zhǔn)確。
(5)數(shù)據(jù)融合共享困難
在大數(shù)據(jù)時代,教育行業(yè)雖然擁有眾多的信息系統(tǒng)和海量的數(shù)據(jù),但信息之間的關(guān)聯(lián)性較弱,導(dǎo)致數(shù)據(jù)之間的融合共享困難。面對這些紛繁雜亂的數(shù)據(jù),難以深入挖掘隱藏于數(shù)據(jù)之后的規(guī)律和趨勢,無法形成數(shù)據(jù)整體視圖,更無法實(shí)現(xiàn)數(shù)據(jù)價值的最大化、支持教育重要決策。例如,各部門由于管理業(yè)務(wù)的需要,有時需要用到其他部門生成的數(shù)據(jù),但在實(shí)際協(xié)調(diào)工作中經(jīng)常會遇到數(shù)據(jù)“黑盒”現(xiàn)象,即:不知道所需要的數(shù)據(jù)是否存在,存在于什么地方,如何登錄、獲取并使用。
?。?)數(shù)據(jù)難以利用
在傳統(tǒng)數(shù)據(jù)倉庫建設(shè)時期,技術(shù)部門為了響應(yīng)業(yè)務(wù)部門的需求,需要把相對應(yīng)的業(yè)務(wù)流程、數(shù)據(jù)、技術(shù)工具歸并出來,做一個整合再提供給業(yè)務(wù)部門,通常這個數(shù)據(jù)提取過程需要漫長的開發(fā)周期,導(dǎo)致業(yè)務(wù)分析需求很難被快速滿足。而在數(shù)字經(jīng)濟(jì)時代,業(yè)務(wù)部門對數(shù)據(jù)需求發(fā)生了明顯變化,他們需要進(jìn)一步明晰數(shù)據(jù)是什么,單位內(nèi)部存儲了哪些核心數(shù)據(jù),并追求針對某個業(yè)務(wù)問題的快速分析。但是現(xiàn)實(shí)中,多數(shù)教育部門即使知道響應(yīng)自身業(yè)務(wù)所需的數(shù)據(jù)類型,也不能便捷自助地拿到數(shù)據(jù),漫長的需求響應(yīng)時間讓他們難以接受。
2.教育數(shù)據(jù)治理的必要性
?。?)解決數(shù)據(jù)不可知
數(shù)據(jù)治理通過全面梳理教育領(lǐng)域的業(yè)務(wù)版塊和數(shù)據(jù)資產(chǎn),將分散在不同信息系統(tǒng)、不同技術(shù)平臺、不同人員中的元數(shù)據(jù)信息進(jìn)行統(tǒng)一管理,并形成全量數(shù)據(jù)資產(chǎn)地圖,幫助教育部門全面掌握單位內(nèi)部數(shù)據(jù)模型、數(shù)據(jù)流向以及依賴關(guān)系,從而實(shí)現(xiàn)從業(yè)務(wù)層面到技術(shù)層面的全面貫通,達(dá)到理清教育數(shù)據(jù)資產(chǎn)的效果,破解數(shù)據(jù)不可知的難題。
?。?)解決數(shù)據(jù)不可控
數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范的缺失使得數(shù)據(jù)難以集成和統(tǒng)一,同樣缺乏質(zhì)量控制導(dǎo)致海量數(shù)據(jù)因質(zhì)量低下而難以利用。數(shù)據(jù)標(biāo)準(zhǔn)可以在業(yè)務(wù)、技術(shù)、管理上給教育事業(yè)提供支撐,通過數(shù)據(jù)標(biāo)準(zhǔn)體系的建設(shè),可以統(tǒng)一數(shù)據(jù)的業(yè)務(wù)含義,使得不同業(yè)務(wù)部門之間,以及業(yè)務(wù)與技術(shù)人員之間的溝通更加流暢,避免歧義。另外,搭建一套覆蓋數(shù)據(jù)問題發(fā)現(xiàn)、評估、處理、跟蹤等流程的數(shù)據(jù)質(zhì)量管理體系,可以不斷提高數(shù)據(jù)質(zhì)量,為教育決策支持、教育精細(xì)化管理等提供更為深入可信的數(shù)據(jù)。
?。?)解決數(shù)據(jù)不可聯(lián)
數(shù)據(jù)作為信息的載體,對教育信息化的推進(jìn)具有至關(guān)重要的作用,它就像“血液”一樣為各業(yè)務(wù)系統(tǒng)提供能量。數(shù)據(jù)不僅要在生產(chǎn)系統(tǒng)內(nèi)流轉(zhuǎn),還要在教育領(lǐng)域中有需求的系統(tǒng)中流轉(zhuǎn)。為此,只有將分散在各業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)打通,突破“信息孤島”,基于統(tǒng)一標(biāo)準(zhǔn)規(guī)范實(shí)現(xiàn)數(shù)據(jù)共享共用,才能為教育政務(wù)信息系統(tǒng)的整合提供重要的基礎(chǔ),才能滿足不同時期、不同業(yè)務(wù)部門的實(shí)際需求。
?。?)解決數(shù)據(jù)不可取
教育信息化2.0時代,數(shù)據(jù)管理要從“管控型”向面向各類教育群體的“服務(wù)型”轉(zhuǎn)變,即在高效管理數(shù)據(jù)的同時,為有需求的群體提供自助獲取大數(shù)據(jù)的能力。數(shù)據(jù)是對事物的客觀描述,只有被用到具體業(yè)務(wù)場景中才能發(fā)揮其最大效用。深入利用已經(jīng)治理“好”的教育數(shù)據(jù),結(jié)合大數(shù)據(jù)挖掘分析技術(shù),持續(xù)分析并優(yōu)化現(xiàn)有服務(wù),使各類教育群體能自助地探知數(shù)據(jù)的價值。
通過對教育數(shù)據(jù)治理的現(xiàn)狀分析可知,數(shù)據(jù)治理保障機(jī)制缺失、數(shù)據(jù)資產(chǎn)不清晰、缺乏統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量差、數(shù)據(jù)融合共享困難以及數(shù)據(jù)難以利用是教育領(lǐng)域開展數(shù)據(jù)治理面臨的首要挑戰(zhàn)。為了有效解決這些問題,筆者借鑒數(shù)據(jù)治理先發(fā)領(lǐng)域的成功經(jīng)驗(yàn),提出了一個“三橫三縱”的適用于教育領(lǐng)域數(shù)據(jù)治理的框架,具體如圖1所示。三橫是數(shù)據(jù)治理的治理域,包括治理基礎(chǔ)、治理核心、數(shù)據(jù)服務(wù)三個部分的內(nèi)容;三縱則展示了數(shù)據(jù)治理的保障機(jī)制,由管理制度、組織架構(gòu)和治理流程構(gòu)成。該框架以治理目標(biāo)為指導(dǎo),在數(shù)據(jù)治理保障機(jī)制的支撐下,通過一系列數(shù)據(jù)治理活動建立起數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,從而滿足數(shù)據(jù)完整性、一致性、有效性和安全性的需求,為教育管理決策、教育教學(xué)評價提供精準(zhǔn)支撐。
圖1 教育數(shù)據(jù)治理框架
1.治理目標(biāo)
大數(shù)據(jù)時代,數(shù)據(jù)戰(zhàn)略是教育發(fā)展戰(zhàn)略中的重要組成部分,它涵蓋了發(fā)展目標(biāo)、發(fā)展規(guī)劃等一系列內(nèi)容,是指導(dǎo)數(shù)據(jù)治理工作的最高原則。筆者認(rèn)為,教育數(shù)據(jù)治理的目標(biāo)應(yīng)該是通過“終身一人一號”體系建設(shè),逐步實(shí)現(xiàn)以“人”為單位歸集各類高質(zhì)量的教育數(shù)據(jù)。這里的“人”既可以是以學(xué)生和教師為代表的自然人,也可以是以學(xué)校為代表的法人。只有教育數(shù)據(jù)中心的數(shù)據(jù)規(guī)模夠龐大,數(shù)據(jù)種類夠豐富,才能更好地支撐教育大數(shù)據(jù)分析的需求,實(shí)現(xiàn)基于數(shù)據(jù)的教育決策。
2.治理保障機(jī)制
教育數(shù)據(jù)治理工作的開展和推進(jìn)離不開組織、制度以及流程三方面的保障。數(shù)據(jù)治理作為一項(xiàng)全面而又復(fù)雜的工程,需要教育各部門的通力協(xié)作,因此設(shè)置與之相對應(yīng)的組織架構(gòu),組建專門的管理團(tuán)隊是數(shù)據(jù)治理成功的基礎(chǔ)??茖W(xué)的數(shù)據(jù)治理組織架構(gòu)一般由決策層、管理層和執(zhí)行層構(gòu)成,決策層負(fù)責(zé)確立數(shù)據(jù)治理的目標(biāo)、方針以及政策,以確保數(shù)據(jù)治理活動得到教育系統(tǒng)各部門的支持;管理層負(fù)責(zé)承擔(dān)數(shù)據(jù)治理的日常管理工作,并定期向決策層匯報治理進(jìn)展;執(zhí)行層根據(jù)組織確立的目標(biāo),負(fù)責(zé)推動各自業(yè)務(wù)條線的數(shù)據(jù)治理活動,并定期評估治理成效。教育數(shù)據(jù)治理制度從類型上可分為章程、管理辦法、考核機(jī)制。章程是數(shù)據(jù)治理的指導(dǎo)總綱,主要用于闡明數(shù)據(jù)治理的工作目標(biāo)、實(shí)施內(nèi)容以及職責(zé)分工;管理辦法是章程與技術(shù)平臺相結(jié)合后可落地的操作辦法,是對數(shù)據(jù)治理各領(lǐng)域工作內(nèi)容與工作要求的闡述;僅僅有章程、管理辦法還不能保證數(shù)據(jù)治理工作在教育領(lǐng)域的持續(xù)推進(jìn),必須建立多層次的考核機(jī)制,將數(shù)據(jù)治理工作納入各部門的績效考核中,所有制度才有可能得到執(zhí)行。流程包括數(shù)據(jù)治理實(shí)施過程的工作環(huán)節(jié)、步驟和程序,是數(shù)據(jù)治理組織得以高效運(yùn)作的基礎(chǔ)。綜合金融行業(yè)數(shù)據(jù)治理的成功經(jīng)驗(yàn),一個完整的數(shù)據(jù)治理流程包含前期預(yù)防、過程監(jiān)控、事后整治及反饋三個階段。
3.治理域
治理域描述了數(shù)據(jù)治理過程中涉及的關(guān)鍵IT活動,主要包括數(shù)據(jù)標(biāo)準(zhǔn)、主數(shù)據(jù)、數(shù)據(jù)模型、元數(shù)據(jù)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)資源目錄、數(shù)據(jù)安全、數(shù)據(jù)生命周期以及數(shù)據(jù)服務(wù)等內(nèi)容。數(shù)據(jù)標(biāo)準(zhǔn)是經(jīng)業(yè)務(wù)與技術(shù)部門協(xié)商一致制定,對各項(xiàng)業(yè)務(wù)信息進(jìn)行統(tǒng)一定義與解釋的一種規(guī)范性文件,通過數(shù)據(jù)標(biāo)準(zhǔn)體系的建設(shè),可以增強(qiáng)單位各部門對業(yè)務(wù)的統(tǒng)一理解,促進(jìn)各信息系統(tǒng)數(shù)據(jù)的互聯(lián)互通;數(shù)據(jù)模型既是數(shù)據(jù)治理的基礎(chǔ)性環(huán)節(jié),也是數(shù)據(jù)治理的關(guān)鍵、重點(diǎn),主要用于描述數(shù)據(jù)的類型、內(nèi)容、數(shù)據(jù)間的依賴關(guān)系等內(nèi)容,統(tǒng)一、穩(wěn)定的數(shù)據(jù)模型有利于維持?jǐn)?shù)據(jù)中心穩(wěn)定,統(tǒng)一業(yè)務(wù)概念;數(shù)據(jù)資源目錄的建立是教育部門對其數(shù)據(jù)資產(chǎn)進(jìn)行摸清家底的必由之路,可以為教育大數(shù)據(jù)資源的有序開放、共享交換和多元應(yīng)用打下堅實(shí)基礎(chǔ);元數(shù)據(jù)主要描述了數(shù)據(jù)結(jié)構(gòu)、內(nèi)容、流向等對象的具體規(guī)則,是數(shù)據(jù)治理的重要基礎(chǔ),通過元數(shù)據(jù)管理,能夠可視化瀏覽教育數(shù)據(jù)資產(chǎn)整體視圖,為數(shù)據(jù)問題定位、影響分析、血緣分析提供支撐;主數(shù)據(jù)管理是對教育領(lǐng)域最核心的業(yè)務(wù)數(shù)據(jù)進(jìn)行集中清洗和規(guī)范管理,并最終形成統(tǒng)一的、規(guī)范的、完整的主數(shù)據(jù)庫過程,用于支撐各類業(yè)務(wù)系統(tǒng)對數(shù)據(jù)的重復(fù)使用;數(shù)據(jù)生命周期管理規(guī)范了業(yè)務(wù)數(shù)據(jù)在不同階段的保留時長、清理策略以及歸檔方式等內(nèi)容,數(shù)據(jù)清理、轉(zhuǎn)移、歸檔策略的實(shí)施以及對實(shí)施效果的評價是數(shù)據(jù)生命周期管理的最佳實(shí)踐;高質(zhì)量的數(shù)據(jù)是教育部門進(jìn)行業(yè)務(wù)拓展、決策分析的重要基礎(chǔ),只有構(gòu)建全面管控的數(shù)據(jù)質(zhì)量管理體系,才能持續(xù)提升和改進(jìn)教育部門數(shù)據(jù)的整體質(zhì)量,從而更好地服務(wù)各類教育業(yè)務(wù);教育事業(yè)的健康發(fā)展離不開數(shù)據(jù)安全,因此對數(shù)據(jù)存儲環(huán)境、數(shù)據(jù)傳輸機(jī)制以及數(shù)據(jù)使用過程中的安全管理是至關(guān)重要的;教育部門通過數(shù)據(jù)治理,保證了數(shù)據(jù)作為資產(chǎn)的價值,但要發(fā)揮數(shù)據(jù)資產(chǎn)的效用,還需要一個滿足不同場景下數(shù)據(jù)需求的數(shù)據(jù)服務(wù)平臺,涉及數(shù)據(jù)交換/共享、數(shù)據(jù)接口、BI報表等內(nèi)容。
2017年,國家推動大數(shù)據(jù)戰(zhàn)略,加快推進(jìn)教育現(xiàn)代化建設(shè)。面對新的形勢和挑戰(zhàn),江西省教育管理信息中心(以下簡稱“信息中心”)提出了從技術(shù)中心回歸信息中心,從信息中心逐步發(fā)展成智慧中心的戰(zhàn)略,緊緊圍繞教育數(shù)據(jù)建設(shè),著力培養(yǎng)數(shù)據(jù)歸集、處理、分析能力,積極將教育數(shù)據(jù)融入教育治理大環(huán)境,構(gòu)建開放的數(shù)據(jù)生態(tài)體系,為教育管理提供決策依據(jù),服務(wù)教育創(chuàng)新發(fā)展。
1.構(gòu)建數(shù)據(jù)治理工作機(jī)制
為充分發(fā)揮教育大數(shù)據(jù)在輔助教育科學(xué)決策中的重要作用,信息中心在全國范圍內(nèi)率先出臺《江西省教育廳數(shù)據(jù)管理暫行辦法》,將數(shù)據(jù)視為教育廳重要的無形資產(chǎn)并統(tǒng)一管理。通過搭建由數(shù)據(jù)生成部門、數(shù)據(jù)管理部門和數(shù)據(jù)使用部門組成的數(shù)據(jù)管理架構(gòu),明確了各部門在數(shù)據(jù)管理組織中的角色和職責(zé)。另外,還編制發(fā)布了《江西省教育廳教育數(shù)據(jù)治理專項(xiàng)方案》和《江西省教育廳數(shù)據(jù)管理制度與流程》,指出了數(shù)據(jù)治理核心領(lǐng)域的主要工作環(huán)節(jié)和工作內(nèi)容,為各部門數(shù)據(jù)治理工作的開展提供了參考依據(jù)。
2.推動數(shù)據(jù)資源整合匯聚
近兩年,信息中心積極運(yùn)用信息化手段,通過對各業(yè)務(wù)部門數(shù)據(jù)資產(chǎn)的調(diào)研梳理出47類核心教育數(shù)據(jù),其中既包括全省1050萬各級各類學(xué)生電子學(xué)籍?dāng)?shù)據(jù)、全省66.4萬貧困學(xué)生數(shù)據(jù)、全省62萬各級各類教師信息數(shù)據(jù)、全省3.5萬各類學(xué)校基建統(tǒng)計數(shù)據(jù)、全省本專科院校專業(yè)設(shè)置數(shù)據(jù)等面向教育管理決策的大數(shù)據(jù),也包括全省高校人文社會科學(xué)研究項(xiàng)目數(shù)據(jù)、全省高校科學(xué)技術(shù)研究項(xiàng)目數(shù)據(jù)、全省教育科學(xué)規(guī)劃研究數(shù)據(jù),還包括全省各級各類考生的報名數(shù)據(jù)、體檢數(shù)據(jù)、考試分?jǐn)?shù)、錄取數(shù)據(jù)等,逐步實(shí)現(xiàn)了各類數(shù)據(jù)匯聚至信息中心并建成了由學(xué)生主題庫、教師主題庫、機(jī)構(gòu)及辦學(xué)條件主題庫組成的省級教育數(shù)據(jù)倉庫,確立了數(shù)據(jù)統(tǒng)計、上報、交換、展示、挖掘分析的唯一官方數(shù)據(jù)源,為教育管理和教育決策提供了有效的數(shù)據(jù)支撐。
3.實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)可視化管理
為發(fā)揮全省教育數(shù)據(jù)的更大作用,方便有關(guān)單位使用教育數(shù)據(jù),信息中心全面梳理了省級教育數(shù)據(jù)倉庫的數(shù)據(jù)架構(gòu),將數(shù)據(jù)倉庫中數(shù)據(jù)模型、數(shù)據(jù)流向以及數(shù)據(jù)處理過程制成清晰的圖表,把數(shù)據(jù)資產(chǎn)變成多角度視圖,以可視化的方式向用戶提供多維數(shù)據(jù)展示,并支持血緣分析、影響分析、指標(biāo)一致性等元數(shù)據(jù)分析功能。同時,搭建了江西省教育廳數(shù)據(jù)治理平臺,面向用戶提供統(tǒng)一集中展現(xiàn)查詢的平臺,相關(guān)單位通過圖表、字段檢索的方式即可找到需要的數(shù)據(jù)模型及模型詳情。
4.建成全省統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)
2017年起,信息中心作為牽頭單位,依據(jù)教育部《教育信息化行業(yè)標(biāo)準(zhǔn)》,從頂層設(shè)計出發(fā),完成了教育數(shù)據(jù)標(biāo)準(zhǔn)主題定義、標(biāo)準(zhǔn)信息項(xiàng)、標(biāo)準(zhǔn)代碼等文檔的設(shè)計工作,先后編制發(fā)布了《江西省教育廳數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范》《江西省教育廳數(shù)據(jù)資源目錄》,建立了一套由內(nèi)容標(biāo)準(zhǔn)、技術(shù)規(guī)范以及使用流程共同組成的教育數(shù)據(jù)標(biāo)準(zhǔn)體系。其中,在標(biāo)準(zhǔn)落地階段,不僅將已定義的數(shù)據(jù)標(biāo)準(zhǔn)與業(yè)務(wù)系統(tǒng)、數(shù)據(jù)倉庫進(jìn)行映射,實(shí)現(xiàn)了數(shù)據(jù)關(guān)系的轉(zhuǎn)換;還確立了以《江西省教育廳數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范》為核心的信息系統(tǒng)建設(shè)標(biāo)準(zhǔn)規(guī)范,指導(dǎo)后續(xù)信息系統(tǒng)以及數(shù)據(jù)平臺的建設(shè)。同時在全周期實(shí)施過程中,不斷地驗(yàn)證和修訂數(shù)據(jù)標(biāo)準(zhǔn),使得數(shù)據(jù)標(biāo)準(zhǔn)能一直適應(yīng)教育新業(yè)務(wù)的發(fā)展需要。
5.逐步提升教育數(shù)據(jù)質(zhì)量
基于對元數(shù)據(jù)的梳理,信息中心理清了教育數(shù)據(jù)倉庫中核心數(shù)據(jù)的質(zhì)量現(xiàn)狀,并根據(jù)數(shù)據(jù)優(yōu)先級制定出一套數(shù)據(jù)質(zhì)量管理規(guī)范。技術(shù)層面上完整地定義了數(shù)據(jù)質(zhì)量評估維度,包括完整性、時效性、唯一性、正確性等。根據(jù)數(shù)據(jù)質(zhì)量稽核目標(biāo)和策略要求,分類制定了數(shù)據(jù)質(zhì)量稽核規(guī)則,通過部署稽核規(guī)則,數(shù)據(jù)質(zhì)量管理系統(tǒng)可以對數(shù)據(jù)倉庫新增或存量數(shù)據(jù)進(jìn)行掃描,篩選出問題數(shù)據(jù)并按照不同維度進(jìn)行存儲,支持用戶查看和下載。問題數(shù)據(jù)庫提供查詢統(tǒng)計功能,使用戶了解到當(dāng)期新增問題數(shù)據(jù)量以及待修改問題數(shù)據(jù)量。自數(shù)據(jù)質(zhì)量管理規(guī)范實(shí)施以來,省級教育數(shù)據(jù)倉庫的數(shù)據(jù)質(zhì)量得到了顯著提升。
6.滿足不同場景數(shù)據(jù)需求
為提高教育數(shù)據(jù)使用效率,信息中心以業(yè)務(wù)部門的數(shù)據(jù)需求為出發(fā)點(diǎn),通過由BI報表、數(shù)據(jù)交換/共享、數(shù)據(jù)API接口構(gòu)成的數(shù)據(jù)服務(wù)平臺向其有關(guān)單位提供自助化數(shù)據(jù)微服務(wù),以滿足不同場景下的數(shù)據(jù)需求。其中BI報表提供靈活的數(shù)據(jù)查詢和分析能力,能滿足不同單位對業(yè)務(wù)報表的需求;數(shù)據(jù)交換/共享平臺則具備了安全實(shí)時為各類業(yè)務(wù)系統(tǒng)提供數(shù)據(jù)服務(wù)的能力,同時在有效監(jiān)督的前提下將全量數(shù)據(jù)返回給需求者;數(shù)據(jù)API接口則滿足了有數(shù)據(jù)查詢、比對、驗(yàn)證需求的業(yè)務(wù)部門。近兩年來,信息中心通過數(shù)據(jù)服務(wù)平臺為各單位提供數(shù)據(jù)服務(wù)累計300余次,高效地響應(yīng)了各業(yè)務(wù)部門的數(shù)據(jù)需求。
大數(shù)據(jù)時代,數(shù)據(jù)被教育行業(yè)視為重要的無形資產(chǎn)將是未來的必然趨勢。數(shù)據(jù)治理能夠持續(xù)優(yōu)化企業(yè)數(shù)據(jù)環(huán)境,規(guī)范數(shù)據(jù)使用流程,推動數(shù)據(jù)創(chuàng)新服務(wù)和價值發(fā)現(xiàn)。本文在回顧國內(nèi)外學(xué)者對數(shù)據(jù)治理研究的基礎(chǔ)上,闡述了教育數(shù)據(jù)治理的必要性以及主要面臨的問題,并提出了一套適用于教育領(lǐng)域數(shù)據(jù)治理的整體框架,涵蓋保障機(jī)制和治理域兩個模塊,最后以江西省教育廳為例,從保障機(jī)制、資源整合、元數(shù)據(jù)、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)服務(wù)6個方面介紹了其在數(shù)據(jù)治理方面的具體實(shí)踐。
數(shù)據(jù)治理作為教育領(lǐng)域數(shù)據(jù)化轉(zhuǎn)型的基石與保障,是一項(xiàng)長期的“臟活”“苦活”“累活”,但又是一項(xiàng)無法逾越的工作,是教育領(lǐng)域業(yè)務(wù)創(chuàng)新、服務(wù)轉(zhuǎn)型的重要支撐。正因如此,教育數(shù)據(jù)治理的研究和應(yīng)用任重道遠(yuǎn),特別是大數(shù)據(jù)時代下非結(jié)構(gòu)化數(shù)據(jù)的治理,需要專家學(xué)者們不斷地深入研究和探索。
參考文獻(xiàn):
[1]高亮.數(shù)據(jù)治理:讓數(shù)據(jù)質(zhì)量更好[J].中國教育網(wǎng)絡(luò),2014(12):64-66.
[2]顧立平.數(shù)據(jù)治理——圖書館事業(yè)的發(fā)展機(jī)遇[J].中國圖書館學(xué)報,2016,42(225):1-17.
[3]李林,錢丹丹,黃婷婷等.高校信息化數(shù)據(jù)治理探討[J].中國教育信息化,2017(9):66-68.
[4]李青,韓俊紅.數(shù)據(jù)治理:提升教育數(shù)據(jù)質(zhì)量的方法與途徑[J].中國遠(yuǎn)程教育,2018(8):45-53.
[5]陸顧新,陳石軍,王立等.銀行數(shù)據(jù)治理[M].北京:機(jī)械工業(yè)出版社,2016:6-42.
[6]彭雪濤.美國高校數(shù)據(jù)治理及其借鑒[J].電化教育研究,2017(6):76-81.
[7]孫嘉睿.國內(nèi)數(shù)據(jù)治理研究進(jìn)展:體系、保障與實(shí)踐[J].圖書館學(xué)研究,2018(16):2-8.
[8]王惠仙.高校數(shù)據(jù)治理的探索與研究[J].科技與創(chuàng)新,2018(16):103-106.
[9]吳剛.高校大數(shù)據(jù)治理的價值結(jié)構(gòu)[J].中國成人教育,2018(5):41-44.
[10]徐峰,吳旻瑜,徐萱等.教育數(shù)據(jù)治理:問題、思考與對策[J].開放教育研究,2018,24(2):107-111.
[11]許曉東,王錦華,卞良等.高等教育的數(shù)據(jù)治理研究[J].高等教育工程研究,2015(5):25-30.
[12]楊浩,鄭旭東等.信息化教育中的IT治理:基于治理體系與治理能力的視角[J].中國電化教育,2016(2):74-79.
[13]楊琳,高洪美,宋俊典等.大數(shù)據(jù)環(huán)境下的數(shù)據(jù)治理框架研究及應(yīng)用[J].計算機(jī)應(yīng)用與軟件,2017,34(4):65-69.
[14]張世明,彭雪峰,黃河笑.開放大學(xué)數(shù)據(jù)治理框架研究[J].中國電化教育,2018(8):116-126.
[15]張一鳴.數(shù)據(jù)治理過程淺析[J].中國信息界,2012(9):15-17.
[16]DAMA International.The DAMA guide to the data managment body of knowledge[M].New Jersey:Technics Publications LLC,2010.
[17]Khatri V,Brown C V.Designing data governance[J].Communications of the ACM,2010,53(1):148-152.
[18]THOMAS G.The DGI data governance framework[DB/OL]. http://www.datagovernance.com/wp-content/uploads/2014/11/dgi_framework.pdf.
(作者:洪偉,徐峰,胡強(qiáng),江西省教育管理信息中心;任劍嵐,江西交通職業(yè)技術(shù)學(xué)院。文章來源:《中國教育信息化》雜志2020年第3期)
聯(lián)系客服