課堂教學(xué)評(píng)價(jià)結(jié)果的解釋
余林 主編
目前關(guān)于課堂教學(xué)評(píng)價(jià)結(jié)果解釋類型的劃分幾乎沒有專門的研究。但就課堂教學(xué)評(píng)價(jià)結(jié)果的解釋來說,在實(shí)際應(yīng)用中常習(xí)慣性地將測驗(yàn)分為傳統(tǒng)的標(biāo)準(zhǔn)化測驗(yàn)和非標(biāo)準(zhǔn)化測驗(yàn),非標(biāo)準(zhǔn)化測驗(yàn)即是前面章節(jié)提到的替代性評(píng)價(jià)測驗(yàn)。因此,在這里照應(yīng)前面章節(jié),對(duì)課堂教學(xué)評(píng)價(jià)結(jié)果的解釋就從標(biāo)準(zhǔn)化測驗(yàn)和替代性評(píng)價(jià)測驗(yàn)的角度進(jìn)行闡述。
一、課堂教學(xué)中標(biāo)準(zhǔn)化測驗(yàn)結(jié)果的解釋
在課堂教學(xué)中,目前已經(jīng)出現(xiàn)了一些非標(biāo)準(zhǔn)化的測驗(yàn)方式——替代性評(píng)價(jià)測驗(yàn),但標(biāo)準(zhǔn)化測驗(yàn)仍然是主要的測驗(yàn)方式,應(yīng)用仍然十分廣泛。因此,仍有必要在這里對(duì)課堂教學(xué)評(píng)價(jià)中標(biāo)準(zhǔn)化測驗(yàn)結(jié)果的解釋進(jìn)行介紹。
(一)標(biāo)準(zhǔn)化測驗(yàn)和標(biāo)準(zhǔn)化測驗(yàn)結(jié)果解釋的概念
標(biāo)準(zhǔn)化測驗(yàn)是指對(duì)一個(gè)既定小組內(nèi)的所有成員在相同條件下以相同方式進(jìn)行的考試。([美]G.D.Borich & M.L.Tombari:《中小學(xué)教育評(píng)價(jià)》,242頁,北京,中國輕工業(yè)出版社,2004。)具體到課堂教學(xué),就是在相同條件下,以相同的題目同時(shí)對(duì)所有學(xué)生進(jìn)行測試,并以同一標(biāo)準(zhǔn)對(duì)學(xué)生在測試中的反應(yīng)作出評(píng)估的測驗(yàn)??梢钥闯?,“標(biāo)準(zhǔn)化”強(qiáng)調(diào)整個(gè)測驗(yàn)過程內(nèi)在的“一致性”,是個(gè)理想化的概念,事實(shí)上做到完全的一致是不可能的,如,每個(gè)學(xué)生的主觀狀態(tài)在測驗(yàn)時(shí)就不一樣。但在實(shí)際的測驗(yàn)中,在排除無關(guān)條件的情況下,測驗(yàn)的各種因素是接近一致的,同時(shí)這種假定的一致性也為對(duì)標(biāo)準(zhǔn)化測驗(yàn)結(jié)果解釋時(shí)進(jìn)行內(nèi)部、外部比較提供了基礎(chǔ)。下面就闡述什么是標(biāo)準(zhǔn)化測驗(yàn)結(jié)果的解釋。
對(duì)標(biāo)準(zhǔn)化測驗(yàn)評(píng)估時(shí),一般是依據(jù)統(tǒng)一的標(biāo)準(zhǔn)對(duì)學(xué)生的反應(yīng)進(jìn)行評(píng)估,最后得到一個(gè)分?jǐn)?shù),通常叫原始分?jǐn)?shù)。一般來說,原始分?jǐn)?shù)所能反映出的信息很少,要深入、全面地了解所測量的學(xué)生的實(shí)際情況,就要對(duì)這個(gè)“分?jǐn)?shù)”進(jìn)一步進(jìn)行闡釋。因此,對(duì)標(biāo)準(zhǔn)化測驗(yàn)所得到的原始分?jǐn)?shù)進(jìn)行闡釋的過程就是標(biāo)準(zhǔn)化測驗(yàn)結(jié)果的解釋。
(二)標(biāo)準(zhǔn)化測驗(yàn)與常模
常模經(jīng)常用于社會(huì)心理學(xué)領(lǐng)域,對(duì)其含義界定的說法很多。社會(huì)心理學(xué)研究者在使用“常模”一詞的時(shí)候,指的是統(tǒng)管小組成員行為的一組標(biāo)準(zhǔn)行為。([美]G.D.Borich & M.L.Tombari:《中小學(xué)教育評(píng)價(jià)》,241頁、242頁,北京,中國輕工業(yè)出版社,2004。)在課堂教學(xué)評(píng)價(jià)領(lǐng)域,可以界定為作為樣本的小組成員在所要測量的特質(zhì)上的標(biāo)準(zhǔn)的反應(yīng)或行為。也就是說,常模代表的是在某一個(gè)環(huán)境下所應(yīng)該作出的反應(yīng),是評(píng)價(jià)其他對(duì)象在同樣環(huán)境下的表現(xiàn)時(shí)所依據(jù)的標(biāo)準(zhǔn)。如,在參加學(xué)校組織的大型活動(dòng)時(shí),學(xué)校規(guī)定應(yīng)該穿什么衣服、坐在什么位置、說普通話還是方言等,就可以看作是評(píng)價(jià)參加活動(dòng)人員行為的常模。
前面闡述過,標(biāo)準(zhǔn)化測驗(yàn)突出的特點(diǎn)就是強(qiáng)調(diào)一致性,這就為參照常模來解釋標(biāo)準(zhǔn)化測驗(yàn)提供了理論上的可能。事實(shí)上,標(biāo)準(zhǔn)化測驗(yàn)通常都是參照常模來進(jìn)行解釋的。雖然并不是所有參照常模進(jìn)行解釋的測驗(yàn)都是標(biāo)準(zhǔn)化測驗(yàn),但大多數(shù)標(biāo)準(zhǔn)化測驗(yàn)都是常模參照型的([美]查爾斯·杰克遜:《了解心理測驗(yàn)過程》, 64頁,北京,北京大學(xué)出版社,2000。),有人甚至認(rèn)為所有的標(biāo)準(zhǔn)化測驗(yàn)都是常模參照測驗(yàn)([美]G.D.Borich & M.L.Tombari:《中小學(xué)教育評(píng)價(jià)》,241頁、242頁,北京,中國輕工業(yè)出版社,2004。)──參照常模解釋結(jié)果的測驗(yàn)。傳統(tǒng)的課堂教學(xué)評(píng)價(jià)測驗(yàn)中都含有標(biāo)準(zhǔn)化測驗(yàn)的精神,在對(duì)測驗(yàn)結(jié)果解釋時(shí),一般來說也都是參照常模來進(jìn)行的,所以這里就重點(diǎn)從參照常模解釋的角度對(duì)標(biāo)準(zhǔn)化測驗(yàn)結(jié)果的解釋作出闡述。
(三)標(biāo)準(zhǔn)化測驗(yàn)結(jié)果解釋的方式
目前,標(biāo)準(zhǔn)化測驗(yàn)的結(jié)果一般來說仍然是一個(gè)分?jǐn)?shù),就是前面所說的原始分?jǐn)?shù)。對(duì)測驗(yàn)分?jǐn)?shù)進(jìn)行解釋時(shí),常模不同,對(duì)分?jǐn)?shù)的含義所作的闡述也就不同。常見的對(duì)標(biāo)準(zhǔn)化測驗(yàn)分?jǐn)?shù)的解釋有以下幾種。
1.以平均成績?yōu)槌D5慕忉?div style="height:15px;">
這是實(shí)際的課堂教學(xué)評(píng)價(jià)中最常見的解釋方式。在實(shí)際的課堂教學(xué)評(píng)價(jià)中,在對(duì)原始分?jǐn)?shù)進(jìn)行解釋時(shí),教師常常將單個(gè)學(xué)生的測驗(yàn)結(jié)果與團(tuán)體的平均表現(xiàn)進(jìn)行比較來解釋,即把所有參與考試學(xué)生的平均分?jǐn)?shù)作為常模,將單個(gè)學(xué)生的考試分?jǐn)?shù)與總體平均分?jǐn)?shù)加以比較,再對(duì)每個(gè)學(xué)生考試分?jǐn)?shù)的含義進(jìn)行闡述。如下例。
口語測驗(yàn)中,某學(xué)生得了92分,從這個(gè)原始分?jǐn)?shù)我們并不能看出什么意義,因?yàn)槲覀儾恢榔渌麑W(xué)生的成績?cè)鯓樱瑳]有參照標(biāo)準(zhǔn),就不能說92分是個(gè)很高的成績。如果現(xiàn)在知道了這次口語測驗(yàn)的班級(jí)平均成績?yōu)?0分,那么教師就可以作出這樣的解釋:該生的成績?cè)谄骄种?。也就是說該生的口語水平在班級(jí)里應(yīng)該是中等以上水平。
到目前為止,以整體平均成績?yōu)槌D?duì)測驗(yàn)結(jié)果進(jìn)行解釋的方法仍常用于學(xué)業(yè)成就的評(píng)價(jià)測驗(yàn),但教師可以在實(shí)際中嘗試著運(yùn)用其他方面的評(píng)價(jià)測驗(yàn)。
2.百分位
(1)百分位及百分位對(duì)測驗(yàn)結(jié)果的解釋。在現(xiàn)實(shí)生活中,當(dāng)學(xué)生向家長匯報(bào)測驗(yàn)成績時(shí),家長常常會(huì)問“有多少學(xué)生比你考得好(差)?”這就用到了另一種測驗(yàn)結(jié)果的解釋——百分位,又叫百分等級(jí),即一種相對(duì)位置量數(shù)。通俗地講,百分位就是被試測驗(yàn)分?jǐn)?shù)在團(tuán)體中所占的位置,百分位數(shù)越大,位置就越高,說明被試的水平就越好。應(yīng)用到標(biāo)準(zhǔn)化課堂教學(xué)評(píng)價(jià)測驗(yàn)中,就某一個(gè)學(xué)生來說,百分位數(shù)能反映出在一次測驗(yàn)中有多大比例學(xué)生的成績比該生差(好)。如下例。
在一次問題解決能力測驗(yàn)中,50名學(xué)生中有40人的測驗(yàn)成績低于45分,占全部人數(shù)的80%,因此,45這個(gè)分?jǐn)?shù)就可稱為處于第80百分位的分?jǐn)?shù)。凡是原始分?jǐn)?shù)為45者,其百分位數(shù)就是80。如果有學(xué)生得了45分,則有80%的學(xué)生在這次測驗(yàn)中的成績比該生差。
在實(shí)際應(yīng)用中,教師可以為了方便,使用自己編制的百分位分?jǐn)?shù)常模,如每年固定的學(xué)績測驗(yàn)中,就可以編制百分位分?jǐn)?shù)常模。百分位分?jǐn)?shù)常模使用起來十分方便,對(duì)照常模表,馬上就可以確定學(xué)生成績所對(duì)應(yīng)的百分位。具體制定百分位分?jǐn)?shù)常模的方法、過程可以參考有關(guān)教育、心理測量書籍。表7-1([美]查爾斯·杰克遜:《了解心理測驗(yàn)過程》,66頁,北京,北京大學(xué)出版社,2000。)是一個(gè)學(xué)齡兒童百分位分?jǐn)?shù)的假設(shè)樣本(常模),從表中可以很容易地看出與某一原始分?jǐn)?shù)相對(duì)應(yīng)的百分位分?jǐn)?shù)。
表7-1百分位分?jǐn)?shù)表(假設(shè)的范例)
百分位 原始分?jǐn)?shù)(男孩) 原始分?jǐn)?shù)(女孩) 原始分?jǐn)?shù)(總體)
99 63分以上 73分以上 66分以上
95 58~62分 62~69分 60~65分
90 …… …… ……
85 …… …… ……
80 …… …… ……
…… …… ……
…… …… ……
…… …… ……
1 5分或5分以下 10分或10分以下 8分或8分以下
(2)幾個(gè)特殊的百分位。百分位數(shù)是連續(xù)的相對(duì)位置量數(shù)。在應(yīng)用中,有幾個(gè)特殊的百分位數(shù)常常被用到,下面就對(duì)這幾個(gè)特殊的百分位數(shù)進(jìn)行逐一介紹。
①中數(shù)。中數(shù)就是在百分等級(jí)中處于中間點(diǎn)的百分位,即第50百分位。處于這個(gè)位置的成員,有一半的人分?jǐn)?shù)比他差。在課堂教學(xué)評(píng)價(jià)結(jié)果的解釋中,中數(shù)很少單獨(dú)使用,也很少用來對(duì)某個(gè)學(xué)生的測驗(yàn)結(jié)果進(jìn)行解釋,一般是和四分位數(shù)一起用于描述整個(gè)測驗(yàn)成績的分布。下面就介紹四分位數(shù)。
②四分位數(shù)。第25百分位和第75百分位稱為四分位數(shù)。四分位數(shù)的中間范圍是第25百分點(diǎn)與第75百分點(diǎn)之間的原始分之差異,常常與中數(shù)一起用于測量分?jǐn)?shù)的分布。如果中數(shù)所對(duì)應(yīng)分?jǐn)?shù)較高,四分位數(shù)之間段所對(duì)應(yīng)的分?jǐn)?shù)也普遍較高而且分布比較均勻,那么就說明這次測驗(yàn)學(xué)生整體成績較好。如一次測驗(yàn)中的中數(shù)及四分位數(shù)之間段所對(duì)應(yīng)的分?jǐn)?shù)比歷年同期同樣測驗(yàn)所對(duì)應(yīng)的分?jǐn)?shù)高,那么就說明這次學(xué)生整體考得比較好。
(3)百分位的使用范圍。在課堂教學(xué)評(píng)價(jià)結(jié)果的解釋中,百分位對(duì)單個(gè)學(xué)生成績的解釋意義并不十分大,但在需要對(duì)整體測驗(yàn)成績作簡單的描述時(shí)常??梢杂玫?。另外,百分位在描述整體分?jǐn)?shù)分布時(shí)有廣泛的使用范圍,不僅能用于學(xué)業(yè)測驗(yàn),還可以用于非學(xué)業(yè)成就測驗(yàn)中問題解決的評(píng)價(jià)測驗(yàn)、情感態(tài)度評(píng)價(jià)測驗(yàn)等。
(4)百分位的優(yōu)缺點(diǎn)。
①優(yōu)點(diǎn)。第一,計(jì)算簡便,常模的制定不難,使用起來非常方便,對(duì)照常模表馬上就可以查到學(xué)生的百分位。第二,對(duì)原始分?jǐn)?shù)的分布要求不高。即使學(xué)生的成績不是按照正態(tài)分布,也可以用百分位進(jìn)行解釋。
②缺點(diǎn)。第一,不容易作進(jìn)一步的統(tǒng)計(jì)分析。要在百分位基礎(chǔ)上對(duì)總體成績作進(jìn)一步的分析、整理和描述很不容易,因?yàn)榘俜治徊荒苡糜谒膭t運(yùn)算。第二,用百分位解釋原始分?jǐn)?shù)時(shí),只是給出了某一分?jǐn)?shù)水平在總體中的位置,并未給出關(guān)于分?jǐn)?shù)的實(shí)際差異信息,如第70百分位和第80百分位的學(xué)生實(shí)際分?jǐn)?shù)差異是多少,在百分位分?jǐn)?shù)常模表中很難看出。第三,從統(tǒng)計(jì)學(xué)上來講,用百分位解釋原始分?jǐn)?shù),實(shí)際上是低估了總體分?jǐn)?shù)中兩極分?jǐn)?shù)的差異而高估了中間段分?jǐn)?shù)的差異,就是說第95、98百分位和第55、58百分位之間同樣都是差3個(gè)百分位,但前者之間所對(duì)應(yīng)的分?jǐn)?shù)差異比后者所對(duì)應(yīng)的分?jǐn)?shù)差異大。
3.標(biāo)準(zhǔn)分?jǐn)?shù)
(1)一般標(biāo)準(zhǔn)分?jǐn)?shù)。標(biāo)準(zhǔn)分?jǐn)?shù)是以測驗(yàn)分?jǐn)?shù)的平均數(shù)為參照點(diǎn)、以標(biāo)準(zhǔn)差為單位來衡量各原始分?jǐn)?shù)在其常模團(tuán)體中位置高低的一種評(píng)定量表(丁秀峰:《心理測量學(xué)》,126頁,開封,河南大學(xué)出版社,2001。),又常被叫做Z分?jǐn)?shù)。
在課堂教學(xué)評(píng)價(jià)結(jié)果的解釋中,Z分?jǐn)?shù)的意義有以下幾點(diǎn):第一,由于標(biāo)準(zhǔn)分?jǐn)?shù)是以0平均數(shù)為參照點(diǎn),教師根據(jù)Z分?jǐn)?shù)的正負(fù)就可以判斷某一原始分?jǐn)?shù)在總體分?jǐn)?shù)中的大致位置,正值說明在平均數(shù)之上,負(fù)值在平均數(shù)之下;第二,可以通過Z分?jǐn)?shù)來比較兩個(gè)以上的測驗(yàn)分?jǐn)?shù)。
假如某學(xué)生語文成績?yōu)?2分,數(shù)學(xué)成績?yōu)?5分,教師不能說該學(xué)生的語文就比數(shù)學(xué)學(xué)得好,因?yàn)橛锌赡苷Z文試題簡單,整體分?jǐn)?shù)都偏高。但通過Z分?jǐn)?shù),教師就可以直接用兩個(gè)Z分?jǐn)?shù)值來進(jìn)行比較,Z分?jǐn)?shù)高者,在總體成績中的位置就高,可以說學(xué)得更好些。
Z分?jǐn)?shù)應(yīng)用廣泛,教師可以嘗試在學(xué)業(yè)成就、情感、態(tài)度各個(gè)方面的評(píng)價(jià)測驗(yàn)中使用Z分?jǐn)?shù)。具體使用時(shí)可以參考有關(guān)的測量書籍。
(2)轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)。在實(shí)際使用Z分?jǐn)?shù)時(shí),因?yàn)闀?huì)有小數(shù)或負(fù)數(shù)出現(xiàn),常常顯得很不方便,為了避免負(fù)數(shù)和小數(shù),就制訂了許多其他的標(biāo)準(zhǔn)分?jǐn)?shù)──標(biāo)準(zhǔn)分?jǐn)?shù)系統(tǒng)。常見的有T分?jǐn)?shù)、離差智商、標(biāo)準(zhǔn)九等。就課堂教學(xué)評(píng)價(jià)來講,離差智商的用處不大,本章就不再介紹,這里主要闡述T分?jǐn)?shù)和標(biāo)準(zhǔn)九在課堂教學(xué)評(píng)價(jià)中的應(yīng)用。
①T分?jǐn)?shù)。T分?jǐn)?shù)最初由麥克爾(Michael)于1922年為紀(jì)念推孟和桑代克而提出,表達(dá)式可寫為T=a+bZ,其中的Z即是上述的方法所計(jì)算出的可能會(huì)有小數(shù)點(diǎn)或負(fù)數(shù)出現(xiàn)的標(biāo)準(zhǔn)分?jǐn)?shù)。
在課堂教學(xué)評(píng)價(jià)結(jié)果的解釋中,T分?jǐn)?shù)除了具有Z分?jǐn)?shù)的一般功能外,主要優(yōu)點(diǎn)是避免了負(fù)數(shù)和小數(shù)點(diǎn),更加直觀方便。如直接比較T分?jǐn)?shù)的大小,就可以確定相應(yīng)原始分?jǐn)?shù)在總體分?jǐn)?shù)中的位置,十分明了。
T分?jǐn)?shù)最初是被用于12歲兒童心理測驗(yàn)的常模團(tuán)體,現(xiàn)在已經(jīng)廣泛用于其他常模團(tuán)體,這里作一個(gè)簡單介紹,具體原理可以參見教育、心理測量類書籍。在課堂教學(xué)評(píng)價(jià)結(jié)果解釋方面,教師可以嘗試運(yùn)用于情感、態(tài)度、學(xué)業(yè)自我等各個(gè)方面。
②標(biāo)準(zhǔn)九。標(biāo)準(zhǔn)九意思是說標(biāo)準(zhǔn)化九級(jí)分制。最初由美國選拔飛行員所用,分?jǐn)?shù)從1到9,將整體分為九段,是標(biāo)準(zhǔn)分?jǐn)?shù)系統(tǒng)中的一種。
標(biāo)準(zhǔn)九在課堂教學(xué)評(píng)價(jià)中的應(yīng)用與T分?jǐn)?shù)相似,避免了小數(shù)和分?jǐn)?shù),可以用于對(duì)分?jǐn)?shù)的整體情況的解釋。它的獨(dú)特之處就是提供了一個(gè)一位數(shù)的分?jǐn)?shù)系統(tǒng),簡單明了,使用起來也很方便。
標(biāo)準(zhǔn)九原理也與T分?jǐn)?shù)相似,最初用于選拔。課堂教學(xué)中,教師可以嘗試用于各種測驗(yàn)結(jié)果的解釋。另外,有分?jǐn)?shù)解釋中提到標(biāo)準(zhǔn)十,其原理、用途與標(biāo)準(zhǔn)九相似。
(3)標(biāo)準(zhǔn)分?jǐn)?shù)與百分位的綜合使用。如上所述,在解釋標(biāo)準(zhǔn)化測驗(yàn)結(jié)果時(shí),標(biāo)準(zhǔn)分?jǐn)?shù)更適合于對(duì)分?jǐn)?shù)整體作出解釋,百分位則更適于對(duì)單一分?jǐn)?shù)的解釋。因此,在具體使用過程中教師可以將二者結(jié)合起來,列出對(duì)照表(如表7-2)。(丁秀峰:《心理測量學(xué)》,132頁,開封,河南大學(xué)出版社,2001。)
表7-2標(biāo)準(zhǔn)十與百分等級(jí)范圍對(duì)應(yīng)表
標(biāo)準(zhǔn)十分
10
9
8
7
6
5
4
3
2
1
百分
等級(jí)
范圍
99~100
94~98
85~93
70~84
51~69
32~50
17~31
8~16
3~7
1~2
所占個(gè)案
百分比(%)
2
5
9
15
19
19
15
9
5
2
從表7-2中,教師就可以一目了然地看出某一百分位(百分等級(jí))范圍所對(duì)應(yīng)的標(biāo)準(zhǔn)分?jǐn)?shù)和某一分?jǐn)?shù)段所占的人數(shù)比例,既可以用于整體分?jǐn)?shù)的描述,也可以用于單一成績的解釋,使用起來非常方便。當(dāng)然,在具體使用時(shí),教師完全可以依據(jù)需要制訂百分位與標(biāo)準(zhǔn)分的對(duì)照表,并附上原始分?jǐn)?shù)。具體的制訂可以參見教育、心理測量書籍,這里不再贅述。
(4)標(biāo)準(zhǔn)分?jǐn)?shù)的優(yōu)缺點(diǎn)。
①優(yōu)點(diǎn)。第一,標(biāo)準(zhǔn)分?jǐn)?shù)的差異與原始分的差異成比例,所以依據(jù)標(biāo)準(zhǔn)分?jǐn)?shù)可以描述原始分?jǐn)?shù)的整體情況。而且,經(jīng)過轉(zhuǎn)換后的標(biāo)準(zhǔn)分?jǐn)?shù)往往更加直觀、明了,使用起來也更方便。第二,因?yàn)闃?biāo)準(zhǔn)分?jǐn)?shù)是等距的,可以用來作四則運(yùn)算,在對(duì)分?jǐn)?shù)作進(jìn)一步的統(tǒng)計(jì)處理時(shí),得出的結(jié)果和原始分?jǐn)?shù)一致,而且標(biāo)準(zhǔn)分?jǐn)?shù)更方便,很適合對(duì)數(shù)據(jù)作一些深層的處理。如用來計(jì)算平均數(shù)或相關(guān)系數(shù)等。
②缺點(diǎn)。第一,因?yàn)闋可娴浇y(tǒng)計(jì)知識(shí),對(duì)于非專業(yè)人員理解上會(huì)有困難。對(duì)于非專業(yè)人員來說,沒有一定程度的統(tǒng)計(jì)學(xué)原理知識(shí),理解標(biāo)準(zhǔn)分?jǐn)?shù)很困難,這也是在課堂教學(xué)評(píng)價(jià)中不常用標(biāo)準(zhǔn)分?jǐn)?shù)直接向?qū)W生、家長等反饋的原因。第二,如果原始分?jǐn)?shù)不是正態(tài)分布,不宜使用標(biāo)準(zhǔn)分?jǐn)?shù)。如前所述,使用標(biāo)準(zhǔn)分?jǐn)?shù)的一個(gè)前提就是原始分?jǐn)?shù)要呈正態(tài)分布,這是標(biāo)準(zhǔn)分?jǐn)?shù)使用的必要條件,所以,盡管標(biāo)準(zhǔn)分?jǐn)?shù)有不少優(yōu)點(diǎn),但如果不滿足分?jǐn)?shù)呈正態(tài)分布這一條件,也不宜使用標(biāo)準(zhǔn)分?jǐn)?shù)。
4.其他分?jǐn)?shù)系統(tǒng)
除了上面所述的幾種參照常模的解釋方法外,還有幾種常用于解釋學(xué)業(yè)評(píng)價(jià)測驗(yàn)(或分?jǐn)?shù))的方法。
(1)年級(jí)當(dāng)量。年級(jí)當(dāng)量是把學(xué)生的測驗(yàn)成績與各年級(jí)學(xué)生的平均成績比較,看它相當(dāng)于幾年級(jí)的水平。這里所說的各年級(jí)學(xué)生的平均成績事實(shí)上指的是“年級(jí)常模”——各年級(jí)學(xué)生在測驗(yàn)中所得分?jǐn)?shù)的平均數(shù)和分?jǐn)?shù)的分布情況。也就是說,首先制訂某學(xué)科學(xué)業(yè)成績?cè)诟鱾€(gè)年級(jí)上的常模,然后將學(xué)生在該學(xué)科上的測驗(yàn)成績與年級(jí)常模比較,如果達(dá)到了某年級(jí)常模的平均成績,就說明學(xué)生具有相當(dāng)于這一年級(jí)的學(xué)業(yè)水平,也就確定了年級(jí)當(dāng)量。如下面的例子。
對(duì)一個(gè)學(xué)生進(jìn)行語文測驗(yàn),其得分與常模上三年級(jí)的平均分?jǐn)?shù)相同,那么,他在語文測驗(yàn)上的年級(jí)當(dāng)量就是3。
從上例可以看出,年級(jí)當(dāng)量也是參照常模解釋的測驗(yàn)分?jǐn)?shù),常用于解釋學(xué)業(yè)測驗(yàn),使用起來十分方便。但與其他參照常模的解釋不同的是,年級(jí)當(dāng)量一般只用于解釋同一學(xué)科的測驗(yàn),而且只有當(dāng)幾個(gè)年級(jí)同時(shí)開設(shè)某門課程,課程內(nèi)容的廣度和深度是有系統(tǒng)地發(fā)生改變時(shí),才適宜用年級(jí)當(dāng)量來解釋被試的測驗(yàn)分?jǐn)?shù)。不同學(xué)科之間是不能用年級(jí)當(dāng)量來解釋測驗(yàn)分?jǐn)?shù)的。教師在使用時(shí)需要注意這一點(diǎn)。
(2)教育年齡。教育年齡(educational age)是模仿智力年齡提出的,是指某年齡學(xué)生的平均教育成就。與年級(jí)當(dāng)量類似,拿一個(gè)學(xué)生的教育年齡與常模相比較,就可以確定一個(gè)學(xué)生的教育年齡。另外,教育年齡并不涉及實(shí)際年齡,這可以用下面的例子來說明。
一個(gè)學(xué)生的教育年齡是9歲,就是說這個(gè)學(xué)生的教育成就與一般9歲兒童的教育成就相等,與他本身的實(shí)際年齡無關(guān)。
在學(xué)業(yè)成就課堂教學(xué)評(píng)價(jià)結(jié)果的解釋中,還常用到學(xué)科教育年齡。學(xué)科教育年齡即按學(xué)科類別將教育年齡劃分為語文年齡、數(shù)學(xué)年齡等,具體可以理解為對(duì)某一學(xué)科,用標(biāo)準(zhǔn)化測驗(yàn)對(duì)同年齡學(xué)生團(tuán)體施測后所得的平均成績。教師在使用時(shí)可以靈活掌握。
(四)對(duì)標(biāo)準(zhǔn)化測驗(yàn)結(jié)果進(jìn)行解釋時(shí)需要注意的問題
1.選用恰當(dāng)?shù)某D?div style="height:15px;">
多數(shù)對(duì)標(biāo)準(zhǔn)化測驗(yàn)結(jié)果的解釋都是參照常模的解釋,選取或制訂的常模不同,對(duì)測驗(yàn)分?jǐn)?shù)的解釋會(huì)有很大不同,如,用優(yōu)秀學(xué)生常模來解釋差生問題解決能力的測驗(yàn)結(jié)果就肯定不行,所以選取適當(dāng)?shù)某D7浅V匾?。在選取或制訂常模時(shí),一般來說常模團(tuán)體的代表性越強(qiáng)越好,容量大的更好。教師在選取或自己制訂時(shí)一定要注意這兩點(diǎn),否則會(huì)出現(xiàn)較大的誤差。
2.考慮測驗(yàn)本身的信度和效度
在對(duì)測驗(yàn)結(jié)果進(jìn)行解釋時(shí),除了整個(gè)解釋的過程要盡量科學(xué)嚴(yán)密外,還要考慮一下測驗(yàn)本身的信度、效度。因?yàn)槿绻麥y驗(yàn)本身存在問題,即使測驗(yàn)結(jié)果的解釋非??陀^科學(xué),也會(huì)有誤差出現(xiàn)。所以,教師在對(duì)測驗(yàn)結(jié)果進(jìn)行解釋時(shí),尤其是覺得有較大問題時(shí),要適當(dāng)考慮一下測驗(yàn)本身的信度和效度。
3.從發(fā)展的角度考慮測驗(yàn)結(jié)果的解釋
一般來說,標(biāo)準(zhǔn)化測驗(yàn)的結(jié)果都是一個(gè)分?jǐn)?shù),因?yàn)槭菂⒄粘D=忉專瑥哪撤N意義上說,分?jǐn)?shù)對(duì)學(xué)生是一種終結(jié)性的評(píng)定。而對(duì)于學(xué)生的發(fā)展進(jìn)步情況以及努力情況卻不容易反映出來,但這些對(duì)于學(xué)生以后的進(jìn)步卻是很重要的。所以,教師在對(duì)標(biāo)準(zhǔn)化測驗(yàn)結(jié)果進(jìn)行解釋時(shí),要盡量去平衡這些不足,全面考慮,選擇恰當(dāng)?shù)挠谜Z,從發(fā)展的角度去解釋測驗(yàn)分?jǐn)?shù)。
二、課堂教學(xué)中替代性評(píng)價(jià)測驗(yàn)結(jié)果的解釋
前面闡述了課堂教學(xué)中標(biāo)準(zhǔn)化測驗(yàn)結(jié)果的解釋,下面介紹非標(biāo)準(zhǔn)化測驗(yàn)結(jié)果的解釋。
(一)替代性評(píng)價(jià)測驗(yàn)和替代性評(píng)價(jià)測驗(yàn)結(jié)果解釋的概念
所謂替代性測驗(yàn),是指除標(biāo)準(zhǔn)化測驗(yàn)外的所有課堂教學(xué)評(píng)價(jià)測驗(yàn),這里也簡稱為替代性測驗(yàn),如表現(xiàn)性評(píng)價(jià)測驗(yàn)等。關(guān)于替代性評(píng)價(jià)測驗(yàn)的具體含義、特點(diǎn)等,本書在“學(xué)業(yè)成就的替代性評(píng)價(jià)”一章有詳細(xì)介紹,這里不再重復(fù),只是前面是針對(duì)學(xué)業(yè)成就的評(píng)價(jià)而闡述的,在這里把替代性評(píng)價(jià)測驗(yàn)的內(nèi)涵擴(kuò)大到所有課堂教學(xué)評(píng)價(jià)測驗(yàn),包括本書所涉及的所有非標(biāo)準(zhǔn)化的評(píng)價(jià)測驗(yàn)。
替代性評(píng)價(jià)測驗(yàn)的結(jié)果一般是“一個(gè)分?jǐn)?shù)”或者“一個(gè)等級(jí)附帶一個(gè)分?jǐn)?shù)”,替代性評(píng)價(jià)測驗(yàn)結(jié)果的解釋就是對(duì)測驗(yàn)后這個(gè)分?jǐn)?shù)或等級(jí)(加分?jǐn)?shù))的解釋。前面介紹過,替代性測驗(yàn)與標(biāo)準(zhǔn)化測驗(yàn)有很大不同:它強(qiáng)調(diào)個(gè)體差異,突出學(xué)生主體性,不要求一致性。另外,除了試題測試外,替代性測驗(yàn)中更多的是任務(wù)完成測驗(yàn),學(xué)生在完成任務(wù)過程中會(huì)有不同程度的原創(chuàng)性反應(yīng),因此,替代性評(píng)價(jià)測驗(yàn)中學(xué)生表現(xiàn)不一,多數(shù)測驗(yàn)任務(wù)沒有固定答案。很顯然,一般情況下替代性測驗(yàn)的結(jié)果不適合參照常模來解釋,所以在這里就介紹另外一種解釋測驗(yàn)結(jié)果的方法──參照“標(biāo)準(zhǔn)”的解釋,很多人把參照“標(biāo)準(zhǔn)”解釋的測驗(yàn)叫做標(biāo)準(zhǔn)參照測驗(yàn)。
(二)替代性評(píng)價(jià)測驗(yàn)結(jié)果的解釋:標(biāo)準(zhǔn)參照測驗(yàn)
1.什么是標(biāo)準(zhǔn)參照測驗(yàn)
標(biāo)準(zhǔn)參照測驗(yàn)是指在和一組規(guī)定明確的能力標(biāo)準(zhǔn)對(duì)比之下,對(duì)被試的測驗(yàn)成績作出解釋而制訂的測驗(yàn)。(丁秀峰:《心理測量學(xué)》,133頁,開封,河南大學(xué)出版社,2001。)可以這樣理解,在標(biāo)準(zhǔn)參照測驗(yàn)中,對(duì)測驗(yàn)評(píng)估的指標(biāo)不只有一個(gè),而是有很多個(gè),在每個(gè)指標(biāo)上可以有一個(gè)分?jǐn)?shù)(或等級(jí)),也可以有多個(gè)衡量分?jǐn)?shù)(或等級(jí)),以這樣的評(píng)估標(biāo)準(zhǔn)來記分、解釋的測驗(yàn)就是標(biāo)準(zhǔn)參照測驗(yàn)。下面給出了一個(gè)例子。
某教師在評(píng)估學(xué)生的手工設(shè)計(jì)時(shí),選取了外型的新穎性、技術(shù)含量、做工精致程度幾個(gè)指標(biāo),在每個(gè)指標(biāo)上,教師制訂了三個(gè)等級(jí)并在每個(gè)等級(jí)上都賦予了分?jǐn)?shù)。外型新穎性方面:外型非常新穎(從沒見到過)=3分,外型一般(在別的基礎(chǔ)上加工而來)=2分,外型普通(很常見)=1分;技術(shù)含量方面:技術(shù)含量高=3分,技術(shù)含量一般=2分,沒有什么技術(shù)含量=1分;做工精致程度:做工非常精致=3分,做工一般=2分,做工較差=1分。這就制訂了一個(gè)系統(tǒng)的評(píng)估標(biāo)準(zhǔn),教師在對(duì)手工測驗(yàn)進(jìn)行評(píng)價(jià)時(shí),就依據(jù)這個(gè)標(biāo)準(zhǔn)來進(jìn)行。
從上面所給出的“標(biāo)準(zhǔn)參照測驗(yàn)”的例子中可以看出,對(duì)“手工設(shè)計(jì)”的評(píng)估其實(shí)就是等級(jí)評(píng)定。事實(shí)上,實(shí)際應(yīng)用替代性測驗(yàn)進(jìn)行評(píng)估時(shí),由于學(xué)生的反應(yīng)各異,不能夠像常模參照那樣對(duì)學(xué)生作出比較,很多都是界定一系列的指標(biāo)對(duì)學(xué)生的表現(xiàn)進(jìn)行等級(jí)評(píng)定,其本質(zhì)上就是參照“標(biāo)準(zhǔn)”的評(píng)估,這在前面“學(xué)業(yè)成就的替代性評(píng)價(jià)”一章有詳細(xì)的陳述,所以也可以說在參照“標(biāo)準(zhǔn)”對(duì)替代性測驗(yàn)進(jìn)行評(píng)估解釋時(shí),替代性測驗(yàn)就是標(biāo)準(zhǔn)參照測驗(yàn)。這里并不是說替代性評(píng)價(jià)測驗(yàn)都是參照“標(biāo)準(zhǔn)”來解釋的測驗(yàn),也可以參照常模來解釋,但目前替代性測驗(yàn)的解釋主要是參照“標(biāo)準(zhǔn)”來進(jìn)行,所以本章主要從標(biāo)準(zhǔn)參照測驗(yàn)的角度對(duì)替代性評(píng)價(jià)測驗(yàn)結(jié)果的解釋進(jìn)行介紹。
需要補(bǔ)充的是,上述例子對(duì)“手工設(shè)計(jì)”的評(píng)估中,在每個(gè)等級(jí)上都賦予了一個(gè)分值,這是較為常見的等級(jí)評(píng)定。在實(shí)際應(yīng)用中,等級(jí)評(píng)定還可以有另外一層含義,就是在每個(gè)指標(biāo)上只給出一個(gè)最高分?jǐn)?shù)如10分,但在具體進(jìn)行評(píng)估時(shí),教師可以根據(jù)學(xué)生表現(xiàn),在這個(gè)分值范圍內(nèi)給學(xué)生打分,如5分或8分,這在學(xué)業(yè)成就測驗(yàn)中很常見,如教師對(duì)論述題的打分。以上所述的只是兩種賦予分值的方式,雖有所不同,但實(shí)質(zhì)上都是參照標(biāo)準(zhǔn)的評(píng)估,這里單獨(dú)加以補(bǔ)充,以免教師在使用時(shí)局限于其中的一種。
2.標(biāo)準(zhǔn)參照測驗(yàn)的特點(diǎn)
這里所說的標(biāo)準(zhǔn)參照測驗(yàn)結(jié)果解釋的特點(diǎn)是相對(duì)于常模參照測驗(yàn)而言的。相對(duì)常模參照的結(jié)果來說,標(biāo)準(zhǔn)參照測驗(yàn)的結(jié)果解釋主要有以下兩個(gè)特點(diǎn)。
(1)標(biāo)準(zhǔn)參照測驗(yàn)的目的。參照常模對(duì)測驗(yàn)進(jìn)行解釋一般是為了在全部被試之間作出比較,從而判明被試在總體中的位置。而參照標(biāo)準(zhǔn)解釋測驗(yàn)則是為了將被試的成績與既定的標(biāo)準(zhǔn)作比較,看看被試是否達(dá)到要求或達(dá)到了什么樣的水平,不在被試之間作比較。如,看看學(xué)生是否掌握了實(shí)驗(yàn)的操作技術(shù),是否達(dá)到了要求,并不需要在學(xué)生之間作出比較。這是二者根本的區(qū)別,并且由此導(dǎo)致了其他方面的不同。
(2)標(biāo)準(zhǔn)參照測驗(yàn)的分?jǐn)?shù)解釋。常模參照測驗(yàn)主要使用百分等級(jí)、標(biāo)準(zhǔn)分?jǐn)?shù)等相對(duì)位置量數(shù),并且一般不適合對(duì)分?jǐn)?shù)作進(jìn)一步的推斷;而標(biāo)準(zhǔn)參照測驗(yàn)的分?jǐn)?shù)則不同,可以作一定的推斷,如用大學(xué)生的入學(xué)成績預(yù)測其在大學(xué)一年級(jí)的成績。其實(shí)這里所說的是“結(jié)果參照測驗(yàn)”分?jǐn)?shù)解釋的內(nèi)容,如果需要,教師可以查閱相關(guān)的測量書籍。
(三)標(biāo)準(zhǔn)參照測驗(yàn)結(jié)果的解釋:分?jǐn)?shù)線的確定
1.合格分?jǐn)?shù)線的確定
前面闡述過,對(duì)替代性評(píng)價(jià)測驗(yàn)結(jié)果解釋的目的不是在學(xué)生之間進(jìn)行比較,而是看學(xué)生是否達(dá)到了要求或者是達(dá)到了什么樣的水平。那么在實(shí)際應(yīng)用中,要衡量學(xué)生在測驗(yàn)中的水平是否達(dá)到要求或者達(dá)到了什么樣的水平,最簡單也比較實(shí)用的方法就是確定一個(gè)合適的分?jǐn)?shù)線,凡是達(dá)到這個(gè)分?jǐn)?shù)線的,就說明該學(xué)生在這個(gè)測驗(yàn)上合格了,達(dá)到了要求或基本達(dá)到了要求。如果低于這個(gè)分?jǐn)?shù)線,則說明學(xué)生還沒有掌握應(yīng)該掌握的知識(shí)和技能,沒有達(dá)到基本要求。下面就來看一下在不同測驗(yàn)中,怎樣確定合格分?jǐn)?shù)線。
(1)根據(jù)“雙基度”確定合格分?jǐn)?shù)線。雙基指“基本知識(shí)、基本技能”,具體到課堂教學(xué)中,指的是學(xué)科的教學(xué)要求。具體地說就是在整個(gè)知識(shí)傳授的過程中,教師要著重“雙基”內(nèi)容的講解和示范,學(xué)生要著重“雙基”內(nèi)容的掌握,凡是能體現(xiàn)“基本知識(shí)、基本技能”的教學(xué)內(nèi)容都是學(xué)生要重點(diǎn)掌握的內(nèi)容。那么反映到測驗(yàn)上,越能反映學(xué)科“雙基”要求的試題或任務(wù),就越能說明該試題或任務(wù)就是特定學(xué)科最基本、最核心的知識(shí)要求,其“雙基度”也就越高。從這里可以看出,“雙基度”和平時(shí)所說的試題難度沒有必然的聯(lián)系,難度高的題目其“雙基度”不一定高,難度低的題目其“雙基度”也不一定低。所以,這里認(rèn)為在考查學(xué)科內(nèi)容掌握的測驗(yàn)中,根據(jù)“雙基度”來確定合格分?jǐn)?shù)線比簡單地按照60分來確定更合理。
根據(jù)“雙基度”確定合格分?jǐn)?shù)線的原理和步驟,教師可以查閱相關(guān)的測量書籍,下面給出一個(gè)根據(jù)“雙基度”確定合格分?jǐn)?shù)線的例子(丁秀峰:《心理測量學(xué)》,141頁,開封,河南大學(xué)出版社,2001。以供參考。)
某市中學(xué)高三學(xué)生進(jìn)行期末數(shù)學(xué)考試,有40個(gè)試題,前35題每題2分,后5題每題6分。經(jīng)五位教師評(píng)估,各試題平均“雙基度”指標(biāo)如下。
“雙基度”
0.9
0.8
0.7
0.5
0.4
0.3
0.1
合計(jì)
題分值
2
2
2
2
2
6
6
題數(shù)
10
10
7
5
3
3
2
40
則期末數(shù)學(xué)考試的合格分?jǐn)?shù)線為:
E =(10×0.9+10×0.8+7×0.7+5×0.5+3×0.4)×2
+(3×0.3+2×0.1)×6
=57.8
根據(jù)“雙基度”確定測驗(yàn)的合格分?jǐn)?shù)線常用于考查學(xué)科內(nèi)容掌握的測驗(yàn),也常見于標(biāo)準(zhǔn)化測驗(yàn)。在實(shí)際使用時(shí),教師不必拘泥于慣例,完全可以在替代性測驗(yàn)以及非學(xué)科內(nèi)容測驗(yàn)中嘗試使用。
(2)據(jù)“任務(wù)難度”和需要測量的“能力目標(biāo)”確定合格分?jǐn)?shù)線。通過一個(gè)測驗(yàn),教師有時(shí)想要了解的是學(xué)生對(duì)特定內(nèi)容的掌握程度或者某種能力上所達(dá)到的水平,而不是特定內(nèi)容的掌握與否。上面已經(jīng)介紹了用“雙基度”來確定學(xué)科內(nèi)容掌握與否的測驗(yàn)的合格分?jǐn)?shù)線,而對(duì)于在某種能力上所達(dá)到的水平或特定內(nèi)容的掌握程度上,就可以根據(jù)測驗(yàn)所用任務(wù)的難度和所要測量的能力目標(biāo)兩個(gè)維度來確定合格分?jǐn)?shù)線。就課堂教學(xué)評(píng)價(jià)結(jié)果的解釋來說,根據(jù)“任務(wù)難度”和需要測量的“能力目標(biāo)”確定合格分?jǐn)?shù)線的意思是指,首先將一個(gè)測驗(yàn)中的任務(wù)或試題按照所要考查的能力目標(biāo)(認(rèn)知目標(biāo))分類,然后將分類后的試題按照難、中、易分組,最后由有經(jīng)驗(yàn)的教師或?qū)<夜浪愠龃饘?duì)每類試題所應(yīng)達(dá)到的最低要求,從而得出該測驗(yàn)的合格分?jǐn)?shù)線。具體的計(jì)算方法涉及矩陣的計(jì)算,教師可以查閱有關(guān)書籍。
與用“雙基度”來確定合格分?jǐn)?shù)線的方法比較,根據(jù)“任務(wù)難度”和要測量的“能力目標(biāo)”確定合格分?jǐn)?shù)線有以下優(yōu)點(diǎn):因?yàn)椴簧婕霸囶}(或任務(wù))之間所占權(quán)重的比較,避免了用“雙基度”來確定合格分?jǐn)?shù)線中難度和雙基度的矛盾。另外,一些難度大的題目一般包含較高教學(xué)要求和能力水平,在對(duì)學(xué)科知識(shí)的掌握測驗(yàn)中,常常受到限制。而在根據(jù)“任務(wù)難度”和需要測量的“能力目標(biāo)”確定合格分?jǐn)?shù)線的方法中則不受這個(gè)限制,可以將注意力集中在學(xué)生能力水平的考查上。因此,根據(jù)“任務(wù)難度”和需要測量的“能力目標(biāo)”確定合格分?jǐn)?shù)線的方法,除了可以用于學(xué)科內(nèi)容的掌握測驗(yàn)外,還適合用于要求學(xué)生構(gòu)建原創(chuàng)性反應(yīng)的替代性評(píng)價(jià)測驗(yàn)。
(3)根據(jù)“效標(biāo)”來確定合格分?jǐn)?shù)線。這種方法主要用于那些作為“預(yù)測”用的測驗(yàn)。效標(biāo),就是被預(yù)測的行為。根據(jù)“效標(biāo)”來確定合格分?jǐn)?shù)線就是根據(jù)所要預(yù)測的行為的要求來確定合格分?jǐn)?shù)線。用于預(yù)測的課堂教學(xué)評(píng)價(jià)測驗(yàn),就是說教師實(shí)施一個(gè)測驗(yàn)的目的不是了解學(xué)生對(duì)特定知識(shí)的掌握或某一能力的水平,而是要通過這個(gè)測驗(yàn)來預(yù)測學(xué)生將來的某種行為表現(xiàn)。那么這個(gè)測驗(yàn)的合格分?jǐn)?shù)線就要由所預(yù)測的行為表現(xiàn)的要求來確定。下面用一個(gè)例子來說明。
用期中模擬試題的成績來預(yù)測學(xué)生的期末考試成績,如果要求學(xué)生在期末考試中要達(dá)到90分,那么在期中考試中就至少要達(dá)到80分;如果要在期末考試中達(dá)到70分,期中成績就要達(dá)到60分。
上面的“期末考試成績”就是一個(gè)效標(biāo),效標(biāo)的要求高,那么測驗(yàn)的合格分?jǐn)?shù)線也就高,測驗(yàn)合格分?jǐn)?shù)線是由效標(biāo)的要求來決定的。用“效標(biāo)”來確定合格分?jǐn)?shù)線的著眼點(diǎn)是預(yù)測學(xué)生的將來,符合替代性評(píng)價(jià)測驗(yàn)的精神,教師可以在各種替代性評(píng)價(jià)測驗(yàn)結(jié)果的解釋中嘗試使用。關(guān)于根據(jù)“效標(biāo)”來確定分?jǐn)?shù)線的原理以及要求,這里不予闡述,教師可以參看其他書籍。
2.確定不同等級(jí)的分?jǐn)?shù)線
上面介紹了在替代性測驗(yàn)中如何確定合格分?jǐn)?shù)線,但在實(shí)際應(yīng)用中還常常要求在替代性測驗(yàn)中區(qū)分出學(xué)生的不同水平,這時(shí)就需要確定不同等級(jí)和不同等級(jí)的分?jǐn)?shù)線。確定不同等級(jí)在前面章節(jié)闡述得非常清楚,這里不再贅述。對(duì)于確定不同等級(jí)的分?jǐn)?shù)線,教師可以參照上面確定合格分?jǐn)?shù)線的方法,這里也不再重復(fù)。
(四)替代性評(píng)價(jià)測驗(yàn)結(jié)果解釋時(shí)的注意事項(xiàng)
1.注意解釋的客觀性
替代性評(píng)價(jià)測驗(yàn)的一個(gè)主要特點(diǎn)是主觀性強(qiáng),從試題(或任務(wù))、評(píng)估標(biāo)準(zhǔn)的制訂到對(duì)測驗(yàn)的評(píng)估,較之常模參照測驗(yàn),主觀性都比較強(qiáng)。因此,教師在對(duì)替代性測驗(yàn)結(jié)果進(jìn)行解釋時(shí),要盡量做到客觀,合格分?jǐn)?shù)線及不同等級(jí)分?jǐn)?shù)線的確定等盡可能用統(tǒng)計(jì)方法來計(jì)算處理,以最大程度地減少主觀因素在結(jié)果解釋中的影響。
2.注意體現(xiàn)學(xué)生的個(gè)體差異
注重學(xué)生個(gè)體差異,促使學(xué)生在發(fā)展過程中揚(yáng)長避短是替代性評(píng)價(jià)的靈魂。在對(duì)替代性評(píng)價(jià)測驗(yàn)結(jié)果的解釋中,重點(diǎn)介紹的合格分?jǐn)?shù)線的確定從整體上給學(xué)生測驗(yàn)結(jié)果的解釋提供了一個(gè)依據(jù),但在具體解釋時(shí),教師要根據(jù)具體情況對(duì)測驗(yàn)的結(jié)果進(jìn)行進(jìn)一步的較為細(xì)致的解釋,避免籠統(tǒng)的解釋。如,合格分?jǐn)?shù)線確定為65分,如果教師對(duì)測試成績?yōu)?5分和90分的學(xué)生都解釋為“達(dá)到合格要求了”,那么就沒有體現(xiàn)出學(xué)生的差異,所以在對(duì)替代性評(píng)價(jià)測驗(yàn)結(jié)果的解釋中要注意體現(xiàn)學(xué)生的差異。
三、課堂教學(xué)評(píng)價(jià)結(jié)果解釋中要注意的問題
(一) 參照“常模”解釋和參照“標(biāo)準(zhǔn)”解釋的結(jié)合
以上從標(biāo)準(zhǔn)化測驗(yàn)和替代性測驗(yàn)的角度對(duì)課堂教學(xué)評(píng)價(jià)結(jié)果的解釋作了介紹,其中分別重點(diǎn)介紹了參照“常模”的解釋和參照“標(biāo)準(zhǔn)”的解釋。事實(shí)上,參照“常模”的解釋和參照“標(biāo)準(zhǔn)”的解釋只是兩種不同的解釋測驗(yàn)結(jié)果的方式,二者之間并沒有嚴(yán)格的界限,也不相互排斥。教師在使用時(shí),完全可以將二者結(jié)合起來使用,從而既可以了解學(xué)生已經(jīng)掌握的知識(shí)或?qū)@得什么樣的成績(或成就等),又知道學(xué)生各自在團(tuán)體中的位置。
(二) 綜合考慮各方面的因素
以上在介紹測驗(yàn)結(jié)果的解釋時(shí),主要闡述了測驗(yàn)分?jǐn)?shù)的轉(zhuǎn)換和解釋,但在實(shí)際應(yīng)用中要對(duì)課堂教學(xué)評(píng)價(jià)結(jié)果作出比較恰當(dāng)、客觀、全面的解釋,教師就必須全面考慮各方面的因素,如測驗(yàn)的信度、效度、學(xué)生的背景因素、測驗(yàn)的環(huán)境因素以及測驗(yàn)的目的等。如,在對(duì)學(xué)生問題解決能力的測驗(yàn)結(jié)果的解釋中,用一些農(nóng)村學(xué)生不常見到的測驗(yàn)任務(wù)就不合適,會(huì)在很大程度上影響農(nóng)村學(xué)生問題解決能力的發(fā)揮。所以,這就要求教師在進(jìn)行測驗(yàn)結(jié)果解釋時(shí),全面綜合地考慮各方面因素,給出一個(gè)盡可能客觀恰當(dāng)?shù)慕忉尅?div style="height:15px;">