作者:田貴森
中小學(xué)英語教學(xué)中的測試與評價
北京師范大學(xué)外文學(xué)院 田貴森
摘 要:本文首先介紹了英語測試與評價的發(fā)展趨勢、基本理念、以及《英語課程標準》(實驗稿)對中小學(xué)英語教學(xué)及測試與評價的要求;然后從一線教師的角度討論了中小學(xué)英語教師在教學(xué)中實行形成性評價的意義、原則和做法。
關(guān)鍵詞:英語測試;中小學(xué)英語教學(xué);評價;形成性評價
一、引言
英語教學(xué)和英語測試(testing)與評價(assessment)是教學(xué)過程中密不可分的兩個部分。有教學(xué)的地方就會有測試和評價。測試和評價的原則和方法總是對教學(xué)有著非常強的反撥作用(backwash),也就是影響。這種反撥作用既可能是正面的,可以促進教學(xué);也可能是負面的,會沖擊教學(xué)。因此,了解并掌握英語測試與評價的基本理念和方法有助于中小學(xué)老師的英語教學(xué)工作。本文重點介紹英語測試和評價的發(fā)展趨勢、基本理念和中小學(xué)英語測試與評價的基本要求;并介紹形成性評價在中小學(xué)英語教學(xué)中的原則和做法。
二、英語測試與評價的發(fā)展趨勢
近年來,我國的外語教育發(fā)展很快,外語測試和評價工作也有了突出的發(fā)展和改進。綜觀英語測試和評價的發(fā)展,有四個方面的進展和趨勢。
(1)外語測試成為一門獨立的學(xué)科
我們平常覺得很普通的英語測試和評價工作,實際上涉及到多方面的理論和知識。到了二十世紀六十年代,外語測試已經(jīng)發(fā)展成為一門多學(xué)科交叉的跨領(lǐng)域?qū)W科,其理論和應(yīng)用涉及普通語言學(xué)、應(yīng)用語言學(xué)、社會語言學(xué)、心理語言學(xué)、外語教學(xué)法、心理統(tǒng)計、教育測量和計算機科學(xué)等。外語測試主要通過研究各種外語測試的指導(dǎo)思想、測試目的、考試內(nèi)容、方法、命題技巧、評分以及通過數(shù)據(jù)分析、評價測試和學(xué)生成績,探討外語測試的規(guī)律。
(2)標準化外語測試普遍使用
70年代以來,我國外語考試的改革走在了其他學(xué)科的前面。英語界最早引進多項選擇題和完形填空測試方法,為題型的改革作了有益的嘗試。1981年我國研制開發(fā)了第一個英語標準化考試(EPT),在此基礎(chǔ)上,又發(fā)展了CET、MET、PETS等有影響的英語標準化考試,并先后引進了光電閱讀器閱卷和計算機英語考試(高蘭生等,1996)。大規(guī)模測試試卷的設(shè)計、制作、實施和使用的標準化程度得到提高。
(3)交際語言測試受到重視
近二十年來,隨著交際教學(xué)法的發(fā)展,以考核學(xué)生語言交際能力為主要目的的交際語言測試(communicative language testing)受到了越來越多的重視,有條件的考試都增加了英語口語和聽力考試。
(4)提倡形成性評價外語測試
近年來,語言學(xué)習(xí)理論關(guān)于語言發(fā)展過程的研究和學(xué)習(xí)者個體差異的研究給外語教師帶來了觀念上的變化。以學(xué)生為中心的外語教學(xué),激勵學(xué)生講英語,鼓勵學(xué)生多投入,多練習(xí),通過學(xué)生的體驗、參與、實踐和合作,形成積極的學(xué)習(xí)態(tài)度,促進語言實際運用能力的教學(xué)理念受到關(guān)注。形成性評價和終結(jié)性相結(jié)合的多元評價體系成為新課程評價改革的主要目標。
三、英語測試與評價的主要作用
英語測試和評價在英語教學(xué)中的作用和功能,主要有以下六個方面,分別是:
(1)診斷語言程度
主要是了解學(xué)生現(xiàn)有語言水平,發(fā)現(xiàn)和診斷語言學(xué)習(xí)中的問題,英語中稱為“diagnostic test”,如:新生入學(xué)后的“摸底考試”。教師可根據(jù)測試的成績和信息,修訂或調(diào)整教學(xué)計劃,或根據(jù)學(xué)生的水平進行分班。
(2)檢查學(xué)習(xí)進度
主要是檢查和評價學(xué)生在某一階段或某一課程學(xué)習(xí)中對所學(xué)內(nèi)容的掌握情況,英語中稱為“achievement test”,如:期中考試、期末考試??荚噧?nèi)容應(yīng)是學(xué)什么,考什么。教師可根據(jù)學(xué)生的成績,發(fā)現(xiàn)問題,制定相應(yīng)的補救措施,改進教學(xué)。
(3)衡量英語水平
主要是測量學(xué)生英語語言知識和綜合運用英語的總體水平,英語中稱為“proficiency test”,如:美國的托福考試(TOEFL)。考試內(nèi)容不針對任何教材和課程。主要用來篩選和選拔人才,試題難易有跨度,以利于區(qū)分考生的優(yōu)劣程度。
(4)預(yù)測外語學(xué)習(xí)
主要是預(yù)測學(xué)生是否具有學(xué)習(xí)外語的天賦或潛在能力,英語中稱為“aptitude test”。考試不太關(guān)注學(xué)生已掌握了多少東西,主要關(guān)注考生識別、理解、模仿、記憶、歸納和學(xué)習(xí)一門新的語言的能力。這種考試主要用來幫助選拔人才或選擇專業(yè)。
(5)激勵學(xué)生學(xué)習(xí)
前四項作用和功能是四種主要的測試類型。從教師的角度來看測試。還可以再列出一種功能,就是激勵學(xué)生學(xué)習(xí)。如果期望學(xué)生在英語學(xué)習(xí)的某一方面有所進展,老師可以“just test it”。因為要考試,學(xué)生會努力學(xué)習(xí),這種考試要做到考試形式容易有趣,語言素材真實實用。
(6)評價教學(xué)科研
作為教師,除了教學(xué)工作外,還會經(jīng)常做一些教學(xué)研究。如:探討教學(xué)方法或教材;研究學(xué)生學(xué)習(xí)的個體差異。要客觀地回答我們的研究課題,或驗證我們的假設(shè),需要根據(jù)考試的結(jié)果進行分析和判斷。
以上的討論是從語言測試和評價整個學(xué)科的角度歸納的。具體到中小學(xué)英語教學(xué),特別是小學(xué)階段的教學(xué),測試和評價工作要重視發(fā)揮測試的激勵和改進功能,淡化和弱化測試的篩選和選拔功能。
四、英語測試與評價的主要標準
英語測試與評價是檢測學(xué)生綜合語言運用能力發(fā)展程度的重要途徑。好的語言測試一般應(yīng)具有五個特征:即,有效性(validity)、可靠性(reliability)、區(qū)分性(discrimination)、實用性(feasibility)和教育性,即良好的反撥作用(backwash effect)。
(1)有效性,(效度)指語言測試能測出預(yù)定要測量的事物的程度,或能夠引起預(yù)報作用的程度。如:用作文考查寫作能力就比用多項選擇題有效。用聽寫考查聽力,評分不當(dāng),考試有效性就會降低。有效性反映在測試的不同方面,驗證有效性要通過多種途徑收集數(shù)據(jù)。如:內(nèi)容有效(考試內(nèi)容的代表性,選擇內(nèi)容應(yīng)廣泛)、結(jié)構(gòu)有效(試卷結(jié)構(gòu)的合理性,兼顧語言內(nèi)容和技能的各個方面)、共時有效(現(xiàn)行考試與以往成績的關(guān)系,與教師掌握的情況相比較)、預(yù)測有效(考試成績與學(xué)生以后發(fā)展的關(guān)系)、答題有效(學(xué)生答題情況:是否認真,是否作弊)等。
(2)可靠性,(信度)指語言測試的測量結(jié)果一致性的程度。包括考試的可靠性(穩(wěn)定一致的程度)和評分的可靠性(穩(wěn)定一致的程度)。
(3)區(qū)分性,(區(qū)分度)指某次語言測試能夠區(qū)分參加考試學(xué)生優(yōu)劣的程度。檢驗試題的區(qū)分度,主要是測算難易度和區(qū)分度。如:我們出了50道題,100個人來做。有的題,100人全都做錯了,或100人全都做對了,這樣的題就是太難了或太容易了。好的試題的難易度在30-70之間。有的題,如果水平好的同學(xué)做對了,水平差的同學(xué)做錯了,這樣的題就有一定的區(qū)分度。測算的時候,要把學(xué)生分為三組,比較高分組和低分組答題的情況。有的題,如果水平好的同學(xué)和水平差的同學(xué)做對的一樣多,就是沒有區(qū)分度。如果水平好的同學(xué)做錯了,水平差的同學(xué)猜對了,這樣的題就是廢題,一定要淘汰。
(4)實用性,指實施語言測試的難易程度,投入的人力和財力;評卷的難易程度和解釋分數(shù)的難易程度。如:大規(guī)??荚囈紤]便于操作和試卷保密、主觀題評分的可靠性等方面。
(5)教育性,即良好的反撥作用,指語言測試對語言教學(xué)和學(xué)生學(xué)習(xí)的反撥作用和影響。好的外語測試應(yīng)對受測者和教育者起正確引導(dǎo)和教育作用。如:國家教育部希望提高學(xué)生外語的聽說能力和語言運用能力,希望學(xué)校方面多花些時間在聽力技能教學(xué)上,決定在高考中引進聽力測試,由此產(chǎn)生的反撥作用是老師和學(xué)生在聽力技能方面的重視和投入以及提高??梢钥闯?,這種測試對全面提高學(xué)生的語言能力有促進作用,具有教育性。但是,也有一些測試或試題設(shè)計的不錯,區(qū)分度很高,也便于實施,但是,使用不當(dāng),對教學(xué)會產(chǎn)生副作用,如:外語測試中的多項選擇題。由于使用過多,加之部分教師誤導(dǎo),不少同學(xué)產(chǎn)生誤解,認為學(xué)外語就是做多項選擇題,多做多項選擇題就能學(xué)好外語?;蚩浯鬁y試的功能,把測試成績絕對化。用模擬考試、做試題沖擊教學(xué),替代講課和練習(xí),把生動活潑的外語教學(xué)變成枯燥的應(yīng)試技巧訓(xùn)練,都是測試負面的或有害的反撥作用。
五、新時期中小學(xué)英語測試與評價的基本要求
《英語課程標準》(實驗稿)指出,測試與評價的三個主要目的是:“使學(xué)生在英語課程的學(xué)習(xí)過程中不斷體驗進步與成功,認識自我,建立自信,促進學(xué)生綜合語言運用能力的全面發(fā)展;使教師獲取英語教學(xué)的反饋信息,對自己的教學(xué)行為進行反思和適當(dāng)?shù)恼{(diào)整,促進教師不斷提高教育教學(xué)水平;使學(xué)校及時了解課程標準的執(zhí)行情況,改進教學(xué)管理,促進英語課程的不斷發(fā)展和完善。”《英語課程標準》(實驗稿)主張建立能激勵學(xué)生學(xué)習(xí)興趣和自主學(xué)習(xí)能力發(fā)展的評價體系,評價體系應(yīng)由形成性評價(formative assessment)和終結(jié)性評價(summative assessment)構(gòu)成。
《英語課程標準》(實驗稿)建議終結(jié)性評價(如期末考試、結(jié)業(yè)考試等)要注重檢測學(xué)生綜合運用語言技能和語言應(yīng)用能力。終結(jié)性評價是反映教學(xué)效果、學(xué)校辦學(xué)質(zhì)量的重要指標之一,要客觀、科學(xué)、全面考查學(xué)生在經(jīng)過一段時間學(xué)習(xí)后所具有的英語水平。測試應(yīng)包括口試、聽力考試和筆試等形式?!队⒄Z課程標準》(實驗稿)同時指出形成性評價是教學(xué)的重要組成部分和推動因素。在英語教學(xué)過程中,應(yīng)以形成性評價為主,注重培養(yǎng)和激發(fā)學(xué)生學(xué)習(xí)的積極性和自信心。一線英語教師應(yīng)善于將形成性評價有機地融入教學(xué)過程,營造開放寬松的評價氛圍,形成生動、活潑、開放的學(xué)習(xí)氣氛。同時應(yīng)了解和熟悉終結(jié)性評價的要求和形式,觀察兩種不同形式的評價結(jié)果,分析和研究兩種評價的相關(guān)程度,以全面評價學(xué)生學(xué)習(xí)效果并反思教師教學(xué)工作。
六、形成性評價的主要原則和方法
形成性評價注重對學(xué)生發(fā)展和學(xué)習(xí)的作用。形成性評價的主要目的是激勵學(xué)生學(xué)習(xí),幫助學(xué)生有效調(diào)控自己的學(xué)習(xí)過程,使學(xué)生獲得成就感,增強自信心。教學(xué)課程中進行的向?qū)W生和教師說明學(xué)生學(xué)習(xí)進展的測試,只包括被教的內(nèi)容,說明學(xué)生是否需要增加學(xué)習(xí)量或注意力。形成性測試通常以及格或不及格表示,如果不及格,學(xué)生就得加強學(xué)習(xí)并重新參加考試。
形成性評價的主要主張和特點為:
1.重視語言學(xué)習(xí)的過程,而不是語言學(xué)習(xí)的結(jié)果;
2.重視動態(tài)的進步,而不是靜態(tài)的位置;
3.認為學(xué)習(xí)和測試是有機的整體,而不是分階段的、分離的任務(wù);
4.語言學(xué)習(xí)本身是一個不斷學(xué)習(xí)的終身教育,而不是考試前的階段性任務(wù);
5.鼓勵合作性學(xué)習(xí),而不是學(xué)生間的競爭或攀比;
6.重視學(xué)生是否達到課程的標準,而不是學(xué)生的成績在班里的位次;
7.關(guān)注學(xué)生的進步和能力,而不是學(xué)生的弱點和失??;
8.重視學(xué)生參與和進步(建立學(xué)生檔案),而不是一次的考試成績(保存試卷);
9.注重試題或評價的多種可能性答案,而不是答案的唯一性;
10.鼓勵教師開發(fā)有意義的課程內(nèi)容,而不是為考試、為名次教學(xué)。
形成性評價的實踐還是一個新的課題,方法是多樣的。這里我們列出幾種主要的形式(Genesee,2001),供老師們參考。
1.課堂觀察(classroom observation),教師通過對學(xué)生在課堂上聽課、交談、使用教材或運用語言的觀察,評價學(xué)生的學(xué)習(xí)情況。觀察記錄可以是表格統(tǒng)計的形式或日記形式。
2.學(xué)生成績檔案(portfolios),教師可以為學(xué)生建立一個檔案袋,記錄學(xué)生在學(xué)習(xí)過程中所做的努力和取得的成績,增強學(xué)生的參與意識和學(xué)習(xí)熱情,并作為自我評價的依據(jù)。
3.學(xué)習(xí)周記(journals),安排學(xué)生每周寫周記總結(jié)和歸納本周的學(xué)習(xí)內(nèi)容,分享喜悅,反思不足,總結(jié)經(jīng)驗,探討技巧,是學(xué)生和老師交流的有效途徑。也可以安排學(xué)生寫讀書筆記(reading journals),通過寫讀后感思考問題,表達自己。
4.問卷調(diào)查(questionnaire),給學(xué)生發(fā)放問卷,通過問卷,引導(dǎo)學(xué)生有效地、正確地評價自己的學(xué)習(xí)。問卷可以是自我評價,也可以是相互評價。
5.面談(interview),教師可定期安排與學(xué)生面談,通過面談了解學(xué)生對自己學(xué)習(xí)情況的的感受和看法,以評價學(xué)生的進展和問題。
6.討論(students conference),安排學(xué)生座談,給學(xué)生提供相互交流的機會,這種互動討論為教師提供了具體的評價機會。
進行形成性評價時,要有計劃地根據(jù)教學(xué)內(nèi)容靈活設(shè)計,做到持之以恒。評價要有利于學(xué)生的情感投入,有利于學(xué)生的自主學(xué)習(xí),有利于培養(yǎng)學(xué)生的學(xué)習(xí)策略,有利于學(xué)生生動活潑地學(xué)習(xí)。
七、結(jié)語
學(xué)習(xí)和了解語言測試的基本理論,認識英語教學(xué)和英語測試與評價的相互依存關(guān)系,規(guī)范和改進英語教學(xué)中的測試和評價工作,學(xué)習(xí)《英語課程標準》(實驗稿)關(guān)于測試與評估的理念與建議,已經(jīng)成為新世紀英語教師提高自身業(yè)務(wù)水平的必修內(nèi)容。只要我們創(chuàng)造性地運用形成性評價和終結(jié)性評價測試手段,將形成性評價有效地引入自己的課堂教學(xué),利用語言測試對教學(xué)的反撥作用,激勵和引導(dǎo)學(xué)生生動活潑地學(xué)習(xí),我們就一定能夠提高英語教學(xué)效率,提高英語教學(xué)研究的水平。
參考文獻
[1]Genesee,F(xiàn)red &Johna A.Upshur.Classroom-based Evaluation in Second Language Education[M].Beijing:Foreign Language Teaching and Research Press,2001.
[2]Heaton,J.B.Writing English Language Tests[M].Beijing:Foreign Language Teaching and Research Press,2000.
[3]Hughes,Arthur.Testing for Language Teachers[M].Cambridge:Cambridge University Press,1991.
[4]陳琳,王薔,程曉堂.英語課程標準解讀[M].北京:北京師范大學(xué)出版社,2002.
[5]高蘭生,陳輝岳.英語測試論[M].南寧:廣西教育出版社,1996.
[6]劉潤清,韓寶成.語言測試和它的方法[M].北京:外語教學(xué)與研究出版社,2000.
[7]武尊民.英語測試的理論與實踐[M].北京:外語教學(xué)與研究出版社,2002.
[8]中華人民共和國教育部.英語課程標準(實驗稿)[Z].北京:北京師范大學(xué)出版社,2001.
(注:本文是作者2003年4月13日在杭州“全國小學(xué)、初中英語外語教學(xué)(TEFL)專家學(xué)術(shù)報告和優(yōu)秀課例觀摩會”上的發(fā)言,在本刊發(fā)表時做了適當(dāng)修改。)