亚洲免费无码av|久久鸭精品视频网站|日韩人人人人人人人人操|97人妻免费祝频在找|成人在线无码小视频|亚洲黄片无码在线看免费看|成人伊人22网亚洲人人爱|在线91一区日韩无码第八页|日韩毛片精品av在线色婷婷|波多野主播在线激情婷婷网

歡迎訪問愛發(fā)表,線上期刊服務(wù)咨詢

試卷質(zhì)量分析8篇

時間:2022-09-13 16:08:04

緒論:在尋找寫作靈感嗎?愛發(fā)表網(wǎng)為您精選了8篇試卷質(zhì)量分析,愿這些內(nèi)容能夠啟迪您的思維,激發(fā)您的創(chuàng)作熱情,歡迎您的閱讀與分享!

試卷質(zhì)量分析

篇1

[關(guān)鍵詞)試卷分析;教學(xué)評估;程序

試卷分析是教學(xué)質(zhì)量監(jiān)控體系的重要組成部分,其目的是為了進(jìn)一步提高課程考試的科學(xué)性和嚴(yán)密性,不但可為教學(xué)效果反饋信息,還可以為改善題庫、改進(jìn)教學(xué)提供參考。

上海中醫(yī)藥大學(xué)的試卷分析針對的是專業(yè)基礎(chǔ)課和專業(yè)課課程。校方采用標(biāo)準(zhǔn)答題卡,通過光標(biāo)閱讀機將答題信息讀取到計算機,用FOXPRO程序編寫試卷分析程序。輸出的試卷分析報表包括3部分:考試成績、試題質(zhì)量分析和試卷質(zhì)量分析。本文就試卷分析系統(tǒng)的設(shè)計特點及實現(xiàn)功能作一介紹。

1設(shè)計特點

1.1運行環(huán)境

該校試卷分析系統(tǒng)采用的是光標(biāo)閱讀機與計算機相結(jié)合的工作方式。校方使用的光標(biāo)閱讀機(OpticalMarkRead―er,OMR)是一個通用閱讀系統(tǒng),它可以完成信息卡格式編輯、選紙、通用閱讀、評分、結(jié)果文件瀏覽及標(biāo)準(zhǔn)答案打印等功能。OMR通過閱讀答題卡上的涂點信息,轉(zhuǎn)化為計算機可識別的文本方式和FOXPRO數(shù)據(jù)庫文件方式,便可達(dá)到將信息錄入計算機的目的。

計算機采用Windows98以上操作系統(tǒng)即可,安裝FOX―PR06.0軟件,在此環(huán)境下編寫試卷分析程序,接收來自O(shè)MR的數(shù)據(jù),完成各項分析功能,教學(xué)研究并輸出分析報表。

1.2試卷編制要求

所使用的標(biāo)準(zhǔn)答題卡是根據(jù)該校實際情況設(shè)計的,包括客觀題和主觀題。試卷分析系統(tǒng)對試卷編制的要求是:客觀題數(shù)≤75題,可以是單選題、多選題;是非題;主觀題數(shù)≤30題。對試題分?jǐn)?shù)的限制:主觀題每小題的滿分不得大于9.9分。學(xué)生答題卡客觀題部分考試時由學(xué)生填涂,主觀題得分由教師閱卷后統(tǒng)一填涂,標(biāo)準(zhǔn)答案卡由教師填涂,教師還要填寫一份考試信息卡,其中信息用于系統(tǒng)中試卷數(shù)據(jù)庫的建立。

2實現(xiàn)功能

此試卷分析系統(tǒng)目前實現(xiàn)的功能包括考試成績的輸出、試題質(zhì)量分析和試卷質(zhì)量分析。

2.1考試成績輸出

考試成績報表輸出字段包括:學(xué)生學(xué)號、客觀題分?jǐn)?shù)、主觀題分?jǐn)?shù)和總分。

2.2試題質(zhì)量分析

校方采用的分析指標(biāo)有每道試題的難度、區(qū)分度以及客觀題的備選答案選答比例。

2.2.1試題難度分析系統(tǒng)給出每道題目的難度指數(shù)。難度是指試題的難易程度,是評價試題質(zhì)量的一個量化指標(biāo),過難,或過易都不能真實、準(zhǔn)確地反映出考生的實際水平。因此,難度指數(shù)可以用來篩選題目。[1]難度指數(shù)越大,試題的難度越大;難度指數(shù)越小,試題的難度越小。一般認(rèn)為,難度指數(shù)在0.65以上的為較難,在0.35~0.65之間為難度適中,在0.35以下則試題比較容易。為更好地檢驗學(xué)生對知識的掌握,通常應(yīng)以難度適中的試題占多數(shù)為好。

2.2.2試題區(qū)分度 區(qū)分度是指試題對考生實際水平的區(qū)分程度和鑒別能力。區(qū)分度是反映試題效用高低的參數(shù),好的試題應(yīng)能反映各檔次學(xué)生的知識掌握水平,即拉開學(xué)生的得分檔次。如果有的試題全體學(xué)生都不會,或者都會,就說明該試題區(qū)分度低。區(qū)分度是評價試題質(zhì)量,篩選試題的主要指標(biāo)與依據(jù)。

美國測驗專家RobertEbel根據(jù)長期實驗研究提出區(qū)分度的標(biāo)準(zhǔn):區(qū)分度指數(shù)在0.40以上的說明試題區(qū)分度很好,區(qū)分度指數(shù)在0.3~0.4之間的說明試題良好但改進(jìn)更佳,區(qū)分度指數(shù)在0.20~0.29之間說明試題尚可但仍需修改,在0.20以下則表明試題區(qū)分度較差應(yīng)淘汰或修改。

一道試題的質(zhì)量由該試題的難度和區(qū)分度共同構(gòu)成,當(dāng)試題的難度系數(shù)在適中的范圍內(nèi),而且有相對較高的區(qū)分能力時,這道題就被看成是質(zhì)量好的試題。

2.2.3客觀題備選答案選答比例 分析系統(tǒng)給出每道客觀題各個備選項的選答人數(shù)百分比。它提示我們題目可能在以下幾方面存在問題:①如果所有考生都選擇的是正確答案,則說明該題目太容易或者題目中可能提供了某種暗示。②如果某個錯誤答案沒有一個考生選擇,說明該備選答案不具有迷惑性,錯得過于明顯。一般說來,除非有2%以上的人選擇,否則這個備選答案則應(yīng)該修改。③如果大部分或全部考生都選擇了同一個錯誤答案,可能是編制測驗時把答案定錯了,也可能是在教學(xué)中發(fā)生了錯誤。④如果高分組考生的選擇集中在兩個答案上,二者選擇比例很相近,提示該題可能存在兩個正確答案或另一答案也有道理。⑤如果某題目考生未答人數(shù)過多或選擇各個備選答案人數(shù)相等,則說明題目過難或題意不清,使得考生無法作答或是僅憑猜測作答。

2.3試卷質(zhì)量分析

校方選用了集中量分析、差異量分析、試卷信度、成績頻數(shù)分布、試卷難度分布情況和試卷區(qū)分度分布情況作為評定指標(biāo)。

2.3.1集中量分析給出試卷滿分和平均分。平均分反映學(xué)生成績的總體水平,理想狀況在70分~80分之間。

2.3.2差異量分析給出最高分、最低分和標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)差反映學(xué)生成績的離散程度,用以檢驗考試區(qū)分學(xué)生掌握學(xué)業(yè)內(nèi)容程度的能力。標(biāo)準(zhǔn)差越大表明成績的離散度越大,通常標(biāo)準(zhǔn)差在9分~13分之間較為理想。

2.3.3試卷信度信度是衡量一個試卷質(zhì)量高低的重要指標(biāo)之一。信度高的試卷表明考試能較真實地反映出學(xué)生的學(xué)業(yè)水平。信度不合要求的試卷是不能使用的。校方采用克朗巴赫a信度系數(shù)。

通常影響信度的因素包括:①樣本情況。樣本的異質(zhì)程度與分?jǐn)?shù)的分布有關(guān),樣本越是異質(zhì),其分?jǐn)?shù)分布的范圍也就越大,信度系數(shù)也越高。②題目數(shù)量。一般來說,測驗越長,試題越多,信度值越高。這是因為測驗加長后,試題取樣的代表性增加,每個題目的隨機誤差也較小。③難度。測驗的難度與信度沒有直接對應(yīng)關(guān)系,但當(dāng)測驗太難或太易時則分?jǐn)?shù)的范圍就會縮小,從而降低信度。

2.3.4成績頻數(shù)分布分析系統(tǒng)以10分為組距、成績?yōu)闄M坐標(biāo)、人數(shù)為縱坐標(biāo)給出成績頻數(shù)分布圖。它的作用是,當(dāng)成績分布曲線呈正偏態(tài)時,說明低分學(xué)生多,可能題目偏難;成績分布曲線呈負(fù)偏態(tài)時,說明高分的學(xué)生較多,可能題目偏容易;而理想狀態(tài)為成績呈正態(tài)分布,此時說明成績很好和很差的學(xué)生較少,接均分的學(xué)生較多。

2.3.5試卷難度分布難度對考試的影響主要表現(xiàn)在:①影響考試成績的分布形態(tài),正常人群智力的高低分布服從正態(tài)分布,所以在適宜難度的考試中,學(xué)生的成績分布應(yīng)基本服從正態(tài)分布,難度過大或過小都會使成績分布偏離正態(tài)。②影響考試成績的離散度,過難或過易的考試會使成績相對集中在高分端或低分端。③影響考試區(qū)分度。一套高質(zhì)量的試卷應(yīng)該合理分配題目的難度,整個試卷的平均難度基本控制在0.35~0.65之間,試題難、中、易的比例大致為20%、60%、20%。

2.3.6試卷區(qū)分度分布分析系統(tǒng)匯總整個試卷上所有題目的區(qū)分度,以區(qū)分度值從0~1.0為橫坐標(biāo),以不同區(qū)分度值的試題數(shù)為縱坐標(biāo),給出整個試卷上區(qū)分度分布情況。通過區(qū)分度分布分析,可以提示試卷是否需要進(jìn)一步改進(jìn)。

篇2

關(guān)鍵詞:機械制圖;競賽;試卷分析;評價

中圖分類號:G642.4文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2012)16-3892-03

Analysis and Evaluation of Contest Test Paper of Mechanical Drawing

FANG Qing-hua

(College of Electromechanical & Architectural Engineering,Jianghan University,Wuhan 430056,China)

Abstract: The difficulty, distinction, coverage and reliability of examination papers were analyzed in this paper. The results show that the difficulty coefficient was 0.598, the distinction coefficient was 0.504, the coverage coefficient was 0.762, the paper reliabity was 0.667. The difficulty of the test was more difficult, the distinction was good and thus test was reliable. This paper suggests some recommendations how to raise the level of preparing test papers and adjust arrangement of the teaching in the future.

Key words: mechanical drawing; contest; analysis of test paper; evaluation

機械制圖是一門工科學(xué)生的專業(yè)技術(shù)基礎(chǔ)課,是后續(xù)課程學(xué)習(xí)、課程設(shè)計和畢業(yè)設(shè)計不可缺少的工具。在制圖教學(xué)中開展競賽不僅是檢查教學(xué)效果的一種有效手段,更能促進(jìn)學(xué)生自主學(xué)習(xí)。而命題對于競賽而言又是中心環(huán)節(jié)。題目設(shè)計得過于簡單,與平時的期中期末考試區(qū)別不大,調(diào)動不了學(xué)生學(xué)習(xí)積極性;題目設(shè)計過難、過偏,又達(dá)不到以賽促學(xué)的目的。該文給出了此次競賽試卷質(zhì)量的分析方法和分析結(jié)果,以對該競賽作出正確地分析和評價,更有利于以后的教學(xué)改革,從而提高學(xué)生的綜合應(yīng)用能力。

[1]馬治勇,謝良軍,車承紅.臨床藥學(xué)專業(yè)藥理學(xué)試卷分析與評價[J].中華醫(yī)學(xué)教育雜志,2008,28(5):120-122.

[2]趙景波.流行病學(xué)試題質(zhì)量評價研究[J].疾病控制雜志,2004,8(4):313-314.

[3]張雅波,李媛媛.試卷質(zhì)量的分析評價模型[J].職業(yè)教育研究,2008(5):51-52.

篇3

一、試卷評閱的總體情況本學(xué)期文科類數(shù)學(xué)期末考試仍按現(xiàn)用全國五年制高等職業(yè)教育公共課《應(yīng)用數(shù)學(xué)基礎(chǔ)》教學(xué),和省校下發(fā)的學(xué)要求和復(fù)習(xí)指導(dǎo)可依據(jù)進(jìn)行命題。經(jīng)過閱卷后的質(zhì)量分析,全省各教學(xué)點匯總,卷面及格率達(dá)到了54%,平均分54.1分,較前學(xué)期有很大的提高,答卷還出現(xiàn)了不少高分的學(xué)生,這與各教學(xué)點在師生的共同努力和省校統(tǒng)一的教學(xué)指導(dǎo)和管理是分不開的。為進(jìn)一步加強教學(xué)管理,總結(jié)各教學(xué)點的教學(xué)經(jīng)驗不斷提高教學(xué)質(zhì)量,現(xiàn)將本學(xué)期卷面考試的質(zhì)量分析,發(fā)給各教學(xué)點,望各教學(xué)點以教研活動的方式,開展討論、分析、總結(jié)教學(xué),確保教學(xué)質(zhì)量的穩(wěn)步提高。

二、考試命題分析1、命題的基本思想和命題原則命題與教材和教學(xué)要求為依據(jù),緊扣教材第五章平面向量;第七章空間圖形;第八章直線與二次曲線的各知識點,同時注意到我省的教學(xué)實際學(xué)和學(xué)生的認(rèn)識規(guī)律,注重與后繼課程的教學(xué)相銜接。以各章的應(yīng)知、應(yīng)會的內(nèi)容為重點,立足于基礎(chǔ)概念、基本運算、基礎(chǔ)知識和應(yīng)用能力的考查。試卷整體的難易適中。2、評分原則評分總體上堅持寬嚴(yán)適度的原則,客觀性試題是填空及單項選擇,這部分試題條案是唯一的,得分統(tǒng)一。避免評分誤差。主觀性試題的評分原則是,以知識點、確題的基本思路和關(guān)鍵步驟為依據(jù),分步評分,不重復(fù)扣分、最后累積得分。

三、試卷命題質(zhì)量分析以平面向量、直線與二次線為重點,占總分的70%左右,空間圖形約占30%左右,基礎(chǔ)知識覆蓋面約占90%以上。試題容量填空題13題,20空,單選題6題,解答題三大題共8小題。兩小時內(nèi)解答各題容量是足夠的,知識點的容量也較充分。平面向量考查基本概念,向量的兩種表示方法,向量的線性運算,向量的數(shù)量積的兩種表示形式,與非零向量的共線條件,兩向量垂直與兩向量數(shù)量積之間的關(guān)系,試題分?jǐn)?shù)約占35%左右。直線與二次曲線考查,曲線與方程關(guān)系,各種直線方程及應(yīng)用,二次曲線的標(biāo)準(zhǔn)方程及一般方程的應(yīng)用,方程中參數(shù)的求解,各幾何要素的確定,試題分?jǐn)?shù)約占35%左右??臻g圖形著重考查平面的基本性質(zhì)、兩線的位置關(guān)系、兩面的位置關(guān)系、線面的位置關(guān)系、三垂線定理的應(yīng)用、異面直線所成的角、線面所成的角、距離計算等問題。表面積和體積的計算,為減輕學(xué)生負(fù)擔(dān)末列入試題中(但復(fù)習(xí)中仍要求應(yīng)用表面積和體積公式),該部份試題分?jǐn)?shù)約占30%。三章考點放在平面向量、直線和二次曲線,其次是空間圖形部份。故考查的主次是分明的,符合高職公共課教學(xué)大綱的要求。

四、學(xué)生答卷質(zhì)量分析填空題:第1至3題考查向量的線性運算和位置向量的坐標(biāo)線性運算,答對率約85%左右,其中大部份學(xué)生對書寫向量遺漏箭頭,部分學(xué)生將第3題的答案(-9,3)答成(9,-3)或(-9,-3)等。符號是不清楚的,反映出部份學(xué)生對向量的線性運算并非完全掌握。第4~7題涉及立體幾何問題,主要考查線面關(guān)系,面面關(guān)系。答對率70%左右,其它學(xué)生主要是空間概念不清,不能確定線面間、平面間的位置關(guān)系。多數(shù)對異面直線的位置關(guān)系不清楚。第8~13題涉及解析幾何的問題,考查曲線方程中的待定系數(shù),直線方程,點到直線的距離問題,情況尚好,答對率70%左右。第11~13題反而答錯率占65%左右,主要反映出學(xué)生對各種二次曲線的標(biāo)準(zhǔn)方程混淆不清,對幾何要素的位置掌握不好,突出表現(xiàn)在對二次曲線的幾何性質(zhì)掌握較差,不牢固。單項選擇題:學(xué)生一般得分為12—18分第1題選對的占80%以上,學(xué)生對平面的基本性質(zhì)中的公理及推論掌握較好。第2題選對的占70%左右,學(xué)生對兩向量垂直與兩向量數(shù)量積之間的關(guān)系掌握較好。答錯較多的是第4和第6題,其次是第5題。第5題多數(shù)錯選(A)或(B),可見學(xué)生對一般圓方程用公式求圓心和半徑不熟悉,同時用配方法化圓的一般方程為圓的標(biāo)準(zhǔn)方程,求圓心和半徑也掌握不好。特別是第4題平行坐標(biāo)軸,坐標(biāo)變換竟有33%的學(xué)生錯選(B)或不選(空白),可見不少學(xué)生對坐標(biāo)軸平移引起坐標(biāo)變換的新概念并不清楚,對新、舊坐標(biāo)的概念也不清楚。第6題不少學(xué)生錯選(B),反映出學(xué)生對向量平行和垂直的條件混淆,判斷兩向量相等的條件也不明確,才會出現(xiàn)如此的錯誤。第三題:(1)題是考查異面直線的成的角及長方體對角的計算。對本題的解答約80%的學(xué)生能找到異面直線A1C1與BC所成的角,但有30%~40%的學(xué)生不習(xí)慣用反正切函數(shù)表示角度,反而用反正弦或反余弦函數(shù)表示角度,教學(xué)中應(yīng)引起跑的重視。計算長方體的對角線長僅有20%的學(xué)生會用簡捷方法“長方體的對角線的平方等于長、寬、高的平方和”。其余學(xué)生計算較繁瑣。(2)題是考查證明三點共線問題。約有80%的學(xué)生采用不同的方法證明,有用解析法的,也有用向量法的,也有用平面幾何與解析幾何綜合知識證明的“三點連線中,兩線之和等于第三線則三點共線”,反映出各教學(xué)點對該問題給出了多種證明法和思路,值得提倡。第(3)題考查根據(jù)不同的己知條件選用向量數(shù)量積的表達(dá)式。第四題:1題主要考查動點的軌跡方程,學(xué)生的解答,多出現(xiàn)兩種方法,按軌跡滿足橢圓定義求解或按求軌跡方程的四大步驟求解,但解答中又出現(xiàn)不少錯誤。第五題:1題是考查由給定雙曲線的條件求它的標(biāo)準(zhǔn)方程和漸近線方程,但不少學(xué)生將雙曲線中的參數(shù)a,b與隨圓中的參數(shù)a、b、c混為一談,對漸逐近線方程掌握不好,不能根據(jù)漸逐線的位置,寫出漸近線的方程。2題主要考查用向量法證明四邊形是矩形的方法,但不少學(xué)生隨心所意,反而用解析幾何的方法去證明,嚴(yán)格講這是錯誤的,應(yīng)該引起重視。有的學(xué)生在證明中邏輯混亂,邏輯推理敘述不嚴(yán)密,在矩形的證明中,用“垂直證明垂直”。對向量的知識掌握不牢固,求向量的坐標(biāo)時,差值的順序不對,導(dǎo)致計算錯誤。第六題:本題是一道立體幾何題,主要考查的知識點一是兩平面垂直的性質(zhì),二是直線與平面所成的角。本題評閱結(jié)果,有近60%的考生得滿分,這些學(xué)生是掌握了考查的知識點,解題思路清晰,能迅速地用兩平面垂直的性質(zhì),證明ΔABC和ΔBDC是直角三角形,求出BC和CD后,又用三角函數(shù)計算CD與平面所成的角。有的學(xué)生構(gòu)造三角形思路靈活,連接AD得直角ΔABD,在此三角形中求出AD,又在直角ΔDAC中求出CD,最后在直角ΔDBC中求出DC與平面所成的角,即∠DCB。在20%的學(xué)生錯答的原因是找不準(zhǔn)直角,把直角邊當(dāng)成斜邊來計算,導(dǎo)致解答錯誤。有近20%的學(xué)生空間概念較差,交白卷,有的認(rèn)為AB與CD是在一個平面上且相交,完全按平面幾何的知識來解答本題,如用全等三角形和相似三角形的知識來解,這是完全沒有空間概念的主要表現(xiàn)。:

五、通過考試反饋的信息對今后教學(xué)的建議通過以上考試命題,試卷質(zhì)量,答卷質(zhì)量,基本概況的綜合分析,實行統(tǒng)一命題,統(tǒng)一考試,統(tǒng)一閱卷是非常必要的。將考試成績通報各教學(xué)點,對互通信息,相互學(xué)習(xí),取長補短,努力改進(jìn)教學(xué)方法,分析和探索初中起點五年制大專教育(高職)的教學(xué)規(guī)律,也是很有必要的。特別是通過考生的答卷分析,各教學(xué)點要開展教研活動,分析教學(xué)中的薄弱環(huán)節(jié),采取有針對性的措施,不斷的提高教學(xué)質(zhì)。

篇4

一、引言

考核是檢驗教學(xué)質(zhì)量最重要的手段之一,試卷的質(zhì)量和學(xué)生考試成績是衡量教學(xué)質(zhì)量的主要方法。通過對試卷分析,可以反饋學(xué)生學(xué)習(xí)情況,評估教學(xué)效果,為進(jìn)一步推進(jìn)教學(xué)改革、提高教學(xué)質(zhì)量提供參考。[1]

雖然目前許多高校在教學(xué)評價方面都呼吁評價形式的多樣化,但試卷測試仍然是最主要的方法,因此試卷質(zhì)量分析成為高校教師教學(xué)過程中的一個必備環(huán)節(jié)。目前多數(shù)學(xué)科如數(shù)學(xué)和醫(yī)學(xué)專業(yè)已經(jīng)重視試卷成績和試題質(zhì)量分析,[2-7]]對世界自然地理的課程與教學(xué)改革方面進(jìn)行研究較少,[8-10]賀丹君等從評價體系上對地理課程進(jìn)行定性分析和評價,未對試卷質(zhì)量進(jìn)行定量分析。[11]然而,《世界自然地理》是高等院校地理專業(yè)的必修課程之一,它最能體現(xiàn)地理學(xué)的綜合性、區(qū)域性和人地相關(guān)性,具有其它地理學(xué)分支學(xué)科不可比擬的優(yōu)勢,所以對《世界自然地理》試卷成績進(jìn)行定量分析,評價試卷的優(yōu)劣是很有必要的。本文對2007級地理科學(xué)專業(yè)57名學(xué)生的世界自然地理期末考試成績進(jìn)行分析,評判試卷對學(xué)生學(xué)習(xí)情況的反映能力,旨在為今后的考試命題和教學(xué)改革提供參考依據(jù)。

二、數(shù)據(jù)來源與研究方法

1. 數(shù)據(jù)來源

2007級地理科學(xué)本文由收集整理專業(yè)的本科生共57名學(xué)生的世界自然地理期末考試試卷。試卷由任課教師命題,試卷評判嚴(yán)格按照評分標(biāo)準(zhǔn)和標(biāo)準(zhǔn)答案進(jìn)行,由任課教師評分。試卷卷面分值滿分為100分,包括4種題型,26道小題:第一題單項選擇題包含15道小題,占總題目數(shù)的57.69%,共15分;第二題簡答題包含5道小題,占總題目數(shù)的19.23%,共40分;第三題填圖題包含4道小題,40個空,占總題目數(shù)的15.38%,共20分;第四題論述題包含2道小題,占總題目數(shù)的7.69%,共25分。

2. 方法

試卷分析主要是指通過收集一定量的原始數(shù)據(jù),按照設(shè)定的評價指標(biāo),運用測量學(xué)和統(tǒng)計學(xué)的理論,通過計算各種統(tǒng)計量數(shù)和繪制統(tǒng)計圖表,對試卷進(jìn)行定量分析和評價。[12]可以針對某一門課程,比較學(xué)生各成績段的比例,分析學(xué)生成績的分布是否合理,與試卷內(nèi)容是否相關(guān)等。評價指標(biāo)可以從教學(xué)大綱、命題、試題數(shù)量比例等方面來設(shè)定。

試卷質(zhì)量的統(tǒng)計分析是運用數(shù)理統(tǒng)計描述和統(tǒng)計推斷的方法,對試卷的數(shù)量特征和數(shù)量關(guān)系進(jìn)行分析和判斷。[12]根據(jù)《教育測量學(xué)》的介紹,[13]本文主要選取難度、區(qū)分度兩個指標(biāo)對試卷質(zhì)量進(jìn)行統(tǒng)計分析。

(1)難度。試題的難度是衡量試題難易程度的指標(biāo)。[13]

在編制試題時,難度分布從易到難,逐步增加難度,這樣有利于考生水平的正常發(fā)揮。試題的難度即考生對該題的通過率或得分率,對于答對得1分、答錯或不答得0分的試題,難度(p)就是答對(或通過)試題的人數(shù)與考生總數(shù)之比:

(1)

式中,r為答對該題的人數(shù),n為考生總數(shù)。

對于滿分量大于1分的試題,難度則是考生對該題的平均得分與該題的滿分之比:

(2)

式中, 為考生對該題的平均得分, 為該題的滿分。p值越大,試題越容易。因為百分制以60分為及格,通常情況下,把平均難度控制在0.45~0.75之間比較合適。[13]試題難度的評價標(biāo)準(zhǔn)見表1。

表1 試題難度的評價標(biāo)準(zhǔn)

(2)區(qū)分度。題目區(qū)分度是指檢驗題目對其學(xué)業(yè)水平不同的考生的區(qū)分程度或鑒別能力,它是學(xué)生掌握知識水平和能力差異的指標(biāo)。[14]通過考試,學(xué)習(xí)好的學(xué)生得到高分,學(xué)習(xí)差的學(xué)生得到低分,則說明試題的區(qū)分度高;如果學(xué)生中好、中、差三個層次的考試成績處于同一個分?jǐn)?shù)段中,就反映不出學(xué)生學(xué)習(xí)水平,那么這樣的試題區(qū)分度就低。所以一般采用比較方便的兩端分組法來計算試題的區(qū)分度。所謂兩端分組法,即當(dāng)測試成績成正態(tài)分布時,將考試總分進(jìn)行排序,然后選出得分最高的27%列為高分組,將得分最低的27%列為低分組。區(qū)分度計算公式如下:

,其中i=1,2,3,……n (3)

式中, 和 分別表示全體考生中的高分組和低分組中第i題的平均分; 表示第i 題的滿分值。d≥0.40為優(yōu)秀;0.30≤d<0.40為良好;0.20≤d<0.30為尚可,需改進(jìn);d<0.20為劣,需淘汰或修改。[15]試題區(qū)分度的評價標(biāo)準(zhǔn)具體見表2。

表2 試題區(qū)分度的評價標(biāo)準(zhǔn)

3. 結(jié)果分析

從2007級地理科學(xué)專業(yè)世界自然地理期末考試的成績分布來看,試卷滿分為100分,客觀題總分為35,主觀題總分為65,學(xué)生考試的平均成績?yōu)?8.35,最高分為91,最低分40.5,標(biāo)準(zhǔn)差10.10,及格率為80.7%,不及格率為19.3%。

一是課程成績分布情況分析。

(1)試卷總成績分布:2007級地理科學(xué)班的57名學(xué)生,有39名學(xué)生成績分布在60~79分內(nèi),占68.42%;有6名學(xué)生成績分布在80~89分內(nèi),占10.53%;有10名學(xué)生成績分布在50~59分內(nèi),占17.54%;僅1名學(xué)生成績高于90分和低于40分,各占1.75%,見表3。通過繪制成績分布直方圖可以看出,該班期末成績總體呈正態(tài)分布,見圖1。教育統(tǒng)計學(xué)統(tǒng)計規(guī)律表明:學(xué)生的智力水平,包括學(xué)習(xí)能力,實際動手能力等呈正態(tài)分布??荚嚦煽兎植紤?yīng)基本服從正態(tài)分布,這樣才能真實反映學(xué)生的實際,也能夠說明試卷設(shè)計是合理和具有科學(xué)依據(jù)和實際意義的。[15]本試卷總成績呈正態(tài)分布,說明試卷總體設(shè)計合理、可靠、科學(xué)。

轉(zhuǎn)貼于

表3 《世界自然地理》期末考試總成績分布情況

圖1 《世界自然地理》期末考試成績分布圖

(2)試卷各大題成績分布。該試卷共四個大題,因為各題總分不一樣,所以把各大題以100分為基準(zhǔn),對分?jǐn)?shù)段進(jìn)行折合計算,具體各分?jǐn)?shù)段的人數(shù)和比例見表4。通過對各大題繪制直方圖可以看出,單選題、填圖題成績分布呈偏正態(tài)分布,簡答題成績呈偏態(tài)分布,但是沒有單選題和填圖題嚴(yán)重,大體還呈正態(tài)分布,這看出就大題而言,單選和填圖題設(shè)計過于簡單,不能很好反應(yīng)學(xué)生的學(xué)習(xí)能力,但是單選和填圖屬于識記類知識類型,本來就不好區(qū)分學(xué)生層次,所以總體看來還是符合實際的;簡答和論述題成績大致呈正態(tài)分布,能較好地體現(xiàn)學(xué)生學(xué)習(xí)效果的差異和智力水平,設(shè)計很好,見圖2。

二是難度、區(qū)分度分析。從總成績看,試卷難度為0.680,試卷區(qū)分度為0.402,表明整卷難度適中,區(qū)分度好,總體來說試卷質(zhì)量優(yōu)良。在各大題中,難度都適中,區(qū)分度除了單項選擇題為0.29,試題尚可,須進(jìn)一步改進(jìn)外,其它三道大題都為優(yōu)良。結(jié)合2007級地理專業(yè)的學(xué)生為理科生的專業(yè)背景,地理基礎(chǔ)知識相對薄弱的實際情況,可以看出該試卷的論述題等反映綜合能力的試題偏難,但區(qū)分度較好,適合考核學(xué)生的實際學(xué)習(xí)水平,有利于提高學(xué)生考試的有效性程度,見表5。

三、結(jié)論及建議

通過結(jié)果分析可以看出,該試卷整體的命題結(jié)構(gòu)好,學(xué)生總成績和大部分大題成績呈正態(tài)分布,試題難度適中,除了選擇題之外,其他題型區(qū)分度很好。建議以后命題要嚴(yán)格按照教學(xué)文件規(guī)定的要求,不斷完善命題工作,特別是選擇題的要加強命題的難度和區(qū)分度,同時應(yīng)該從新課改的理念出發(fā),不斷改進(jìn)命題工作,讓考試在教學(xué)過程中發(fā)揮其應(yīng)有的積極作用。

1. 試卷構(gòu)成

整卷共四道大題,26道小題,客觀題和主觀題的比例為7:13;客觀題主要考核學(xué)生對世界自然地理的基本概念及基本知識的掌握與理解的程度,而主觀題則是考核學(xué)生歸納總結(jié)、分析、理解和應(yīng)用知識的能力。本試卷考試內(nèi)容覆蓋面較廣,基本涵蓋教學(xué)大綱要求的大部分教學(xué)知識點,符合教學(xué)大綱的要求。該試卷試題綜合了教學(xué)大綱的多個知識點,適當(dāng)增加了一定的難度和深度。試卷結(jié)構(gòu)記憶類占20%,理解類占40%,簡單類占15%,綜合應(yīng)用類占25%;試卷各類題型所占的比例均符合教學(xué)要求,難度適中則反映出本課程的基本知識點、重點和難點。

2. 考試成績分布

由于2007地科班屬于理科生,沒有高中地理知識的基礎(chǔ),所以本次試卷的命題不但注重學(xué)生綜合分析能力的提升,同時也關(guān)注學(xué)生的地理基礎(chǔ)知識,因此試題大約有70%是考察學(xué)生綜合思維能力和分析能力的,涉及知識范圍較廣,其目的是提高學(xué)生對所學(xué)課堂內(nèi)容進(jìn)行總結(jié)提煉及實際應(yīng)用,也設(shè)計有30%左右的基本知識題,如選擇和填圖題。從總成績來看,該卷的成績分布是呈正態(tài)分布,反映出絕大多數(shù)學(xué)生對考查綜合能力的試題還是比較適應(yīng)的,其分值大部分集中在60~80分,見圖1;從各大題成績來看,簡答和論述題成績基本呈正態(tài)分布,試卷能很好區(qū)分學(xué)生層次和體現(xiàn)他們各自的能力水平,能很好達(dá)到測驗?zāi)康?,但是單選、填圖題的成績分布呈偏正態(tài),雖然這兩大題屬于識記型,但是作為試卷設(shè)計,還是應(yīng)該從科學(xué)性測驗出發(fā),更好體現(xiàn)學(xué)生水平為原則,所以在以后的命題中,會更加注重這兩部分題目的科學(xué)性和實踐性。綜合以上分析表明,本次考試基本反映出學(xué)生對世界自然地理知識學(xué)習(xí)的實際水平,同時也說明命題者對試題難度等因素掌握得較好。

3. 試題的難度與區(qū)分度

難度和區(qū)分度都是判斷試題質(zhì)量的重要指標(biāo),用于衡量考生能力的程度。通過一次考試將不同程度和不同能力的學(xué)生區(qū)別開來。難度系數(shù)(p)是反映試題難易程度的重要參數(shù),難度系數(shù)越小,說明試題難度越大。一般認(rèn)為試題的難度系數(shù)應(yīng)控制在0.45~0.75之間比較合適。[10]本次試卷的平均難度系數(shù)為0.68,四個大題的難度分別為(單選題0.72,簡答題0.70,填圖題0.71,論述題0.62),不管是從整個試卷來看還是從各大題來看,本套考卷所有類型試題的難度系數(shù)在0.62~0.72之間,根據(jù)表1(試題難度的評價標(biāo)準(zhǔn))來看,試題難易程度適中,比較合理,能區(qū)分學(xué)生能力。

區(qū)分度(d)是衡量試題質(zhì)量的另一重要因素,是評價試題質(zhì)量、篩選試題的主要指標(biāo),d值越大,區(qū)分效果越好。一般認(rèn)為,d≥0.4,區(qū)分度極好;0.3≤d≤0.39,區(qū)分度良好;d≤0.19,區(qū)分度極差;所以試題區(qū)分度≥0.20即為可用試題,而區(qū)分度≤0.19的試題應(yīng)該被淘汰。世界自然地理是地理學(xué)的一門基礎(chǔ)主干課程,有其特殊性,概念多,需要記憶的知識多,尤其記憶各大洲的山脈、河流、湖泊容易記錯,各周的地理位置不易描述,而且該級的學(xué)生是理科生出生,地理基礎(chǔ)知識掌握有待提高,諸多因素使命題者難以把握試卷的難易程度及區(qū)分度。在本試卷中,整卷區(qū)分度為0.402,各大題中,除了單選題的區(qū)分度<0.30(為0.29)外,簡答題、填圖題和論述題的區(qū)分度均>0.40(分別為0.53、0.48和0.52),而且簡答題、論述題的區(qū)分度非常好(d>0.5)。通過試卷分析表明,本套試題的區(qū)分度、易難度良好,其分析結(jié)果為命題者今后的命題工作提供了參考依據(jù)。但今后對單選題和繪圖題的區(qū)分度還需要進(jìn)一步加以改進(jìn),判斷題應(yīng)淘汰或注意完善該題型的區(qū)分度。

4. 今后命題工作的導(dǎo)向

篇5

期中考試已經(jīng)過去了,我們班孩子的語文成績也已經(jīng)揭曉。最高分是:99、5,最低分是51?;诒景嗟恼Z文考試成績,我對這次的期中考試情況做了一下分析:

一、試卷分析

本次考查試卷以教材的內(nèi)容為基本素材,充分體現(xiàn)了《語文課程標(biāo)準(zhǔn)》的基本精神和要求,貼近教學(xué)實際和學(xué)生實際,重視對學(xué)生對基礎(chǔ)知識的運用和說話能力的考查,試題靈活,重視考查學(xué)生的基礎(chǔ)知識。從學(xué)生答題情況來看,大多部分學(xué)生對基礎(chǔ)知識掌握比較扎實,尤其是看拼音寫字、多音字注音、組詞和第六題的“減一減變新字,再組詞”第九、十二題等,這幾題得分率較高,大部分學(xué)生能正確答題。但也有個別學(xué)生對多音字注音掌握不夠扎實。

學(xué)生失分較高的內(nèi)容是第八題,我會填中的第三小題,有三四個孩子把問題的“題”和提問的“提”弄反了,第十一題:把下列詞語連成一句通順的話,并加上標(biāo)點。由于個別學(xué)生讀句子的語感訓(xùn)練還不到位,造成錯誤。第五題:寫出下面詞語的反義詞,個別孩子失分較多由于他們平時懶于背誦,對反義詞掌握的不夠好。十三題:讓寫一段話來夸夸我們的家鄉(xiāng),大部分孩子都寫得較好,只有許家輝小朋友一個字也沒寫,只考了66分。由于許方哲這個孩子一年級的基礎(chǔ)知識就比較差,好多生字都不會寫,但是近一年來,他學(xué)習(xí)很認(rèn)真,似乎還沒有掌握到學(xué)習(xí)的竅門。以前他都是三十多分的成績,這次他通過自己的努力竟然考到了51分,的確出乎了我的意料。

二、整改措施

針對這次學(xué)生答題所暴露出的部分學(xué)生基礎(chǔ)知識掌握不牢,個別學(xué)生的說話、寫話能力較差,和學(xué)生做題態(tài)度不端正等問題。在今后的教學(xué)活動中,我將采納以下措施:

1、語文教師對《語文課程標(biāo)準(zhǔn)》要加強學(xué)習(xí)和研究,吃透精神,準(zhǔn)確把握新的教學(xué)理念。

2、繼續(xù)培養(yǎng)學(xué)生良好的學(xué)習(xí)習(xí)慣,如:認(rèn)真寫字,多讀、多寫、多說、多練,抓好學(xué)生的語文基礎(chǔ)知識的訓(xùn)練,及時進(jìn)行階段檢測,以便了解學(xué)生的學(xué)習(xí)情況。

3、抓好課堂教學(xué),落到實處,課文中要求背誦的課文及片段,一定要嚴(yán)格把關(guān),力求每個學(xué)生都會背,都會寫。

篇6

我班共有46位學(xué)生參加考試,總分4277分,平均分93分,及格率100%,優(yōu)秀率76.1%。

二、試題分析:

一年級數(shù)學(xué)期中試題較好地體現(xiàn)了人教版《新課程標(biāo)準(zhǔn)》的新理念和目標(biāo)體系。具有如下特點:本卷注重考查了學(xué)生基礎(chǔ)知識的掌握、基本能力的培養(yǎng)情況,也適當(dāng)考查了學(xué)生學(xué)習(xí)過程。試題內(nèi)容全面,共計七個大題。試題整體較好地體現(xiàn)了層次性。本試卷題從學(xué)生熟悉的現(xiàn)實情況和知識經(jīng)驗出發(fā),選取源于孩子身邊的事和物,讓學(xué)生體會學(xué)習(xí)數(shù)學(xué)的價值。盡管平時教學(xué)中講、練比較全面,但通過這次檢測仍發(fā)現(xiàn)了一些問題:

1、不會讀題或讀不懂題意,理解題意能力方面差,這是普遍存在的一個問題,這也是失分原因最多的一項的,這些現(xiàn)象應(yīng)該提醒我們低年級的數(shù)學(xué)教師,在課堂教學(xué)中要注重課堂常規(guī)訓(xùn)練。例如課堂上多給學(xué)生們說的機會,充分考慮每一層次的學(xué)生需求和學(xué)習(xí)能力,滲透數(shù)學(xué)語言并加強學(xué)生說的訓(xùn)練,是我們今后的一個教學(xué)思想。

2、由于粗心造成的丟分。像加看成減,丟、漏題等。本來學(xué)生會做,但由于粗心而丟分,比如今后計算題我們可以這樣要求學(xué)生:第一,抄一個數(shù)、一個符號就要養(yǎng)成回頭看一眼的習(xí)慣,這樣為后面結(jié)果的正確提供了保障,第二,要求學(xué)生每計算一步要進(jìn)行簡單的驗算。第三,做完后要看一下最終的結(jié)果是否寫在了符號的后面。這樣的要求在習(xí)慣形成的開始比較費時間,但學(xué)生的習(xí)慣一旦養(yǎng)成學(xué)習(xí)效率就會事半功倍。

三、典型錯題分析:

1、第一題:看圖寫數(shù),無人丟分。

2、第二題:比一比。(1)比高矮,無人丟分。(2)比輕重。多部分學(xué)生失分,其原因主要是學(xué)生對間接地比較不理解或粗心造成錯誤。從卷面上看學(xué)生看圖的能力以及分析事物的能力較差。

3、第三題:填空題。共5小題。其中第(1)看圖比多少(2)填> < = 號(3)填寫序數(shù)(5)考核數(shù)的組成和分解。只有個別學(xué)生丟分。主要原因是由于平時練習(xí)時不夠靈活,學(xué)生沒有有效地學(xué)習(xí)方法,或因為粗心,導(dǎo)致個別學(xué)生丟分。第(4)小題,看圖填空,考核基數(shù)、序數(shù)和方位,此題丟分較多。有鳳英等5位學(xué)生掌握知識不好;學(xué)逸、陳蕾兩位學(xué)生不會讀題;紫儀等8位學(xué)生不注意辨別方位(前后、左右);兩位學(xué)生漏題不做;14位學(xué)生弄錯三只和第三只(這是我上課時調(diào)的學(xué)習(xí)重點和難點),但因考試前一天剛自行測試了同圖形的題,并進(jìn)行了講評,導(dǎo)致這十幾位學(xué)生因粗心而丟分。

4、第四題:統(tǒng)計圖形個數(shù)。考查學(xué)生對平面圖形和立體圖形的認(rèn)識,大部分同學(xué)掌握不錯,能夠準(zhǔn)確認(rèn)出圖形,填出數(shù)字,并進(jìn)行合計。但也有不少同學(xué)出現(xiàn)了錯誤,其原因是個別同學(xué)對圖形的認(rèn)識不清或是粗心丟漏,而數(shù)錯個數(shù)。

5、第五題:分類。丟分的學(xué)生不少。原因同第三大題的第(4)小題。但最主要的原因還是學(xué)生對這部分知識掌握不透或根本不理解。

6、第六題:計算。個別學(xué)生因粗心丟分(算錯或漏題)。

7、第七題:看圖列式計算。這道題考查出學(xué)生靈活運用課本基礎(chǔ)知識和分析、解決生活中的數(shù)學(xué)事物的能力。4位學(xué)生錯了一道題,出現(xiàn)錯誤原因:是學(xué)生不理解圖意,分析、推理能力比較差,學(xué)生對知識的掌握不牢固。從而導(dǎo)致錯誤。還有兩位學(xué)生計算的結(jié)果出錯。在課堂上,缺乏有意識地對學(xué)生進(jìn)行收集信息、處理信息、分析問題、解決問題的方法和策略指導(dǎo),今后要培養(yǎng)學(xué)生良好的學(xué)習(xí)方法和習(xí)慣。如:獨立思考的習(xí)慣,認(rèn)真讀題、仔細(xì)審題的習(xí)慣等等。

四、教學(xué)中存在的問題

1、對學(xué)生學(xué)習(xí)習(xí)慣和主動學(xué)習(xí)能力的培養(yǎng)不夠,過分關(guān)注對知識的掌握,對學(xué)生學(xué)習(xí)習(xí)慣的養(yǎng)成抓得還不夠。

2、課堂教學(xué)不夠扎實,個別學(xué)生對所學(xué)的知識掌握得不好,當(dāng)時應(yīng)對其加以輔導(dǎo)。

3、學(xué)生靈活運用知識和解決實際問題的能力及舉一反三的靈活性的思維有待于提高。

4、對學(xué)的知識缺乏廣度的關(guān)注,同時忽略質(zhì)量,導(dǎo)致有的同學(xué),學(xué)一道忘一道,沒有起到應(yīng)有的作用。

5、對個別學(xué)生關(guān)注不夠多。

五、自我反思與改進(jìn)措施:

1、依據(jù)《新課程標(biāo)準(zhǔn)》,對學(xué)生加強直觀教學(xué),培養(yǎng)學(xué)生學(xué)習(xí)數(shù)學(xué)的興趣。

2、提高課堂教學(xué)質(zhì)量。每堂課都在課前做好充分的準(zhǔn)備課前備好課,,每一課都要做到“有備而來”。聯(lián)系生活實際,創(chuàng)造性地使用教材,提高教學(xué)的有效性。根據(jù)一年級學(xué)生的年齡特點,思維水平設(shè)計生動有趣、直觀形象的數(shù)學(xué)活動,讓學(xué)生在具體的情境中理解和認(rèn)識數(shù)學(xué)知識。并制作各種利于吸引學(xué)生注意力的有趣教具。

3、注重雙基。加強基礎(chǔ)知識與基本技能的學(xué)習(xí),使學(xué)生學(xué)有所得,學(xué)的扎實。

4、注重學(xué)生良好學(xué)習(xí)習(xí)慣、學(xué)習(xí)態(tài)度和學(xué)習(xí)策略的培養(yǎng),如:聽課認(rèn)真、審題細(xì)心、答題仔細(xì)、書寫規(guī)范、勤于思考、樂學(xué)善問等等。

5、關(guān)注生活,培養(yǎng)實踐能力加強教學(xué)內(nèi)容和學(xué)生生活的聯(lián)系,讓學(xué)生適當(dāng)關(guān)注生活中的數(shù)學(xué)問題,接觸一些開放性問題,改變數(shù)學(xué)教學(xué)過于追求“精確”、“答案”和“化”的狀況,留給學(xué)生充分的思維空間和情感發(fā)展空間,鼓勵和培養(yǎng)學(xué)生的創(chuàng)新精神、創(chuàng)新意識。注重引導(dǎo)學(xué)生從不同角度去思考問題,充分發(fā)表自己的見解,從而有效地提高學(xué)生數(shù)學(xué)思考能力及培養(yǎng)學(xué)生解決問題的能力。

篇7

關(guān)鍵詞: 經(jīng)典測量理論 信度 難度 區(qū)分度

一、引言

教育測量與評價是教育研究領(lǐng)域中重要的組成部分,是學(xué)科教學(xué)活動中科學(xué)管理的有效手段?!秶抑虚L期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》明確把提高教育質(zhì)量作為教育改革發(fā)展的核心任務(wù),并多次強調(diào)與教育質(zhì)量的監(jiān)測和評價相關(guān)的內(nèi)容[1]。顯然,在當(dāng)前教育制度下,各種筆試仍是一種重要而有效的教育質(zhì)量定量評價方式。試卷質(zhì)量自然影響對教育質(zhì)量的正確評價,因此,針對筆試試卷的質(zhì)量分析顯得尤為重要。

試卷質(zhì)量的分析一般是利用經(jīng)典教育測量理論(CTT: Classical Test Theory)和項目反應(yīng)理論(IRT:Item Response Theory)進(jìn)行分析。

經(jīng)典測量理論又稱為真分?jǐn)?shù)理論,假定觀察分?jǐn)?shù)X與真分?jǐn)?shù)T線性相關(guān),即CTT的數(shù)學(xué)模型為X=T+E,其中,隨機誤差E服從均值為零的正態(tài)分布。該理論最重要的四個指標(biāo)正是反應(yīng)試卷是否真實可靠、準(zhǔn)確有效、難易適中、鑒別力強的信度、效度、難度和區(qū)分度等測驗質(zhì)量指標(biāo)[2]。當(dāng)然,由于其比較依賴樣本、信度估計精度不高、難度和被試水平?jīng)]有定義在同一參照系上,同時,無法回答總分相同的考生的真實能力有無差異等問題,該理論也存在一定的局限性[3]。

項目反應(yīng)理論是一種新興的心理與教育測量理論。該理論的前提假設(shè)非常嚴(yán)格,主要包括單維性假設(shè)和局部獨立性假設(shè)[4]。主要方法是在利用參數(shù)模型的基礎(chǔ)上,利用項目特征曲線、試題信息函數(shù)進(jìn)行探討,同時利用EM算法,用邊際極大似然估計方法尋找項目參數(shù)的一致估計[5]。

本文主要利用南寧市某中學(xué)2013年秋季學(xué)期數(shù)學(xué)期末考試成績,在經(jīng)典測量理論(CTT)范疇下探討該次期末考試數(shù)學(xué)試卷的信度、效度、難度、區(qū)分度和成績分布情況。通過試卷“四度一分布”了解試卷質(zhì)量,并反饋教學(xué)效果情況。

二、基于CTT的試卷質(zhì)量情況分析

1.成績分布情況

一般而言,一份好的試卷考試的成績都服從或近似服從正態(tài)分布,因此,考試成績的正態(tài)性是考察試卷質(zhì)量的一個首要指標(biāo)。檢驗正態(tài)性的方法很多,常見的是利用直方圖和卡方檢驗、K-S檢驗。從參加本次考試的872人中隨機抽取387人的成績進(jìn)行檢驗,結(jié)果如圖1所示:

圖1 學(xué)生成績的直方圖

正態(tài)分布的K-S統(tǒng)計量顯著性概率P值為0.095>0.05,因此,這次考試學(xué)生成績服從正態(tài)分布。

2.信度

中學(xué)試卷中,選擇題分?jǐn)?shù)可簡化為0,1得分情況來解釋,解答題和填空題可以看成非0,1記分的項目。因此,選擇題信度主要采用折半信度[斯皮爾曼-布朗(Spearman-Brown)公式、盧隆(Rulon)公式、弗拉納根(Flanagan)公式]和庫德-理查遜(Kuder-Richardson)信度(K-R20、K-R21公式)進(jìn)行分析[7]。填空題和解答題為非0、1記分的項目,采用克龍巴赫系數(shù)進(jìn)行統(tǒng)計,結(jié)果如表1所示。

表1 試卷信度分析結(jié)果

結(jié)果表明,每種方法計算的選擇題信度都接近0.7,信度系數(shù)處于尚可使用范圍之內(nèi)。研究表明,對于標(biāo)準(zhǔn)化的大型測試題目信度要求一般要在0.9以上,而學(xué)校期末考試的信度在0.6以上即可接受[1]。選擇題、解答題的克龍巴赫系數(shù)為0.905,可以認(rèn)為填空題和解答題的信度非常好,綜合考慮,試卷整體信度是可信的。

3.效度

效度(validity)是指測驗結(jié)果的有效性或準(zhǔn)確性,即通過測驗?zāi)軌蛘_測量出它所要測量的屬性的程度[5]。測量的效度的種類很多,其中基于專家和教師對試題與所涉及的范圍進(jìn)行符合性判斷的邏輯判斷法的內(nèi)容效度使用較多。內(nèi)容效度是指測驗內(nèi)容對所要測驗的全部內(nèi)容的代表性程度。但一次考試很難包含學(xué)生所學(xué)課程的所有內(nèi)容,因此只能選擇具有代表性的試題進(jìn)行考核,來了解學(xué)生的知識技能掌握情況[8]。

根據(jù)測量的目標(biāo)與內(nèi)容的雙向細(xì)分表,經(jīng)過該校7位一線數(shù)學(xué)教師(其中高級教師4位,中教一級2位,中教二級1位)不記名反饋信息來看,本次考試所設(shè)計的試題覆蓋了所要測內(nèi)容的主要方面,考查目標(biāo)清晰明確,題型和分?jǐn)?shù)結(jié)構(gòu)合理恰當(dāng),總體符合考試大綱和教學(xué)要求。

4.難度

試題難度是反映考題難易程度的指標(biāo),一般而言是按照答對人數(shù)的百分比確定的,是衡量試卷質(zhì)量的最主要的數(shù)量性指標(biāo),簡單來說可以利用測驗分?jǐn)?shù)的分布情況和特征進(jìn)行觀測,例如考察測驗分?jǐn)?shù)的全距、零分、滿分、眾數(shù)、平均分?jǐn)?shù)等相關(guān)指標(biāo)進(jìn)行定性的判斷,也可以根據(jù)不同的情況,利用有關(guān)公示進(jìn)行精確計算。

一般而言,難度的取值范圍在[0,1]之間,取值越大,難度越小。難度在0.7以上的為比較容易的題,在0.4-0.7為中等難度的題,在0.4以下的則為較難的題或是難題。在實際教學(xué)中試卷難度水平的選擇,應(yīng)取決于測驗的目的和試題的形式。如果測驗是用于區(qū)分學(xué)生水平,那么應(yīng)該將試題或試卷的難度系數(shù)控制在0.5左右,各試題難度值在0.2-0.8,同時各題平均難度值在0.5左右是比較適宜的[5]。

對于采用0,1記分的選擇題,用通過率P、平衡猜測的校正公式CP和極端分組法計算各個試題的難度。

表2 選擇題的難度

對于非0,1記分的填空題、解答題和總分,用難度系數(shù)和極端分組法計算各個項目的難度。

表3 填空題、解答題的難度

結(jié)果顯示,就選擇題而言,三種計算方法的計算的難度差異不大,整體趨勢較一致,從三種公式的難度均值看,第1、2、5、6、7、8、9屬于難度較小的題目,3、4、10、11、12屬于難度中等偏上的題目,其中第4題難度最大,10,11,12三題難度也較大,選擇題總體難度為0.767,屬于比較容易,從試題編排上看,除個別題目外,整體趨勢是容易的題型放在前面,中等難度試題放在題型中間,較難試題放在題型后面,較合理。

對填空題和解答題而言,題目難度顯然大于選擇題,填空題總體難度均值為0.499,難度中等,解答題總體難度均值為0,472,屬于中等偏難程度,8道解答題的難易程度也和題目順序基本一致,越難的題目越在后面,符合數(shù)學(xué)試卷的一般規(guī)律。

從考試成績來看,難度系數(shù)為0.548,綜合選擇題、填空題、解答題三種類型的難度均值,整張試卷難度均值為0.579,和總分難度系數(shù)接近,因此,可以判定該份試卷總體難度適中。

5.區(qū)分度

區(qū)分度是反映試題效用的一個主要參數(shù),同時也是試題對考生實際水平的鑒別能力,將不同層次的考生區(qū)分開來的統(tǒng)計量。若試題的測試結(jié)果是水平高的學(xué)生答對或者得高分,水平低的學(xué)生答錯或者得低分,則認(rèn)為試題的區(qū)分能力強。一般而言,區(qū)分度在0.4以上為最佳效果,在0.3~0.39為合格,修改會更好,在0.2~0.29為勉強,仍需耍修改,區(qū)分度在0.19以下為差,必須淘汰[6]。

對于0,1記分的選擇題,利用極端分組法、點二列相關(guān)計算各個試題的區(qū)分度。

表4 選擇題的區(qū)分度

對于連續(xù)記分的主觀性試題填空題、解答題和總分,用極端分組法和相關(guān)法計算各個項目的區(qū)分度。

表5 填空題、解答題以及試卷的區(qū)分度

注:試卷區(qū)分度是將各題區(qū)分度進(jìn)行加權(quán)平均計算的。

結(jié)果顯示,對于選擇題而言,總體看來,整個選擇題中大部分題目的區(qū)分度都在0.4以上。通過極端分組法和點二列相關(guān)系數(shù)計算的區(qū)分度在大部分題目中相差不大。極個別題目有明顯差異,主要在于兩種方法考慮的視角不一致,就第1題而言,極端分組法的區(qū)分度指標(biāo)0.093,是利用高分組和低分組之間差異進(jìn)行計算的,兩者差異很小,說明該題無論是高分組還是低分組都能完成,就區(qū)分能力而言屬于應(yīng)該淘汰的題目,但正是由于該題目在高低分組中完成率都較高,和總分的相關(guān)性自然就大,因此,點二列相關(guān)法計算出來該題的區(qū)分度較高。兩種方法計算的試卷區(qū)分度均在0.6以上,說明該試卷區(qū)分能力強,區(qū)分效果佳。

三、有關(guān)結(jié)論

事實上,該次試卷為全市統(tǒng)一考試題目,從一定程度上說屬于“較大的標(biāo)準(zhǔn)化”考試題目。從上述分析可知,本次考試成績的分布直方圖并未凸顯畸形特征,基本上呈正態(tài)分布,單峰,稍微右偏。就四度而言,填空題、解答題的信度很好,但選擇題的信度適中。常見的提高測驗信度主要有以下方式:一是適當(dāng)增加試題量;二是提高質(zhì)量,試題難度要適中,區(qū)分度大;三是調(diào)整試題編排順序,盡量做到先易后難。

測驗的效度采用學(xué)科專家通過邏輯分析法進(jìn)行分析的,根據(jù)測量的目標(biāo)與內(nèi)容的雙向細(xì)分表,了解到試題覆蓋了所要測內(nèi)容的主要方面,考目標(biāo)清晰明確,題型和分?jǐn)?shù)結(jié)構(gòu)合理恰當(dāng),總體符合考試大綱和教學(xué)要求。

試題的難度較合理,大部分選擇題難度偏低,其中第4、10兩題難度最大。而最后一道解答題的難度系數(shù)則過大。這和數(shù)學(xué)試卷利用最后一題作為壓軸題有密切關(guān)系。

試題的區(qū)分度方面反應(yīng)較好,但選擇題第1、2題和解答題最后一道題在兩種計算方法中差異很大??赡艿脑蛟谟诘?、2題屬于難度很低的送分題,因此區(qū)分度也不高,最后一道壓軸題屬于難度最大,很多學(xué)生放棄作答,因此存在這方面的問題。

四、結(jié)語

考試是衡量教學(xué)效果的必要手段。隨著統(tǒng)計學(xué)及經(jīng)濟計量學(xué)邊緣的不斷擴張,對于教學(xué)結(jié)果的評價越來越依賴于科學(xué)的理論和方法。教育評價技術(shù)方法中教育測量理論就是應(yīng)用教育統(tǒng)計學(xué)方法實現(xiàn)的,成為測評學(xué)生能力、考核教育效果的重要措施。利用SPSS測度考試的難易度、區(qū)分度、信度、效度等指標(biāo),不僅可以直觀、便捷分析考試結(jié)果,發(fā)現(xiàn)考試中的重要信息和規(guī)律,還可以為教學(xué)效果評估提供重要的考核指標(biāo)和模式。目前在教育教學(xué)及科研領(lǐng)域,人們采用科學(xué)的測評方法測度試卷科學(xué)性的嘗試并不多,尤其是一些規(guī)模較小的考試,這不利于教學(xué)質(zhì)量和教師素質(zhì)的提高,亦不利于考試學(xué)研究者開啟新的研究視域。應(yīng)該加強對試卷科學(xué)化測度的研究及實踐,使考試這一重要的教學(xué)環(huán)節(jié)日益走上科學(xué)化和規(guī)范化的軌道。

通過試卷質(zhì)量分析,不僅可以了解試卷情況,更可以利用試卷科學(xué)性測評的方式了解教師的教學(xué)效果,同時也可以通過建立試題庫、制定命題雙向細(xì)目表等方式,提高試卷質(zhì)量。

參考文獻(xiàn):

[1]《國家中長期教育改革和發(fā)展規(guī)劃綱要》關(guān)注教育質(zhì)量監(jiān)測[N].基礎(chǔ)教育質(zhì)量監(jiān)測信息簡報,教育部基礎(chǔ)教育質(zhì)量監(jiān)測中心,2010,1.

[2]郭熙漢,何穗,趙東方.教學(xué)評價與測量[M].武漢:武漢大學(xué)出版社,2008.

[3]杜洪飛.經(jīng)典測量理論與項目反應(yīng)理論的比較研究[J].社會心理科學(xué),2006(6):15-17.

[4]Christine DeMars.Item Response Theory[M].London:Oxford University Press,2010.

[5]何穗,吳慧萍.基于教育測量理論的中學(xué)數(shù)學(xué)試卷質(zhì)量評價研究[J].考試與招生,2012(08):49-53.

[6]Robert L.Ebel.Measuring Educational Achievement [M].Englewood Cliffs,N.J., Prentice-Hall,1965.

篇8

【關(guān)鍵詞】中學(xué)化學(xué)試卷;質(zhì)量分析;難度;區(qū)分度;信度;效度

中學(xué)化學(xué)試卷的質(zhì)量分析是中學(xué)化學(xué)教學(xué)評價的重要內(nèi)容,高質(zhì)量的中學(xué)化學(xué)試卷分析對提高中學(xué)化學(xué)教學(xué)質(zhì)量和提高化學(xué)試題的命題質(zhì)量具有特別重要的意義。同時,也是教育主管部門、教育研究部門獲取教育教學(xué)質(zhì)量信息、提出改進(jìn)教學(xué)建議的重要途徑。

一、中學(xué)化學(xué)試卷的質(zhì)量分析存在誤區(qū)

據(jù)筆者調(diào)查了解,目前教師、學(xué)校,甚至市、縣教育研究部門的學(xué)科測驗質(zhì)量分析,僅僅是對學(xué)生考試成績的情況分析,也就是考試結(jié)果分析。這對于了解學(xué)生學(xué)習(xí)情況,鑒別學(xué)生學(xué)業(yè)成績、為改進(jìn)教學(xué)、提高教學(xué)質(zhì)量提供反饋信息是非常重要的。但這種分析是建立在學(xué)科測驗(試卷)本身是沒有任何質(zhì)量問題的測量工具基礎(chǔ)之上的,嚴(yán)格講這只能稱為被試的質(zhì)量分析,而不能稱為試卷的質(zhì)量分析。特別是使用沒有經(jīng)過標(biāo)準(zhǔn)化的教師自編學(xué)科測驗時,在沒有對試卷這一測量工具的質(zhì)量進(jìn)行有效的分析評價之前,對測試結(jié)果的分析是沒有意義的。

學(xué)科測驗質(zhì)量分析的方法包括定性分析和定量分析。從認(rèn)識論角度講,人們對事物、現(xiàn)象的認(rèn)識首先獲得一定的質(zhì)的認(rèn)識,然后在此基礎(chǔ)上進(jìn)一步去考察量,以求對事物的質(zhì)有更清晰、更準(zhǔn)確的把握,這就是認(rèn)識的深化與精細(xì)化。也就是說,定量分析的目的是為了精確地、深入地對事物、現(xiàn)象的質(zhì)的認(rèn)識,這就要求必須正確理解、評價、解釋、運用在定量分析中所使用的各種統(tǒng)計指標(biāo)。但據(jù)筆者調(diào)查了解,在目前的對非標(biāo)準(zhǔn)化學(xué)科測驗的質(zhì)量分析中,定性分析較多,定量分析較少。定性分析往往缺乏足夠的依據(jù),而在一些簡單的定量分析之后,相關(guān)指標(biāo)的評價標(biāo)準(zhǔn)界定不明確,相關(guān)指標(biāo)的解釋、理解不全面,指標(biāo)的運用不充分。

二、對試卷的基本情況的分析

這項工作主要是分析試題范圍及知識點,試題性質(zhì)、題型及數(shù)量以及有關(guān)命題依據(jù)等方面的內(nèi)容。

1試題范圍及知識點

是否是在化學(xué)教材及課程標(biāo)準(zhǔn)要求的范圍內(nèi),覆蓋面如何。試題內(nèi)容是否源于課本,并根據(jù)學(xué)生生活背景知識適當(dāng)拓寬加深,有無難題、偏題、怪題及超過課標(biāo)要求的拔高。試題跨度是否注意到適當(dāng)增加學(xué)科內(nèi)或者學(xué)科間知識的交叉滲透,體現(xiàn)綜合性特征。試題是否科學(xué)合理、比例是否恰當(dāng)。文字、圖像、圖表、數(shù)據(jù)等信息資源是否準(zhǔn)確。試題陳述是否科學(xué)準(zhǔn)確、表達(dá)是否清晰,備選答案是否明確。試題之間是否具備獨立性,即相互間有無提示現(xiàn)象。試題是否注意到與社會實際和學(xué)生生活實際的聯(lián)系,注重對學(xué)生能力的考查。

2試題性質(zhì)、題型及數(shù)量

試題按性質(zhì)分為客觀性試題和主觀性試題。那么試卷中客觀性試題和主觀性試題各為多少道,分別為多少分。在目前,試題按題型(除高三模擬題外)一般分為選擇題(單選或多選)、填空題、簡答題、實驗探究與設(shè)計題、計算題等種類。試題數(shù)量指選擇題的備選答案數(shù)、填空題空格數(shù)、實驗探究與設(shè)計和計算題得分點數(shù)、回答要點數(shù),以及教材、課程標(biāo)準(zhǔn)和考試要點要求的知識涉及程度、知識點覆蓋面(%)。

3命題依據(jù)

是否依據(jù)教材及課程標(biāo)準(zhǔn);是否對基礎(chǔ)知識、主干知識和基本能力的測試;是否關(guān)注探究過程和方法、聯(lián)系實際選取素材,這對“教”和“學(xué)”具有導(dǎo)向作用。

三、試卷的統(tǒng)計數(shù)據(jù)

中學(xué)化學(xué)試卷的統(tǒng)計數(shù)據(jù),可以按題型與按每道小題,進(jìn)行全樣本分析或抽樣分析(隨機抽樣分析,樣本容量適中)除了要統(tǒng)計最高分、最低分、平均分、優(yōu)良率、及格率、錯誤率、得分率外,更主要的是要做好學(xué)生典型錯誤或創(chuàng)新解答統(tǒng)計及原因分析。在此只談一下選擇題的試題作答率的統(tǒng)計分析。

試題作答率是以全體受試學(xué)生中,每一個選項的作答人數(shù)占總?cè)藬?shù)的百分比值。每一選項的作答率,可以作為篩選或進(jìn)一步修改不恰當(dāng)?shù)脑囶}、以及分析學(xué)生作答情形之用,藉以了解學(xué)生是否有一些錯誤或迷失概念。

選擇題的結(jié)構(gòu)是由兩部分組成:包括題干與選項,題干就是問題本身;選項包括一個正確選項(最佳答案)和三個誘答選項。正確選項必須要能吸引較多具備該評量能力的受試者去選擇;而誘答選項則應(yīng)具似真實性或合理性,會吸引較多不具備該評量能力者或是概念不正確者去選擇。選項的設(shè)計與選擇題題目的難易程度有密切關(guān)系。如某一試題有4個選項,正確選項A作答率為0.89,選項B作答率為0.11,顯示該選項具有誘答力,有約11%的學(xué)生有此錯誤概念;選項C及選項D作答率為0,顯示該選項不具有誘答力,或受試者沒有此錯誤概念,可考慮修改此選項。

四、測試題目的質(zhì)量分析

任何測驗都是由若干測驗題目構(gòu)成的。非標(biāo)準(zhǔn)化測驗的質(zhì)量分析,首先應(yīng)該是對組成測驗的各個測驗題目進(jìn)行質(zhì)量分析,只有保證了構(gòu)成測驗的所有試題的質(zhì)量達(dá)到規(guī)定的標(biāo)準(zhǔn),才能保證一個測驗的整體質(zhì)量。測驗題目質(zhì)量分析的目的,首先是為了鑒定測驗題目,并為進(jìn)一步修改測驗試題提供有效的依據(jù),前述的選擇題作答率統(tǒng)計就屬于此;其次,有助于提高老師編制測驗的技能和技巧,有助于建立測驗題庫;當(dāng)然,最為重要的還是為了保證一個測驗的信度和效度。測驗題目的質(zhì)量分析主要包括題目的難度分析和區(qū)分度分析。

(一)、難度分析

難度又稱難易度、難度系數(shù)(P)是試題對學(xué)生知識和能力水平的適合程度的指標(biāo),是一個相對概念,難度的高低與被試者的水平直接相關(guān)。難度的取值范圍為0≤P≤1,P值愈大,表示該試題愈容易,愈多數(shù)學(xué)生答對該試題;P值愈小,表示該試題愈困難,愈少數(shù)學(xué)生答對該試題。

1難度的計算

對于二分法記分的客觀試題,通常以答對或通過該題目人數(shù)的百分比來表示難度:P=R/N(P:題目難度;N:全體被試人數(shù);R:答對或通過該題目的人數(shù))。

當(dāng)被試人數(shù)較多時,可采用極端分組法,即先將被試按測驗總分從高到低排列,取總分最高的27%被試為高分組,總分最低的27%被試為低分組,分別計算高分組和低分組的通過率,然后再求題目的難度:P=(PH+PL)/N(PH、PL分別表示高分組和低分組的通過率)。

主觀題的難度一般用參加測試考生在該題的平均得分與該題分值之比,即P=X/K(X表示所有考生在該題的平均得分,K表示該得分值)。

試卷的平均難度:P=∑Pi/N(Pi代表每道題的難度值,N代表試卷的題目總數(shù))。也可用P=∑PiWi/W表示(Pi代表每道題目的難度值,Wi代表每道題目的分值,W代表試卷的總分值)。還可以用P=X/W表示(X為總平均分,W代表試卷的總分值,P代表試卷的平均難度)。

當(dāng)被試人數(shù)較多時,也可采用極端分組法計算難度:P=(XH+XL-2NL)/2N(H-L)(XH、XL分別為高分組、低分組的總分;H、L分別為最高分、最低分;N為總?cè)藬?shù)的25%)。

2難度分析

難度分析的主要目的是為了鑒定、篩選和修改題目。題目的難度水平通常取決于測驗的目的、題目的形式以及測驗的性質(zhì)。一般情況下,測驗的平均難度要適中,應(yīng)在0.50左右;如果測驗是為了了解被試在某方面知識、技能的掌握情況,可以不必過多地考慮試題的難度。

難度對于測驗的影響,首先表現(xiàn)在測驗分?jǐn)?shù)的分布形態(tài)上。若測驗題目的難度普遍較大,則分?jǐn)?shù)呈正偏態(tài)分布;若測驗題目難度普遍較小,則分?jǐn)?shù)呈負(fù)偏態(tài)分布;只有當(dāng)測驗題目的難度適中時,分?jǐn)?shù)分布才呈近似正態(tài)分布。其次表現(xiàn)在測驗分?jǐn)?shù)的離散程度上。太難或太易的測驗題目,都會導(dǎo)致測驗分?jǐn)?shù)相對地集中在低分端或高分端,離散程度較??;當(dāng)難度適中時,分?jǐn)?shù)分布范圍大,離散程度較大。這是用標(biāo)準(zhǔn)差σ來表示的,因篇幅關(guān)系,在此不加贅述。

只有當(dāng)分?jǐn)?shù)的分布范圍較大時,測驗的信度才可能較高,反之信度較低??梢?,測驗題目的難度以集中在0.50左右為最佳,以集中在兩極端為最差。在非標(biāo)準(zhǔn)化學(xué)科測驗中,組成測驗的各試題的難度系數(shù)應(yīng)當(dāng)以0.50為均值(各個試題難度均勻分布在0.2~0.8之間為好),這樣有利于最大程度區(qū)分不同程度學(xué)生,使試題產(chǎn)生區(qū)分學(xué)生的最大效果,分?jǐn)?shù)將呈正態(tài)分布,但允許有少量的高難度和低難度的測驗題目。

(二)、區(qū)分度分析

試題區(qū)分度又稱區(qū)分度指數(shù)(D),是衡量試題對不同知識和能力水平考生的鑒別程度的指標(biāo)。具有良好區(qū)分度的測驗,實際水平高的該得高分,實際水平低的該得低分,它是評價試題質(zhì)量、篩選試題的主要指標(biāo)和依據(jù)。

1區(qū)分度計算

鑒別指數(shù)法。對于二分法記分的客觀性試題,從總分分布的兩端各選擇27%的被試組成高分組和低分組,分別計算高分組和低分組的通過率,二者之差就是鑒別指數(shù):D=PH-PL。

主觀題的區(qū)分度,一般從總分分布的兩端各選擇27%的被試組成高分組和低分組,分別計算各組總分和測驗最高分、最低分。再按下面公式計算:D=(XH-XL)/N(H-L)(公式中各符號含義與難度計算時相同)。

其它復(fù)雜的計算,在此從略。

2區(qū)分度分析

如果一個題目的測試結(jié)果使水平高的考生答對(得高分),而水平低的考生答錯(得低分),它的區(qū)分就很強。鑒別指數(shù)是鑒別題目測量有效性的指標(biāo),鑒別指數(shù)越高,題目越有效。一般認(rèn)為,鑒別指數(shù)在0.40以上的為很好;鑒別指數(shù)在0.30~0.39的為良好,修改會更好;鑒別指數(shù)在0.20~0.29的為尚可,仍需修改;鑒別指數(shù)在0.19以下的為差,必須淘汰。

任何一種測驗,其所有的測驗題目,都應(yīng)該具有良好以上的區(qū)分度。否則,將無法保證測驗的有效性。

五、測驗的質(zhì)量分析

當(dāng)由若干質(zhì)量達(dá)到要求的測試題目構(gòu)成一個測驗時,還必須對整個測驗的可靠性和有效性進(jìn)行技術(shù)鑒定,這就是通常所說的試卷分析。試卷分析最根本的含義是指對試卷的質(zhì)量進(jìn)行系統(tǒng)的分析,目的是評價作為鑒別學(xué)業(yè)成績的測量工具的質(zhì)量。對于標(biāo)準(zhǔn)化測驗來說,有一整套完整而成熟的質(zhì)量技術(shù)分析指標(biāo)。非標(biāo)準(zhǔn)化測驗在測驗結(jié)束后,也可以通過抽樣的方法,借助這些指標(biāo)來進(jìn)行試卷的質(zhì)量分析,也就是要明確一個測驗的信度和效度。

(一)信度分析

信度是指測驗結(jié)果的穩(wěn)定性、一致性和可靠性的指標(biāo)。信度是測量過程中隨機誤差大小的反映,如果信度低,則隨機誤差大,測驗的結(jié)果就會與真分?jǐn)?shù)發(fā)生較大的偏差。一個成功的測驗必須具有較高的信度,也就是說,只要遵守操作規(guī)則,測驗的結(jié)果就不應(yīng)該隨工具的使用者或使用時間、地點等因素的變化而發(fā)生較大變化。

測驗信度的種類較多。如反映測驗穩(wěn)定性的重測信度、檢驗等值性的復(fù)本信度以及描述內(nèi)部一致性的分半信度、同質(zhì)性信度等。在非標(biāo)準(zhǔn)化學(xué)科測驗的信度分析中,最適合使用的應(yīng)該是分半信度。

分半信度是將一個測驗分成對等的兩半,然后分析同一組被試在兩個半份的一致性程度。計算分半信度的關(guān)鍵在于如何將一個測驗分成兩半,常用的分半方法有完全隨機分半、奇偶題目序號分半等。計算分半信度的方法,就是求被試在兩個半份測驗上得分的相關(guān)系數(shù),當(dāng)然,由于只是半個測驗的信度,所以必須進(jìn)行校正。校正公式為r=2r0/(1+r0)(r為信度,r0為兩個半卷上分?jǐn)?shù)的相關(guān)系數(shù))。

測驗信度通常用來解釋個人測驗分?jǐn)?shù)的意義,也可用來進(jìn)行兩種測驗分?jǐn)?shù)的比較分析。測驗信度高,說明測驗結(jié)果比較一致,測量工具具有穩(wěn)定性、一致性和等值性,被試的能力水平受被試狀態(tài)和施測環(huán)境變化的影響較??;若信度低,則說明測驗的隨機誤差較大,測驗結(jié)果不可靠。鑒別信度系數(shù)的高低,需要對計算的各種相關(guān)系數(shù)進(jìn)行顯著性檢驗。

要提高測驗的信度,可適當(dāng)增加測驗的長度,并使測驗中所有試題的難度系數(shù)接近正態(tài)分布,并控制在中等水平;必須保證測驗題目具有較高的區(qū)分度,并盡量使用同質(zhì)的測驗內(nèi)容題目;另外,還必須強調(diào)測驗評分的客觀性,并提高測驗程序的統(tǒng)一性。

(二)效度分析

效度指一個測驗實際測量的結(jié)果與所要測量的能力水平之間的吻合程度,是測驗的有效性或正確性的指標(biāo)。效度是隨機誤差和系統(tǒng)誤差的綜合反映,效度的估計就是多方尋找證據(jù)來證明一個測驗有效性程度的過程。由于效度是就測量結(jié)果達(dá)到測量目的的程度而言的,所以測驗的效度估計在很大程度是取決于人們對測量目的的解釋。常見的解釋有三種:一是用測量的內(nèi)容來說明目的;二是用心理學(xué)上某種理論結(jié)構(gòu)來說明目的;三是用實際實效來說明目的。于是,就有內(nèi)容效度、結(jié)構(gòu)效度和實證效度之分。

在非標(biāo)準(zhǔn)化學(xué)科測驗的效度分析中,最適合使用的是內(nèi)容效度。

內(nèi)容效度指一個測驗實際測到的內(nèi)容與所要測的內(nèi)容之間的吻合程度,也即試卷內(nèi)容對于所要考查的課程內(nèi)容的代表性如何。估計內(nèi)容效度的核心問題,一是要測的內(nèi)容范圍是否明確,二是在明確的內(nèi)容范圍內(nèi)題目的取樣是否具有代表性。

確定內(nèi)容效度的方法主要是邏輯分析法。其工作思路是請有關(guān)專家對測試題目與原定內(nèi)容范圍的吻合程度作出判斷分析,所以又稱專家判斷法。這需要依據(jù)在編制測驗時制作的“化學(xué)學(xué)科雙向細(xì)目表”。

要提高測驗的效度,首先,要精心編制測驗試題,避免出現(xiàn)系統(tǒng)誤差;其次,要妥善組織測驗,控制好隨機誤差;第三,要合理處理好信度與效度的關(guān)系,信度不高的測驗不可能具有很高的測驗效度。

另外,還要做好被試團(tuán)體的質(zhì)量分析和被試個體的質(zhì)量分析,因篇幅關(guān)系,在此從略。

推薦期刊