Öğretimde Ölçme ve Değerlendirme [geliştirilmiş 10. baskı. ed.]
 9758792253

Table of contents :
Screenshot_1
Screenshot_2
Screenshot_3
Screenshot_4
Screenshot_5
Screenshot_6
Screenshot_7
Screenshot_8
Screenshot_9
Screenshot_10
Screenshot_11
Screenshot_12
Screenshot_13
Screenshot_14
Screenshot_15
Screenshot_16
Screenshot_17
Screenshot_18
Screenshot_19
Screenshot_20
Screenshot_21
Screenshot_22
Screenshot_23
Screenshot_24
Screenshot_25
Screenshot_26
Screenshot_27
Screenshot_28
Screenshot_29
Screenshot_30
Screenshot_31
Screenshot_32
Screenshot_33
Screenshot_34
Screenshot_35
Screenshot_36
Screenshot_37
Screenshot_38
Screenshot_39
Screenshot_40
Screenshot_41
Screenshot_42
Screenshot_43
Screenshot_44
Screenshot_45
Screenshot_46
Screenshot_47
Screenshot_48
Screenshot_49
Screenshot_50
Screenshot_51
Screenshot_52
Screenshot_53
Screenshot_54
Screenshot_55
Screenshot_56
Screenshot_57
Screenshot_58
Screenshot_59
Screenshot_60
Screenshot_61
Screenshot_62
Screenshot_63
Screenshot_64
Screenshot_65
Screenshot_66
Screenshot_67
Screenshot_68
Screenshot_69
Screenshot_70
Screenshot_71
Screenshot_72
Screenshot_73
Screenshot_74
Screenshot_75
Screenshot_76
Screenshot_77
Screenshot_78
Screenshot_79
Screenshot_80
Screenshot_81
Screenshot_82
Screenshot_83
Screenshot_84
Screenshot_85
Screenshot_86
Screenshot_87
Screenshot_88
Screenshot_89
Screenshot_90
Screenshot_91
Screenshot_92
Screenshot_93
Screenshot_94
Screenshot_95
Screenshot_96
Screenshot_97
Screenshot_98
Screenshot_99
Screenshot_100
Screenshot_101
Screenshot_102
Screenshot_103
Screenshot_104
Screenshot_105
Screenshot_106
Screenshot_107
Screenshot_108
Screenshot_109
Screenshot_110
Screenshot_111
Screenshot_112
Screenshot_113
Screenshot_114
Screenshot_115
Screenshot_116
Screenshot_117
Screenshot_118
Screenshot_119
Screenshot_120
Screenshot_121
Screenshot_122
Screenshot_123
Screenshot_124
Screenshot_125
Screenshot_126
Screenshot_127
Screenshot_128
Screenshot_129
Screenshot_130
Screenshot_131
Screenshot_132
Screenshot_133
Screenshot_134
Screenshot_135
Screenshot_136
Screenshot_137
Screenshot_138
Screenshot_139
Screenshot_140
Screenshot_141
Screenshot_142
Screenshot_143
Screenshot_144
Screenshot_145
Screenshot_146
Screenshot_147
Screenshot_148
Screenshot_149
Screenshot_150
Screenshot_151
Screenshot_152
Screenshot_153
Screenshot_154
Screenshot_155
Screenshot_156
Screenshot_157
Screenshot_158
Screenshot_159
Screenshot_160
Screenshot_161
Screenshot_162
Screenshot_163
Screenshot_164
Screenshot_165
Screenshot_166
Screenshot_167
Screenshot_168
Screenshot_169
Screenshot_170
Screenshot_171
Screenshot_172
Screenshot_173
Screenshot_174
Screenshot_175
Screenshot_176
Screenshot_177
Screenshot_178
Screenshot_179
Screenshot_180
Screenshot_181
Screenshot_182
Screenshot_183
Screenshot_184
Screenshot_185
Screenshot_186
Screenshot_187
Screenshot_188

Citation preview

Öğretimde Ölçme ve Değerlendirme Şeref TAN

6'ıl iştirilmiş

16. Baskı r.ı\11 PEGEl\ı1 rD AKADEMI

R m

Prof. Dr. Şeref TAN

PEGEIV!

AXADEMI

Şeref TAN

l967 ytlındn Riıe~e doğmuş, ilk ve orHopafArt,.,in'de tama ınlam ıştır. 1988 yı ­ l ında Haceuepe Ünivcr'Sittsi Eğitim Fakültesi, Eğitiın Bilimleri, Eğitimde Ölçme ve Değer-1endirınc Anabiliın Dalında Lisans, 1990 yıl ında Hac;ettcpc Üniversitesi, Sosyal Bilimler Enstitüs,i'nden Ölçme ve Değerlendir­ me progl'3.m.ıod.l bilim uıın,,11hğı derecesini .llın ışıu·.

Prol. 0,-, ş.,.nAN

taöğreniınini

ÖĞRETİMDE ÖLÇME VE OE~ERLENOİRME

ISBN 976-605-0022-24-7 l(iQp içeriğinin ti.im ıorumluluğu ~rın~ ~ittir,

C 2023, PEGEM AKADEM İ

1993 yılıı,da AHD'de doktora öğrenimi görmek için YÖK bursu kaznnnuştır. Doktora öğrenimi boyun• ca; ..Ölçme ve Ocğcrlendi rınc~ "Çok Değişkenli istatistiksel YQntcmlcr" ve "Bilimsel Araştırma Yöntemleri" akınlnnnda öğren im görmüştür. 1997 yılında Chic.ıgo loyol.l Oniversitesi'nden Araştırma. YöıHemleri (Research Methdology) bölü• münde, Ölçme ve Testler (Measurements and ·ıe.sts) programında doktora dert• cesini alm ıştı r.

Bu ~bın hMım, yar-,, ve un; hakbl'ı Pe,em Ak.ademi Yay. Ejt. DM. Hiım. rıc. AŞ.ye aittir. Arıdan lu.nutuıun izni a.lırım;ad~ kjc)bın tilm(i yı dı böl(lm&trl. bpak c:wnm.: mc:kari&. eltkuonik. fotokopi. manyecik luıyıt ya& ~ a yöntemlerle.,;~. basıbmaz, dıtıcıl;:ıı-ıı.u.. &ı kitıp T.C. Kültür ve Tu.-i:urı Balunlıjı tundrolu ile. s~ılnukt;ıdır. Okuyucobnnıııın ~olU ol~n kitlpbr hıık.1und.ı ~ywıMl"lixe bifıi 'Yer'MeSiıi ve bandl"Obüt yaywılan ıatın almaınal!nı dill)-orut. Pe,ıetn ~ M i Yaywıcıbk. 1998 yılı!MWI bıJtijne vt~ı dOUyde ··-

o.

Ön SIJZ

V

Kitabın

ilcriki baskılarının daha kaliteli olabilmesi, bugüne kadar ol duğu gibi ve öğrenciJer inıi1,i n önerileriyle sağl anabileceğinden bu komı daki önerileriniz beni mutJu edecektir. Kitabın tfön öğretmen ve öğret• men adaylarımızın kendilerini geliştirmelerine katkıda bulunması dileğiyle...

ÖN SÖZ

değerli meslektaşl arımızın

Hu kiıabm lcmcl amac ı ; öğrtlmen adaylarımızın ve öğretmenlerimizi n, öğrc• timde ölçme ve değerlendirmeyle ilgili olarak öğretmenlik mesleğinin gereği bir· takıın temel bilgi ve becerilerini daha üst düzeylere çıka,rmakıır. Kit;;ıbın 16. bas· kısı ülkemizde YÖK tarafında11 2018-2019 öğret im yılınd,,n itibaren uygulam;}.y.t konulan yeni ders program ı içeriğine uygun olar.ık dü;,.enlenıniştir. Hu kapsamda, ilk 8 ünitede aşağıdaki konular yer almaktadır: ✓

Eğitimde ölçme ,,e değerlendi rmenin



Ölçme ve değerlendirmeyle ilgili temel kavramfar,



Test sonuçl:ınnın yorumlanın:ısı ve geri bildirim,



ÔlçüınleriJ1 güvenirliği ve standart hatası,



Ölçüınleriıt geçerliği ve kullan~lığı,



Haşan



Test ve ınndde puanlarının analizi ve



Öğrenci baş.-ı.rısının değerl endirilmesi.

[email protected]

Temmuz. 2023

yeri ve önemi,

Prof. Dr. Şeref TAN

testi geliştirme ve uygulama,

Kitaptaki 9.· 13. ünitelerde, YOK içeriğine ek olarak, sınıf•içi ölçme ve değer• lendirme etkinliklerini içeren a.ş.-ığıd;;ıki konular )'er ;;ılmakt.l.dır : ✓

S111,w tiirleri ve soru y.ızunı,



Yazılı



Kısa cevaplı



Çoktan seçmeli ve c.-..şlcştirmtli testler ve



Alternatif değcrlendirınc.

ve sözlü yoklamalar, ve doğru-yanlış testleri,

Kitapta, örnek sın ı f•içi uygulama eıkinlikl cri ne olabildiği kadar yer veril• Böylece okuyac.l.ğınız eser daha etkili bit ders kayMğı haline gtt i rihn~ıit. Kitap öğreıimde ölçıne ve değerl endirme ile ilgili koı1ular için bir Kl>sS ti kitabı miştiı'.

niteliğindedir. Kitabın iyi l eştirilmesine )'Önclik önerilerde bulunan Dr. Aynur Pala) Dr. Hale Yetim, Or. Gülşen Altıntaş, o~:.nur Baykan, Ahan Çakmak, Selin Ayhan ve Nuray Tan'a çok teşekkiir ederim. KH.-ıbın geliştirilmesinde, gerek benimle yüz yüze gö~ rii-şerek gerekse e •ınail yoluyla çok büyük katkıla.tı olan değerli öğretim eJel'nanl:ırı ve öğrencilcrimi:-.e ve kitabın basımında katkılan olan tüm Pegeın Akademi çalı• şan1arına çok teşekkür ederim.

4

5

> ··-

o.

İÇİNDEKİLER

Ölçme Örnckf.eınin dcn Kaynakla nan Güçlükler _ _ _ _ _ _ _ _ _ _ _ _ _ _.,7 Ölçme TUrler· 40 Temel (Dolaysız) Ölçm 40 Dolaylı Ölçm 40 Ölçme So n uçlıırının lfode Edilmesi 41 Ölçn, cdc Oirirn ......- ......._..- ..- ......._.._.... ............ .. ..- ........ ......._.._ .._......._.......- .41 Ölçmede Sıfır Noktası 44 Ölçmede Ölçekler 45

Ön Söz _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ iv İçindekiler

vi

EÖITIMDE ÖLÇME VE DEÖERLENDIRMENIN YERi VE ÖNEMi Onite 1{ss.1•25) Öğretimin

Özet

ı

OnlteSorufan Sı nıflçi Uygulama

2 2

Ölçme ve Oeterlendirmenin Yeri ve Önemi ____________ z

Öğretimin Pl.l nlanınası Gerekli l iği __________________

5

TEST SONUÇLARININ YORUMLANMASI VE GERi BiLDiRiM Onite 3 (ss. 53-89)

Eğitimde Sistem Yakl aşımı - - - - - - - - - - - - - - - - - - - - 6 €ğit i nıde Sistem Yakl aşımına Göre Verimliliği lhkHcyen Faktörfcr·-------8 Eğitim Sisteminin Girdi Öğes· 8 Eğ'itim Eğiti m

Sisteminin SüreçÖğesi _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ ıı

Eğitim

Sisteminde Ölçme ve Ocğcrlendfrme nin İ şlevleri _ _ _ _ _ _ _ _ _ 14

Test Sonuçları için Temel l statJsıiklcr. Yorumlaına \'O Geri 6Hdiıinı .. ...•_ _ _ _ __,4

Sisteminin Çıktı Öjesı _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 13 Eğilin1 Sistem.inin Ocğerlendirn,c Öğesi.,_,.,__,_,,,_,,..,.,_.,_,,,..,,_,................ ..,_.,•.,,...._,.,..... 13

Merke-1.i Yığılma Ölçüle ri Deği şkenlik Ölçü.s ü Olarak Standart Sapına Nomıal O;;ığılım Eğrisi

Eğitimde Program Geliştirme Sürecinde ÖJçme ve Değerle ndirmenin Yeri ve Önemi....... 16 Öğretim Program ının Öğe lerı _

_ __ _ __ _ __ _ _ _ __ _ __ _

- - - -- - - - - - - -- -------.6'1

Birim Nomıa ı Dağılı m-------------........65 Ham Puanlann Z ve i Standa ı1 Pua nları na Döııfrştüri.ilmcsi - - - - - - - - - 6 6 Öğrenci Başarısını Yonnnlarnada Kullanılan Diğer Dağılımlar 70 Korel.ışyo 71 Pearson Momentler Çarpımı Korelasyon Kaıs;;ıyı sı 73 Oi~ysel Olarak Madde Ccvapla ıına Yönelik Geri Bildirim Sağlam a 76 Yüzdelik S ı rada n Faydalanara k Öğren ci Başa rı sının Yoru mlanması 77

ı6

1) Hede fl e,· ve Oavr.ı ıuşlar 17 2) içeriğin Oüzcnlcıımesii-------------------17 3) Öğ.renıne-Öğretm e Aktiviteler· 18 4) Ölçme Ye Değerlen dirme _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 19 Pı·ogram Gellştinne SU recinde SOrekllllk ilkesi Açısındrın Ölçme ve Değerle ndlnnenl n Ytri ve Öncnıi ......._.......-......._......._......._......._......._.._..._......._.,_.,._........ ..-..._.._......._......._........ 19 ö ı ,,n eTeori si ni 8:ilmeninÖnem· . 1 Öğretmenlerin Ölçme ve Değerlendirmeyle lıgili Temel Becerile ri Kazanmasının Önemi

- -_-_-_ -_ -_ -_ -_ --_ -_ -_ -_ -_ -'_,3 2 öze, ____-_ ____-_ Onitt:So rula rı,

S 8

~

~

OniteSorufan Sııuflçi Uygulama....

79 O

_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __.4

Sı nıf içi Uygulama

•5

ÖLÇÜMLERiN GÜVENIRLIÖI VE STANDART HATASI

Ünite 4 (ss. 91 -141} ÖÖRETIMDE ÖLÇME VE DEÖERLENDIRMEYLE iLGiLi TEMEL KAVRAMLAR Onııe 2{ss. 27•52)

ÖlçUınleri n GUvenirliği

ve Standart Hatası _ _ _ _ _ _ _ _ _ _ _ _ _ _ _,9 2 92 GilvenirllWn Aıdam l arı 93 Ölçmede nara Türle • 94 Klasik Test Teorisinde Güvenirlik 97 Güvenirlik Kestinne Yöntemleri 99 a) Test Tekrar-Test Yöoteınl 99 1) iek rorın Yôııtcıni ....... 100 2) Alterna tif (f:~d t.'ğer, Pa ralel) Formlar Yöntemi 103 b) iç Tutarlılık Yöntemle r' 105 1) Testi Yrı rıl rım rı Yöntemi 105 2) KRıo Gtıveniı'li k Kestirimi ..._..-...-...... 108 3) KR:ı ı Güvenirlik Kestirimi 112 4) Cronbach Alfa (a) Güvenirlik Keı.'tirimi 112 ÖlçOınlerin GiivenirliJi

Öğretimde Ölçme ve Değerl endirmenin Tcmelleri _ _ _ _ _ _ _ _ _ _ _ _ _z7 Ölçme ve Değerlendirme ile ilgili Temel Kavramlar 8 Ölçme KurJlı O

Ölç,ne

O

Ölçme i şleıninln Aşamalar

1 2

Ölçüı

Ölçü

2

Değerl endirme

Eğitimdeki Ölçnıclerdc Karşıl aşılan icmcl Güçlükler Ölçülen Değişken in Yapısından Kaynakla nan Güçlükler

3 .... ........ .36 7

vi

vii

6

7

·-·> ·-

o.

us

BAŞARI TEST1 GELiŞTiRME VE UYGULAMA

Ölçmenin Standart Hatası _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ Hesapl anınas1 _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 115 Yo ruınla n maş.ı _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ J ı6 Gerçek Puan için Giiven Aralığının Bulun ması _ _ _ _ _ _ _ _ _ _ _ _ _ J l 7 Öğrenci 8.ışarısını Oeğerlendlrınede Ölçmenin St.ınd:ırt H.ıttısıııı n Ku ll.ınımı .......- ..... 120 Cüvenlrllitl EtkllC}'Cn Faktörler...- ........ . - - - - - -..- ... ........ ..... 121 Özet - - - - - - - - - - - - - - - - - - - - - - - - 129 OniteSorula rı _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ _ JJO Sı nıf.içi UyguL'ıma, _ _ __ __ _ __ _ __ __ _ __ __ _ __ _ 132

Ünite 6 (ss.173-188)

Testi ~liştirm e ,,e Uygulama _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 174 Öğretimde Başan Testi Ge l iştirme Aşa malan _ _ _ _ _ _ _ _ _ _ _ _ _ _ 175 ı . Ölçme Am.ıanın (Ölçülecek Oavranışl3r Evreninin) Tanıın l3nması _ _ _ __ 175 2. Ôlçillccek O.ıvranış:Jar Örneklemlnln Belirlenmesi - - - - - - - - - - 178 3. Model Ölçme Aracının O l uş'lurulın ası _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 180 4. Ön Uygulama için Testin Ol uştun.ıtma.sı ve Uzman Kanı lan _ _ _ _ _ _ _ _ 180 5. Ön Uygulama ve Madde Analizi _ __ __ _ __ __ _ __ _ __ _ J82 6. Nlh:.ıl Testin Ohışturuhn;;ısı - - - - - - - - - - - - - - - - -183 TeStin Uygu l a n masıyla ilgili Diğer Hususlar ......... ... ........ ...- ... ........ ...- ... ........ ...- ... ........ ..... 184 Örncklem _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 184 Güvenirlik ve Geçerlik _ _ __ _ __ __ __ _ _ _ _ _ __ _ _ _ 185 Başarı

ÖLÇÜMLERiN GEÇERLiĞi

Test Giivenliği - - - - - - - - - - - - - - - - - - - - - - - - 186

Ünlte S (ss. 143-172)

Öıet------------------------187 OııiteSorulan _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 188 Sı nıf içi Uygulama _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ ')88

Ölçümlerin Geçerliği _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ J44 Geçtl'llği Oüş(lren Duruml :ıı· 146 Geçerlik Kanıtı Toplama Yönlcmlcri... ....... 146 1) Kapsam Geçer liği Kanıt 146 2) Ölçüt Ge~rliği Kanıtı 152 3) Yapı Geçerliği K.ınıtı 155 Test ı>uanlannın Yonunla nmasın.ı Yönelik Geçcl'lik Kanı tlan . 157 4) Görünüş Geçerliği 157 Geçerliği Etkileyen Faktörler 158 JJ Amaca Uygunluk 1S8 2) istenmedik Değişkenlerin ÖlçOmlere Karı şm ası ve Test Y.1 nh lıj 159 3) Normlar 159 4) Cüvenirli 160 Ölçme Araçlarında Kullanışlılık 163 Ôı.et 163 Onlte Soruları_... .......- ........ ........ ........ ........ ... • ........ ........ ..... 164 Sı nıf içi Uygulama 165

TEST VE MADDE PUANLARININ ANALizl

Ünlte 7 (ss.189-228) MaddeAnallıli ---------------------- .._ 190

Seçenek Analizi Madde İstatiı.'tikleri Test istatistikleri Uygulama: M.1dde Analizi ve Test lst.ıtlstlkle

193 197 207 208

özet

219

Ünite Sorula rı Sı nıfiçi Uygulama Proje

220 221 228

ÖĞRENCi BAŞARISINI DEĞERLENDiRME

Ünite 8 (229-257) Öğrenci Başansııu Oeğel'lendirıne - - - - - - - - - - - - - - - - - 2 3 0 Oeğcrlendinnelerin Doğruluğunun iyileştirilmesi - - - - - - - - - - - - 2 3 1 Öğrenci Başansını Ocğcl'lendirıncdc Kullanılan Ölçütler - - - - - - - - - - 2 3 3 Öğrenci Puanla rının An.ulanan Oağıhma Dönüştürülmesinden Sonra Mutlak veya Bağıl Değerlend irme Yapına--------------------- 234 Değerle ndlmıeÇeşltlerL------------------23S Am.a ·-

o.

a) Normal Oaiılıından faydalanarak Not Vtrmt - - - - - - - - - - 239 b) Yfrıdelik Sırad an Faydalanarak Not Verme Mutlak "'e Bağı l Oeğerıendirme nin Birlikte Kullanım MutLık ve Bağıl Değerlendirm enin Kullanımı ôzet Onltt Soru.laı•ı ...-........ ........ .......-.......-........ . Sın ıf•iç-i

00ğnıYa nlıŞ 1"l'Stleri

- - - - -- - - - - - - - - - - - - - -312 312 Oojru-Yanlış Testle rinin Etkin Kulla nı mı 313 Ö1,et 321 Ooğru•Yanlış Testlerinin Teme l Ö7.ellikleri

241 245 250

252 .._... ........ ...-.. 253 254

Uygulama

Onite Sorufan Sınıf içi Uygulaın.l ...... ........ ..- ... ........ .......- .......- ..- .... .....

322 _ ... ........ ..... 322

SINAV TÜRLERi VE SORU YAZIMI ÇOKTAN SEÇMELi VE EŞLEŞTiRMELi TESTLER

Ünite 9 (ss. 259·284) _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 260 lılemeTestleri - - - - - - - - - - - - - - - - - - - - - - 2 6 2

Ünite 12 (ss. 323·348)

SınavTürleri

SoruYa?Jmı - - - - - - - - - - - - --

Çoktan Seçmeli 'festler- - - - - - - - -- - - - - - -- - --324 Çokta n S,e,çnıcli "re stlerle ilgili "remel K;l\'raınbr 324 Çoktan Seçmeli Testlerin Temel Özellikleri 326 Çoktan Seçmeli Test Maddesi Yaıımında Dikkat Edilecek Hususlar 328 Eşleştirmeli Testler 344 Eşleştlnneli Testlerin Etkin K ullanı mı 345 özet 347 OniteSorula rı 347 Sınıf içi Uygulama 348

- - - - - - - - -264

Soru Sorm.-ı "'e 'ftst Hazırlamada Oikkat Edilecek Genel Hususlar - - -- - -264 Bili şse 1Alan _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 271 Bilişsel Ala n Lı ilgili Oa\'ranışlann Sı nıfla ndırılması _ _ _ _ _ _ _ _ _ _ 271 Fo rklı Zihinsel Becerllerln ôtçütmeslne Sor u Yazım, _ _ __ __ _ _ _ _ 272

özer.. ... ........ .... ... ........ ........ ........ ........ ... .... ........ ... .... ... .... ... .... ... .... ... .... ... .... ... .... ... .... ... .... 282 Onit eSorula rı

_ _ __ _ _ __ _ _ _ _ __ _ _ _ __ _ _ __ 283

Sı nıflçiU ygulama

_ __ _ _ _ __ _ __ _ _ _ _ _ __ _ _ _

284

ALTERNATiF DE~ERLENOIRME Ünite 13 (ss. 349•360)

YAZILI VE SÖZLÜ YOKLAMALAR

Ünite 10 (ss. 285·304)

Altern atır Oeğerl end inne - - - - - - - - - - - - - - - - - - - 3 5 0 Öğrenci Gelişim Dosyası (Portfolyo - Poı•tfoUo) Oeğerlendirınesl 353

Yazılı Yoklama - - - - -- - - - - - - - - - - - - - - - - 2 8 6 Yazılı Yoklamalanıı öıellikJerl .... ........ .. ... ........ ...- 288 Yazılı Yoldamalann

~tkili Olduğu Durumlar Yazılı Yoklamalann Etkin Kullanımı için Öneriler Sözlü Sı navl ar SözlO Sına"'larııl Temel Ö-ıelll klerl Sözlü Sın:wları n Etkili Olduğu Durumlar Sözlu Sm,wla rın Uygulamasına Yönelik Ba:ı:ı Öneriler

Oc ı-ecclcmcli Puanlama Anahta rı (Rubric) Kullanımı DiRer Alternatif Değerlendirme Yöntem \'e Teknikleri

293 294 299 299 301

o,..,

Ünite Soruları

302 303 304

Sını f içi Uygula ın;ı

304

Oı Değerlendinne

356

356 357

Akran Oejerlendlm1e An.ket .. _......._......._......._......

358 358

Görüşme

358 3S9

Gözlem Öıet

359

OnlteSorukın Sı nı f.içi Uygubm

360

Ek•l Tablolar Kaynakça

36 1 365

360

KISA CEVAPLI VE DO~RU YANLIŞ TESTLERi

Ünite 11 (ss. 305·322) Kısa Cevaplı Testler

- - - - - - - - - - - - -- - - - - - - -306 Kısıı Ce"'aplı Testler in Teme l Ö'ıelllkleri - - - - - -- - - - - - - - 3 0 7 Kısa Cevaplı

Testlerin Etkin Kultanıını ....... ......._........ ......._.._.... ... ...- ..- .... ... ...- ... .......- ..... 309 xi

X

10

il

> ··-

o.

ı

Öğretimde Ölçme ı·e Değerltntlinıu:

EĞİTİMDE ÖLÇME VE DEĞERLENDİRMENİN YERİ VE ÖNEM İ

_ _ _ _ _ _ _ _ _ __,lüNiTE 1

KaMeli eğitim zaman ve emek gerektirdiği gibi önemli ölçüde para harcanmasını

da gerektirir. Eğitimde dijital teknoloji kullanımı özellikle günümüzde

popüler olan arttırılmış gerçeklik ve sanal gerçeklik uygulamalarının eği­ timde kullanım ı da ayrıca bir maliyet gerektirmektedir. Eğiti m hizmetinde öğ­ rencilere istendik niteliklerin kazandırılması aşamalı şeki lde sağlanır ve her bir aşamada istendik niteliklerin kazand ı rı l ması belli bir zaman gerektirir.

EĞİTİ MDE ÖLÇME VE DEĞERLENDİRMENİN Y ER İ VE ÖNEMİ

Yani günümüz koşullarında öğrencilere bir günde matematik öğretmenliği

temel yeterliklerini öğretemeyiz . Eğiti me harcanan süre ve maliyetin azaJtıl­ ması ve verim liltğin arttırılması için hem eğ itim sürecinin ve öğ renme aşa­

ÖĞRETiMiN PLANLANMA$! GEREKLiLiĞi

mala rının

Sistem Yaklaş ı mı Eğilimde Sistem Yaklaşı mına Göre Verimliliği Etkileyen Faktörler Eğitim Sisteminin Girdi Öğesi ôğrenci, öğretmen, eğitim programı, ekonomi, yönetim Eğitim Sisteminin Süreç Öğesi Kaynaklann ve potansiyelin etkin kullanımı ve isteklendirme /motivasyon) Eğitim Sisteminin Çıktı Öğesi Eğitim Sisteminin Değerlendirme Öğesi Eğilim Sisteminde Ölçme ve Değerlendirmenin işlevleri EĞİTiMDE PROGRAM GELİŞTİRME SÜRECİNDE ÖLÇME VE DEĞERLENDİRMENİN YERİ VE ÖNEMİ Eğitimde

hem de öğrenme çıktılarının güvenilir ve geçerli yöntemlerle iz-

lenmesi ve değerlendirilmesi kaliteli eğitimin olmazsa ol mazıdır. Öğretim etkinliklerinin kontrollü bir şekilde yapılması ve bu öğretim et-

kinliklerinin iyileştirilmesi için gelişimsel amaçlı ölçme ve değerlendirme et• kinliklerinin gerekliliği aşik8rdır. Öğretimde bu kontrolün sağlanmasında aşağıdaki işlemlerin doğıu bir şekilde yapılması

önemlidir:

✓ Öğretim hizmeti verilecek grubun çok iyi tanınması, ✓

Dersin içeriğinin (hedeflere uygunluk, öğrenil ebi lirlik, öğrenci ilgisini çekme, öğrencinin öz.yeterlik düzeyi, otantiklik-doğruluk, yararlılık ve uygulanabilirtik bakımından) uygun şekilde

belirlen-

mesi, ✓ Öğrenme.öğretme sürecine başlamadan önce ve süreç devam

ederken, öğretim hizmetinin

öğretilen

konuya,

gıuba

ve

öğret­

mene uygun ol ması . ✓ Öğrenme.öğretme sürecindeki öğrenme eksiklik ve güçlükleri•

Öğretim Programının Öğeleri

nin belirlenmesi,

1. Hedefler ve D avranışlar 2. içeriğin Düzenlenmesi 3. öğrenme- öğretme Aktiviteleri 4. Ölçme ve Değerlendimıe Program Geliştimıe Sürecinde Süreklilik ilkesi Açısından Ölçme ve Değerlendimıenin Yeri ve Önemi Ölçme Teorisini Bilmenin Önemi Öğretmenlerin Ölçme ve Değerlendirmeyle İlgili Temel Becerileri Kazanmasının Önemi ÖZET ÜNiTE SORULARI SINIF-IÇİ UYGULAMA

✓ Öğretim sonunda öğrenme düzeylerinin ölçülmesi ve bir bütün

olarak tüm program çıktılarının çok yönlü olarak mesi gerekir.

değertendiril­

Yukarıd a belirtilen tüm bu işlemle rin yapıl masında ölçme ve değerlen­ dirme etkinliklerinin doğıu olarak uygulanması çok önemlidir. Ölçme ve değerl end i rme i şlemleri yapıl mada n. öğre ti m hizmeti verilecek gıubun yeterli olarak tanınmas ı mümkün olmaz. süreç esn asındaki eksiklik ve aksaklıklar uygun bir şekilde belirlenemez, süreç sonunda oluşan öğrenci yeterlikleri doğıu olarak belirlenemez ve eğiti m sisteminin kendini en iyi şeki lde yenilemesi ve geliştimıesi için odaklanılması gereken konularla ilgili doğru veri sağl anamaz.

12

13

·-·> ·-

Eğiliııule Ölçme ı•c De{,erlettdinttenitt )'eri ı•e Ötıemi

Tartışma

3

4

Öğretimde Ölçme ı·e Dcğerltntlinıu:

Öğretim programının değer1endirilmesinin olmazsa olmazlarından biri de ölçme ve değerfendinnedir. öğretmen yeterlik ve peıformansının değerlendirilmesi de ölçme ve değerlendi rme etkinlikleri gerektirir. H azırla• nan bir öğretim program ının uygulanabilirliği ve gruba uygu nluğunun belirlenmesinde de ölçme ve değerlendirme etkinliklerini gerektirir. Ölçme ve değerlendirme etkinlikleri amaca uygun doğru bilgiler sağlayarak birey veya grupların eğiti mlerine yönelik ve uygulanan programlara yönelik gelişimsel amaçtı daha doğru karartarvermemizi ve uygulanan program ı n g elişti ril mesi için doğru tespttlere ulaşılmasını sağl ar.

Sorusu

Eğitimde ölçme ve değerlendirmede hangi amaç için (bilişsel, duyuşsal ve psiko-motor a/an veya seçme, tanıma, izleme, yeterlik düzeyi veya rehberlik gibi.. .) ne tür etkinlik/erinin (sınav, anket gôrOşme gibi. . .) yapı/ması gerektiğini aşağıya yazıp arl ·-

o.

Eğiliııule Ölçme ı•c De{,erlettdinttenitt )'eri ı•e Ötıemi

6

S

ÖĞRETİMiN PLANLANMASI GEREKLİLiĞi

Bu tanımdan da anlaşılacağı üzere, öğrencilere kazand ırılmas ı planlanan istendik davra nışların ..kendi yaşantıları· yoluyla kazanıl ması söz konusudur. O halde öğrencilerin öğretim yaşantılarının neler olacağına yönelik bir plan yapmak gerekmektedir. Öğrenme-öğretme sürecinde öğrencilerin edinecekleri bu yaşantıların neler olacağına yönelik ve bu öğrenme yaşantıla­ rının etkili bir şekilde sağlanması için profesyonelce planlama yapmak gerekir. Yani, öğretimi planlama yoluyla, öğ rencilere öğretim amaçları nı kazand ırabilme ihtimalimizi arttıracak yaşantıla r sağl ama şansımız artacaktır. Öğrencilerde meydana getirilebilecek istendik davranışların neler olacağı ve bu davranışların gerçekleşebilme düzeyi, hem bireyin hazırbulun uşluk düzeyine hem de bireye sunulan öğretim hizmetinin n iteliğine önemli ölçüde bağlıdır. Eğitim hizmetinin daha kaliteli olabilmesi için eğitimin kalitesini etkileyen önemli koşulların dikkate alınıp iyileştirilmesi veya uygun koşulların düzenlenmesi gerekmektedir. Eğitimde başarıyı etkileyen önemli değişkenlerin kontrol altına alınıp, düzenlenmesi gereksinimi, etkili ve verimli bir eğitim için pla nlı olmay ı zorunlu kılar. Planlı ve sistemli bir şe­ kilde eğitim hizmetinin organizasyonu eğitim program larının hazı ı1anmasını, uygu lanmasın ı, değerlendirilmesini ve revize edilmesini gerektirir. Eğ itim etkinliklerinin sistematik ve plan lı bir şekilde yerine getirilmesi de eğitimde sistem yaklaşımının benimsenmesini sağlamı ştır. Eğitim işi nin bir sistem olarak ele alınması ve karşılaşılan eğiti m sorunlarına bir sistem yaklaşımıyl a bakılmasını n daha doğru ol acağı in ancından dolayı aşağıda eğitimde sistem yaklaşım ı k ı saca açıkla nmaktadır.

Bir dersin öğretiminde, öğretmen in dersin öğ retimi ve değerlendirilme­ siyle iJgili bazı karar1ar vermesi gerekmektedir.

Sizce bir öğretmen, sonımlu olduğu dersin öğretimiyle ilgili olarak öğre­ time başlamadan önce hangi konularda hazırlık yapmalı veya kararlar vermeHdir? Cevabınızı aşağıya yazınız. Yazdıkla rınızı s ı n ıf arkadaşlarınızla paylaşınız.

1.

2. 3.

Öğreımenin dersin öğretimine ve değerlendiıilmesine yönelik vereceği bu kararlar aşağıdaki konularla ilgilidir: ►



Derste hangi konu ların hangi detayda ve sürede öğretileceği Öğrencileıin öğrenilecek konularla ilgili ön bilgilerinin yeterliğinin nasıl

Eğ itimde

beli rl eneceği



Öğrencileıin öğrenme hızı gibi genel hazırbulunuşluk düzeyleıinin nasıl

Sistem Yaklaşımı

Belirlenen niteliklerin öğ ren cil ere kazand ırılması için yapı l acak öğ reti m etkinliklerinin planlanmasında dikkate alınması gereken birbirini etkileyen birçok faktör vard ır. Eğitime bir sistem olarak bütüncül bir yaklaş ımla bak tı­ ğı mızda , öğretimi planlarl ·-

o.

Eğiliııule Ölçme ı•c De{,erlettdinttenitt )'eri ı•e Ötıemi

8

7

ise, bu ham maddelerin mevcut teknoloji ve işgücü ile birfeşerek işl enmesi­ dir. Bu kı sma da sistemin süreç öğesi denilir. Nihayetinde, fabrikada süreç sonucunda üretilen televizyon, buzdolabı gibi bir ürün ortaya çıkacaktır. Bu üretilen ürünlerin üretim amacına uygunluğu veya kalitesi kontrol edilmelidir ki yapılan hatalı üretimler varsa tespit edilebilsin. Daha sonra, varsa yetersiz veya hatalı üretimin sebepleri belirlenip, gerekli tedbirter alınab il sin . Sistemin çıktısı olan televizyon, buzdolabı gibi ürünlerin kalit e kontrolünün yapıl­ ması ve aksaklıkların belirlenmesine yönelik gerekli tedbirterin alın ması da sistemin bir değerfendirme öğesi olarak düşünülebili r. Sistemi oluşturan tüm bu öğelerin işbirliği içinde çalışması önem taşımaktadır. Sistemin herhangi bir llğesindeki aksaklık, tüm sistemi olumsuz etkiler. Eğitime bir sistem yaklaş ı m ı yla bakıl d ığında. her sistem gibi eğiti m sistemi de; girdi, sUreç, çıktı ve deljerfendirme(kontrol) öğeleri nden olu ş­ maktadır. Bu öğelerin herhangi birindeki değişiklik, eksiklik. yanlış işleyiş. sistemin ça lı şmas ı nı ve elde edilecek ürünün n iteliği ni etkiler. Çünkü sistemin tüm öğel erini n işleyi şini n bir sonucu olarak bireylere istendik davranışlar belli ölçüde kazandırılabil mektedi r. Eğitim sistemini oluştu ran öğeler ve bu

timiyle ilgili olarak mevcut yaklaşım sistemin i şleyişini ve elde edilecek ç ık ­ tın ın kalitesini etkileyen önemli unsurlardandır. Yine, eğitim sisteminin söz konusu girdilerinin etkin şekilde kullanımı da hem eğitim sisteminin işleyi­ şini hem de eğitim sisteminin çıktılarının kalitesini etkiler. Anlaşılacağı üzere, eğitim sisteminin her bir öğesinin verimli bir şekilde işlemesini etkileyen bazı değişkenler veya faktörler mevcuttur. E{ıitimd e

-Öğrenci -Öğretmen

- Programlar -Ekonomi - Yönetim

.__,;;_ SU .c.,;R_;E;;,,. Ç_

arttırılması

l

Yaklaşımına

Göre Verimlili{ıi Etkileyen

Bu kısımda eğitimde sistem yaklaşımına göre eğitim sisteminin her bir alt öğes i için sistemin ve ri m l iliğini etkileyen faktörlerden önemli görünenleri k ısaca aç ı klan mıştır.

Eğitim Sisteminin Girdi Öğesi Eğitim sisteminin önemli girdileri arasında ; öğrenci ler . öğretmenler. eğitim programla rı, ülke ekonomisi ve yönetim yaklaşımı sayılabi lir.

1. Öörenci: Ö~renciler eğitim sistemine belli bir takım özellik ve potansiyelle gelirter. Oğrencilerin bilişsel, duyuşsal ve psiko-motor o larak öğrenme-öğretme etkinliklerine hazırbulunuşluğu (ön-bilgisi, zeka düzeyi, öğren me güdüsü, fiziki yeteı1iğ i vb.), yaş ı ve sosyo-ekonomik d urumu g ibi nitelikleri eğitim sisteminin öğrenciyl e ilgili önemli girdileri arasında yer almaktadır. Öğrencilerin bir programa karşı sadece duyuşsal olarak hazır­ bulunuşluk düzeyleri bile sistemin i şleyişi ni ciddi bir şekilde etkilemektedir. Öğrencilerin duyuşsal nitelikleri eğitim sistemimizde muhtemelen en çok ihmal edilen veya önemsenmeyen ama sistemin işl ey işini ihmal edilmeyecek kadar çok etkileyen bir öğrenci n iteli ğid i r. Duyuşsal alanla ilgili hazır­ bulunuş luk düzeyinin önemini bir örnekle açıklaya lı m :

_,H .__ _._Çl;;,.K;;,.TI' ----'!-+

- K ayn akların ve potansiyelin etkin kullanı m ı - Motivasyonun

Sistem

Faktörler

öğel er aras ı ndaki il işki aşağıdak i şekilde sunulmuştur.

ı.,__;G_;,;, IR"D "_i__.H

Öğretimde Ölçme ı·e Dcğerltntlinıu:

-istendik nitelikte -Yetersiz -istenmedik

/

DEĞERLENDİRME (Kontrol) Şekil

1-1 : Eğitim sisteminin öğeleri arasındaki i lişki

Eğitim sistemindeki her bir öğenin verim l iliği, elde edilecek ürünün kalitesini etkiler. Öğrencilerin ve öğretmenlerin eğitim sisteminin g irdisi olarak; mevcut potansiyelleri. eğitime ayrılan para ve ülkenin eği tim yöne-

19

18

·-·> ·-

o.

Eğiliııulc Ölçme ı•c De{,erlettdinttenitt )'eri ı•e Ötıemi

10

9

Öğrencinin duyuşsal hazırbulunuşluğunun etkisi:

Tartışma

iki öğrenci grubu düşünün, bunlardan birinci grupta olan öğrenciler gelişmiş bir ülkenin eğitim fakültesi öğrencileri olsun. Bu öğrenciler mezun olduklarında, kendi fakül/eteri dışında bazı test merkezlerince hazırtanan ciddi bir atan bilgisi testi a/acaklannı ve bu testten atacakları puanlara göre iş bulabileceklerini daha baştan bilsinler. Testten iyi puan alan öğrenciler sosyo-ekonomik ve kültürel açıdan çok gelişmiş bir semtte çok iyi bir ücretle çalışabileceklerinin, düşük puan aldıkları durumda ise genelde azınlıkların olduğu fakir ve gelişmemiş bir semtte çok düşük bir ücretle çalışabileceklerinin farkında olsunlar. Ayrıca, bu gruptaki öğrenciler iş başarısının sürekli gözlendiği ve başarısızlık durumunda bir halta gibi kısa bir sürede çalıştıkları kurum tarafından işlerine son verilebileceğini de bilsinler.

Sorusu

Farklı ôğretmen ôzel/iklerinin /Notu bol, Notu kıt, Mükemmeliyetçi, Bonkôr, Otoriter ve Baba Öğretmen gibi), ilk derste bıraktığı izlenimlerin, ôğrencilere ve eğitim sisteminin işleyişine etkisine yönelik kendi yaşantılarınızda örnekler veriniz.

Verdiğiniz ômeklerin öğretmen öğrenci etkileşimine ve mini işleyişine etkilerini arkadaşlarınızla tarlışınız.

eğitim siste•

örnek 1: ••••••• •••• •••••••• ...... Öğretmen Özellikleri:

ikinci öğrenci grubu olarak gelişmekte olan bir ülkenin öğrencilerini Bu öğrenciler öğrenimlerini ne kadar başarılı bir şekilde tamam/artarsa tamamlasınlar, /istisnai durumlar hariç) genelde aynı ücret ve kalitede bir yaşam standardına sahip olacaklarını, programa başla­ madan bilsinler. Ayrıca, iş başarısının ciddi ve objektif bir şekilde gôzlenmeyeceğinin, iş başarılarının kurumunda yükselmesini ciddi bir şe­ kilde etkilemeyeceğinin farkında olsunlar... düşünün.

Ö(ırencilere ve Eğilim Sisteminin iııe~lıine Etkisi:

örnek 2: ••••••• •••• •••••••• ...... Öğretmen Özellikleri:

Tartışma: Bu iki grup öğrencini n duyuşsa l giriş davranışlarının eğilim sisteminin işleyişini ve elde edilecek ürünün kalitesini nasıl etkileyeceği konusundaki görüşlerinizi belirtiniz.

Tartışma

Ö[;retiııule Ölçme ~·e Dt.'ğcrlc,,dimıe

Öğ,rencl/ere ve Eğitim Sisteminin iııe~iıine Etkisi:

Sorusu Öğretmenlerin duyuşsal hazırbulunuşluk düzeyleri de en az öğrencilerin

Başarılı olmada en önemli faktör nedir?

duyuşsal hazırbulunuşluk d üzeyleri kadar önemlidir. Anlaşılacağı üzere, öğ retmen l erin

alan bilgisi, öğretmenli k meslek bilgisi ve genel kültür bayeterli olmasının yanında duyuşsal olarak da olumlu özellik• tere sahip olması gerekir. kımından

2. Öğretmen: Öğretmenlerin alan bilgisi, öğretmenlikteki yeterliği, zekası, duyuşsal özellikleri, kişiliği vb. gibi nitelikleri eğilim sisteminin girdileri arasında yer a l ır. Tüm eğilim kademelerinde, öğretmen gerek bilgi kaynağ ı ve/ya rehber olarak gerekse örnek bir insan olarak eğitim sisteminin i şleyişi sonucunda elde edilecek ürünleri ciddi olarak etkileyen /aktörlerden biridir. özellikle alt eğitim kademelerinde b u etki çok daha fazla olmaktadır. Öğretmenin de alan bilgisinin yanında duyuşsal olarak da hazır­ bulunuşluğu söz konusudur. Öğretmenlerin mesleklerine duyduğu saygı, mesleklerini sevme düzeyleri, mesleklerinin kendilerine sağl ad ığ ı olanaklar duyu şsa l h azırbulu n uşlukl arı nı etkilemektedir.

3. Eğitim programları: Eğilim ve öğretim programları temelde öğren­ cilere hangi hedef davranışların kazandırılmasının arzul andı ğını gösteren planlar olduğu için tamamen sistemin ul aşmak islediği hedefleri belirlemektedir. Planlı eğitimde eğitim prog ram ları mutlak surette olması gereken girdiler arasındad ır. Her öğrencini n belli bir öğrenme potansiyeli vardır. Öğrenme aktiııitelerinin imkan elverdikçe öğrenci merkezli olmasını sağlamak gerekmekted ir. Öğrencilerin seviyelerine uygun bir formatta h azırlanmış olan bir program öğrenme-öğretme sürecinin çok verimli olmasını sağlar. Ders programlarında öğrencilerin sadece bilgi düzeyindeki

20

21

·-·> ·-

o.

Eğiliııule Ölçme ı•c De{,erlettdinttenitt )'eri ı•e Ötıemi 11

J2

hedefleri kazanmaları yeterli görülmemelidir. Öğrenciler mutlaka kavrama hatta bazı dersler için uygulama düzeyine çıkabilmelidir. Öğren­ ciler neyi neden öğrendi klerini bilmeli ve öğrendi klerin i güncel olay1arfa iliş­ kilendirebilmelidirler. Ders programları öğrencilere belli bir bilim dalı ile ilgili bilgileri kazandırmakla bi~ikle, öğrenci lere bilimsel düşünme, objektif yorumlama yeteneği, araştırmacılık gibi bazı becerileri de kazandırabilecek nitelikle olmalıdır. Programda hedef davranışl arın öğrencilere kazandırı l­ ması için öngörülen süre de yeterli olmalıdır . Ayrıca, h az ı rla nan programl arın, öğretim hizmeti sunulan gruba uygun luğu önem taşımaktadır. Dersin verildiği grup için çok basil veya çok zor gelen hedefler için düzenlenen bir öğretim programında verimlilik düşük olur. 4. Ekonomi: Ekonomik koşullar. eğ itim için gerekli fiziki olanaklar (okul, dershane, laboratuvar, bilgisayar. kütüphane ve inıerneı vb. gibi malzeme ve hizmeller}, sınıftaki öğrenci sayısı , ö{ıretmen sayısı ve araştırm a , geliştirme , telafi edici veya eksiklikleri ta maml a yıcı birebir eğitime (tutor) ayrılacak bütçenin miktarı sistemin işleyi şini etkileyen ekonomik faktörler arasındadır. Eğ itim sisteminin girdi öğesi olarak eğitime ayrı l an para çok yetersiz ise bu durumun neden ola cağ ı sorunlar sistemin i ş l eyişi ni ve verimlil iğ i ni olumsuz şekilde etkiler.

Ö[;retiııule Ölçme ~·e Dt.'ğcrlc,,dimıe

önemli bir unsuru yeterli öğrenme motivasyonuna sahip olmaktır. Eğitim sisteminin işleyişini etkileyen öğrenciyle de ilgili olan diğer bir unsur ise öğren­ meye ayrılan süredir. Öğrencilerin bir konuyu öğrenmeye ayırdıkları za. man, öğrenme d üzeylerini önemli ölçüde etkilemektedir. Öğrenci peıior­ ma nsının arttırılmasında, öğrencilere ihtiyaç duydukları zaman ve bu zaman içinde uygun öğrenme etkinliklerinin sağl anması gerekir. Mevcut sürenin yelerti olmadığı öğrencilere ilave olarak lulor desteğ i sağlama gibi etkinliklere süreç içerisinde yer verilmesi öğrenme düzeyinin iyileştirilmesi nde çok ciddi fayda sağlar. 2. Öğretmen performansı: Öğretmenin mevcut potansiyelini etkili bir şekilde kullanabilmesi için ekonomik ve psikolojik açıdan ciddi sorunl arı nın o lmaması ve öğrenme ve öğretmede yeterli motivasyona sahip ol ması gerekir. Öğretmenin mevcut potansiyelini mümkün oldukça yüksek düzeyde kullanmasını sağla mak önem taşımaktadır. 3. Ders programının iş lenmesi : Ders prog ramının etkili bir şekilde iş­ lenmesi için programının bazı teknik özellikleri taşıması gerekmektedir. Dersin ünitelerine ait hedef ve davra nışları n öğrenci düzeyine uygun bir şe­ kilde belirtenmesi ve aşamalıhk ilkesine göre düzenlenip uyg ul a nma s ı gerekir. ikinci sınıf matematik programının önemli kısmının işlenmediği bir sı­ nı fta üçüncü sınıf matematik prog ramın ın aynen uyg ul anması sistemin i şle­ yişini olumsuz etkiler ve başarısızl ık ga rantilenmiş olunur. Ayrıca, aynı program ı farklı iki öğretmen farklı uygulayabilir. Programın öğretimin kalitesi açı• sından en uygun bir şekilde u ygulanmas ı sistemin işle yişini verimli kılma açı sından önem taşır. Ders programlarını n etkili bir şeki lde işl enmesinde önemli olan diğer bir unsur da "eğitim durum l arının düzenlenmesidir. "Eğilim durumlarının düzenlenmesinde ders işleni rken pekiştireç, ipucu. dönül-düzeııme öğ­ renci katılımı. tekrar ve uygulama olanağ ı sağl ama gibi dersin işlen işinde veri mlil iği arttıran etkinliklerde bulun ulma lı dır.

5. Yönetim: Eğitim öğ retim hizmeti veren kurumlarda da yöneticiler ve bir yönetim yaklaşımı vardır. Başarılı bir eğitim sistemi için, etkili liderlik gerekli koşullardan biridir. Yöneticilerin gerek öğretm enlere gerekse öğ­ rencilere karşı sahip oldukları önyarg ılar ve yöneticilerin kişilik yapıları sistemin girdilerini belirfeyen faktörferarasındadır . Yönetim, hem öğretim personelinin hem de öğre ncilerin motivasyonunu önemli ölçüde etkiler.

Eğitim Sisteminin Süreç Öğesi Bir zaman dilimi olarak süreç; öğrencil erin eğitim sistemine giri şi ile sistemin bir çıktısı olana kadar geçen süreyi, öğrenim süresini kapsamaktadır . Eğilim sisteminin süreç öğesi , öğrenci lere istendik ve planlanan davranışların kazandırılması için yapılan tüm işlemleri içermektedir. Öğretim açı sından bu süre içerisinde tüm öğretme-öğrenm e etkinlikleri ve diğer bazı sosyal ve kültürel etkinlikler kastedilmektedir. Eğitim sisteminin girdilerinin yeterliği ve uygunluğu sürecin verimli bir şeki lde işlemesini etkilemektedir. Eğitim sisteminin süreç öğesi, öğrencilerin hem nitelik hem de nicelik bakı mından islediğimiz düzeye ulaşmasın ı sağlamada sistemin en önemli öğesini oluşturmaktad ır. Eğitim sisteminin süreç öğesinin işlerli ğini etkileyen bazı değiş kenler aşağıda sunulmaktadır.

Eğitim sisteminde süreç öğesinin etkili bir şeki k:Je işlemesinde önemli olan diğer bir unsur da kullanılan "öğrenme-öğretme yöntemleridir." Öğ­ renme-öğretme yöntemleri, dersin hedef davranışlarına ve öğretmen ve öğ­ rencilerin hazııbulunuşluk düzeyine uygun olmalıdır. Öğretim etkinliklerinde yeterli düzeyde ve uygun materyal kullanımına da yer verilmelidir. 4. Ekonomik imk~nlann etkin kullanımı: Mevcut ekonomik ölanaklann etkili bir şekilde kullan ı mı da sistemin işleyişi ni etkilemektedir. Okula gelen bi~ gisayar gibi bazı malzemelerin depoda bekletilmesi. mevcut imkanlar olmasına rağmen bazı dersler için uygulama laboratuvartannın kurulmaması, bil• gisayar destekli bazı öğreti m programl arından faydalanma yoluna gidilmemesi gibi durumlardan dol ayı sistemin daha az bir verimle çatışması söz konusu olur.

1. Öğrenci performansı: Öğrencinin dersin içeriğine bağlı olarak mümkün oldukça eğilim ortamına aktif bir biçimde katılımı sağlanmalıdır. Öğ­ renciler mevcut potansiyellerini etkili bir şekilde kull anmalıdırlar. Bunun

22

23

·-·> ·-

o.

Eğiliııule Ölçme ı•c De{,erlettdinttenitt )'eri ı•e Ötıemi 13

J4

5. Yönetimin sürecin verimli olmasına etkisi: Okul müdürferi sadece bir kural uygula yı cı olarak işlev görmemelidir. Yöneticiler. öğretmene gereken sorumluluğu vermeli ve saygıyı göstermelidirler. Öğretmenlere ve hatta öğrencilere moral verme ve onları güdülemede yöneticilerin yetenekleri ve insan ilişkilerindek i yaklaş ımları eğitim süreçlerinin verimli olmasında önemli bir faktördür.

Ö[;retiııule Ölçme ~·e Dt.'ğcrlc,,dimıe

(öğretmen veya öğrenci gibi) sorumlu tutulamaz. Değerlendirme , değerlendirme öğesi dahil eğitim sisteminin her öğesinde yapılmalıd ır. Eğitim sisteminde nelerin değerlendirilebileceği aşağıda sunul muştur.

Eğitim Sisteminde Ölçme ve Değerlendinmenin İşlevleri Eğ ili m

kontrol

Eğitim Sisteminin Çıktı Öğesi

sisteminde ölçme ve değerlend irmen i n temel

öğel erinin işl e rliğ i ni n

E ğitim

sisteminin çıktıs ı, öğrencilerin süreç sonucunda kazanmış oldukları davranışlar veya niteliklerdir. Öğrencilerin sistemin bir çıktısı olarak planlanan ve arzulanan davranışları kazanma durumları aşağ ıdaki gibi olabilir:

işlevi

sistemde bir sistemin tüm kontrol edilmesini ve söz konusu eksikliklerin belir-

mekan izmasını sağlamaktır. D eğerl end i rme, eğitim

lenmesini

sağlar.

1. Eğitim sisteminin girdilerinin uygunluğunun belirlenmesi: Eğitim sisteminin girdilerinin değerlendirilmesi için aşağ ıda belirtilen etkinliklerin yap ıl ması gerekir: ✓ Öğrencilere uygulanacak programdan önce. öğrencide bulunması gereken bilişsel, duyuşsal ve psikomotor davranı şların uygun luğu ­ nun belirlenmesi. ✓ Öğretmenlerin alan bilgisi, öğretebilme becerisi, kültürel yeterliği ve meslek sevgisi gibi bil işsel ve duyu şsa l özelliklerinin yeterliğinin belirtenmesi. ✓ Öğretim programının uygunluğunun belirlenmesi. ✓ Eğ itim k u rumlarının kapasitesi, öğrenci ve öğretmenle ri n say ı sı. eğitim için ayrıl an maddi kaynaklar g ibi sistemin diğer girdilerinin yeterliğ i nin belirlenmesi.

1. Yeterli bir düzeyde kazanılmış 2. Yetersiz bir düzeyde kazan ılmış veya 3. istenmeyen davranışlar kazanılmış.

istendik davranışların yeterfi düzeyde kazanılması durumunda eğitim sistemin iyi işlediği veya çok ciddi sorunların olmadığı yargısına varılır. Istendik davranışlar yeterli d üzeyde kazanılmamış ise. sistemde ne tür aksaklıkların old uğu konusunda bazı çal ışmalar yapılmalıdır. Bu durumda, sistemi ol uşturan tüm öğele rin analiz edilmesi sonucu belirlenen eksiklik ve aksaklıkların giderilmesi için gerekli araştırma l ar yapıl malı ve sorunların çözümüne yönelik yeni yaklaşımları içeren uygulamalar yapılmalı veya tedbirler alınmalıdır. Bazen öğren cileri n istenmedik davranışl arı kaza ndığı durumlar söz konusudur. Öğrencilere yalan söylemenin iyi bir davranış olmadığını kazandırmak amaçlandığında, program sonunda öğrenciler daha iyi yalancı oluyorlarsa istenmedik davra nışların kazan ılması durumuyla ka rşı l aşmış olunur. Bu durumda sistemin kötü i şledi ği ve bazı iyileştirici tedbirlerin al ınması gerektiği kanaatine varılır.

Bu ıür amaçların sağlanabilmesi için seviye belirleme veya tanılayıcı testlerden, anket, görüşme. gözlem, mülakat gibi ölçme araç ve yöntemlerinden faydalanmak gerekir. 2. Eğitim sisteminin sürecin işlerliğinin belirlenmesi : Öğretim süreci devam ederken öğren ci ve öğretmen peıformansının ölçülmesi ve değer­ lendirilmesi gerekir. Öğrenme-öğretme tekniklerinin yerinde ve etkili bir şe­ kilde kullan ımı . öğre tim teknoloji ve materyallerinin kullan ı mı . yani programın uygulanabilir1iğin in belirlenmesi, öğrenci ve öğretmenlerin potansiyellerinin yeterli düzeyde kullanımı gibi özellikleri içeren sistemin sürecinin değerlendirilmesi gerekir.

Eğitim Sisteminin Değerlendirme Öğesi Eğitim sisteminin değerl end irme öğesi, sistemin aksayan ve eksik yönlerini tespit etme olanağı sağlar. Çıktılar üzerinde yapılacak kontrol sonunda, geliştirilen da vranışl ardaki yetersizlik halleri, bunları n düzeyi ve kaynakları saptanabilir. Genel olarak değerlendirme sayesinde eğitim sisteminin eksik ve aksayan yönlerinin tespitiy1e, sistemin kendini kontrol etmesi ve eksikliklerini gidermesine yönelik araştırma ve gelişti rme çalışma­ ların a destek sağlanır. Eğitim sisteminde bazı aksaklık ve eksiklikler tespit edildiği zaman unutmamak gerekir ki. bunda sistemin tüm öğel erinin katkısı vardır. Eğitim sisteminin kötü iş lemesinden sadece tek kaynak

Bu tür amaçların sağlanabil mesi için, genel o larak dönüt-düzeltme etkinlikleri, quizfer, izleme testleri, başarı testleri, standart testler (merkezi sı ­ navlarla öğrencile rin, öğretmenle rin ve okulun performansının belirfenmesi için). gözlem ve görüşme g ibi ölçme araç ve yöntemlerini kullanmak gerekir.

24

25

·-·> ·-

o.

Eğiliııulc Ölçme ı•c De{,erlettdinttenitt )'eri ı•e Ötıemi 15

Ö[;retiııule Ölçme ~·e Dt.'ğcrlc,,dimıe

16

Eğitimde Program Geliştirme Sürecinde Ölçme ve Değerlendirmenin Yeri ve Önemi

3. Eğ iti m sisteminin ç ı ktılarının kalitesinin belirlenmesi: Uygulanan bir program sonucunda öğrencilerde oluşan davranışları içeren sistemin çık• tıları için kalite kontrolünün yapılması, eksiklik ve yetersizliklerin belirten. mesi gerekir.

Eğitim sisteminin verimli bir şekilde işlemesi amacıyla yapılacak etkinlikler için planların hazırlanması önemlidir. Söz konusu planl arın hazırla nması ve sürekli olarak ge liştirilmesi ni yani program geliştirmeyi konu alan bilim dalı ise Eğitim Programları ve Öğretimidir. Program geliştirme sürecinin öğel erinden biri de ölçme ve değerlendirmedir.

Bu tür amaçl arın sağlanabilmesi için geniş kapsamlı başarı testleri , a nket, görüşme, gözlem, mülakat gibi ölçme araç ve yöntemlerinden faydalanmak gerekir.

Program kavramıyla: belli bir !!ll.LCB ulaşabilmek için, yapıl ması ge* reken aktivitelerin nelerden oluştuğun un belirlenmesi, aşamalı bir şekilde sıral anması , her bir aktivitenin alacağı zaman ı, nasıl yap ılacağını v e ~ lan işlerin uygunl uğunun nasıl belirlenebileceğinin bir tasarısı kast edilmektedir. Anlaşılacağı gibi program kavramı öncelikle, ulaşılmak istenen bir amac ı içeren . daha sonra b u amaca ulaşabilme k için sıras ıyl a yapılması gereken işleri ve bu işlerin uygun bir şekilde yapılma durumunun ölçülüp değerlendi rilmesini içeren bir ö n ça lışmadır. Hazırlanan bir programı uygulanmaya konmadan önce değerl endi r­ mek mümkündür ve gereklid ir. Uygulama öncesi yap ıl a n değerlendirme sonucunda programda bazı iyileştirmeler yapılabileceği g ibi progra m ın uygulanmas ın dan tamamen vazgeçme kararı da verilebilir.

4. Eğitim sistemin değertendirme öğesinin değerlendirilmesi: Ölçme ve değerlendirme işlemlerinin uygun bir şekilde ve yeterti d üzeyde yapılıp yapılmadığına yönelik değertendirmeleri n yapılması için elde edilen Öl• çümlerimizin güvenir1iğinin ve geçerliği nin belirlenmesi gerekir. Biz okullarda öğren ci başarısını ölçerek, öğrenci lerin başarıları hakk ındaki değe rtendirmeyi genelde, öğ re nci l eri bir üst sınıfa veya okula yönlendirmek için, başarı /başarıs ızl ığı belirlemek amacıyla yaparız. Bir alt sı­ nıf düzeyinde yapılan değerl e ndirmen in hatasızlık d üzeyi bir sonraki s ın ıf düzeyi için daha uygun g irdi sağlama açısından önemlidir. Ayrıca, öğren­ cilerin başarılarına bakıp (bazı hallerde) genel olarak öğretme-öğrenme sürecini değerlendirmemiz de söz konusudur. Eğitim sisteminin tüm aşamasında kullanılabi lecek ölçme ve değerlen­ dirme faaliyetleri, eğitim sisteminin kontrol öğesinin işlerliği nin sağlanabil• mesi için yapılması zorunlu ola n etkinliklerdir. Ölçme ve değerlendirme etkinlikleriyle, eğiti m sistemin aksayan yanlarının (eğer varsa) tespiti ve daha sonra da iyileştirilmesi söz konusu olabilir. Öğrencilerin başarılarını değer• lendirmek amacıyla yapıla n sınavl ardan elde edilen ölçümler; öğrenci başarıs ı nı yansıtmak la birlikte, öğretim i n verimliliğine ve etkililiğine yönelik bilgiler de sağlar. Bir derste eğer öğrenciler, istendik davran ışları yeterli d üzeyde kazanamam ışlarsa; bunun olası sebepleri araştırılmal ıdır. Öğrencilerin söz konusu davranışları neden kazanamadıkları araştırılmalı ve b u araştırma bulguları çerçevesinde eğitim sisteminde gerekli iyileş ­ tirme çalışmaları yapılmalıdır. Eğitim sisteminin verimliliğinin arttırılabilmesinde yukarıda belirtilen sorunları n önemli bir k ı sm ı , bir bilim dalı olarak eğitim bilimleri içinde yerini almış olan. öğretimde p rogram geliştirme sürecidir. Program l arın belli bir sistematik ve bilimsel yolla hazırla n ması ve sürekli o larak g üncelleştiril ­ mesi eğitim sisteminin önemli unsurlarındandır. Bu nedenle, aşağıda program geliştirme sürecinde ölçme ve değerl end irmenin işlevi kısaca açıklan­

Öğretim Programının Öğeleri Bir dersin öğretimi için dersle ilgili olarak MEB Talim ve Terbiye kurulunca oluşturulan komisyonlar her ders için öğretim programı hazırlayıp web sayfalarında yayınlarlar. 2021 -2022 öğretim yılı için web sayfasının linki aşağ ıdaki şekilde sun ulmuştur:

ÖÖRETIM PROGRAMLARI

--

otı-__._ ....... ~--""'1,-•-·· - -

1

--

m ıştır.

-- ,,

~ • SonilH• Sonıl•r

••

http://mufredat.meb.qov.tr/Programlar.aspx (27.10.2021)

26

27

·-·> ·-

o.

Eğiliııulc Ölçme ı•c De{,erlettdinttenitt )'eri ı•e Ötıemi 17

l8

ihlal etmemeli ve hedef davranışlara göre dü.zenlenmelidir. içerikte, öğ­ retilecek kavraml arın sayısı ve karmaşıklığı da öğrencinin seviyesine göre deği şmelidir. Alt eğitim kademelerinde daha az sayıda ve daha kolay, somut kavramlar hedef alınmalı . Öğrenciler hazırbulunuşluk düzeyine göre yeni bilgiyi alır ve öğrenir. içerik sunulurken gerek zortuk-kolaylık, gerekse kullan ıl a n anlat ı m dili aç ı sın dan öğrencilerin düzeyine uygun olmalı dır. Eğe r bazı önkoşul davran ışlar. öğrencileri n genelinde yoksa veya yetersiz düzeyde ise bu önkoşul davra nışların öğrencilere kazandırıl ması da düşü­ nülmelidir. içeriğin düzenlenmesindeki önemli noktalardan biri de, içerik öğrencide düşünme yeteneği geliştirmeye uygun bir yapıda düzenlenmelidir.

Hazırlanan öğretim programı veya öğre tmenlerin hazırl ayacakları ünitelendirilmiş yıllık plan veya günlük planlar 4 temel kısı mdan ol uşur:

1) Hedefler ve

davra nışlar

2) içeriğin düzenlenmesi 3) Öğrenme - öğretme aktiviteleri

4) Ölçme ve değerlendirme Hazırtanan

bir öğretim

Ö[;retiııule Ölçme ~·e Dt.'ğcrlc,,dimıe

plan ında,

(ister yı llık ister günlük plan olsun) bir gereken bu öğeler mutlaka yer al mal ıdır. Öğretim programının bu 4 öğesi, yıllık planlarda daha yüzeysel ve günlük planlarda ise daha detaylı olarak yer a lır. Aşağı da bu öğeler kısaca açık­

öğretim program ında bu l unması

l anmaktadır.

1) Hedefler ve Ders

3) Öğrenme - Öğretme Aktiviteleri

Davranış l ar

Öğrenme-öğretme aktiviteleri, yani sistemin süreç öğesi, eğitim siste-minin verimli işlemesi açısından en önemli öğedir. Öğrenme-öğretme aktiviteleri, sistemin süreç öğesi ndeki etkinliklerin neler olacağın ı ifade eder. Öğrenme-öğretme aktivitelerinin temel amacı , istendik hedef ve davranış• l arı n öğren cilere kazand ırıl mas ı d ır . Bu nedenle, öğreti m etkinlikleri planlanırken dersin hedeflerinin dikkate alın ması en önemli husustur. Dersin beli~enen hedeflerinin gerçekleştiril ebilmesi için öğrencilerin hazırbulunuşluk düzeyleri ve d i ğer öğreti m koşull arı da dikkate alı narak öğretim etkinlikleri planlanmalıdır. Öğretimde uygun yöntem ve tekniklerin kullanılması, öğre­ timi kolaylaştıracak araç ve gereçlerin kull anılması bu süreci verimli k ılar . An l aşılacağı üzere. öğrenme-öğretme aktiviteleri, belirtenen hedef davranışların kazandırılmas ı için yapıl an etkinliklerin tümüdür. Sistemin süreç aşamas ında , hedef davra nı şl arı öğ rencile re kazandırmak için gerekli uyarıc ıların düzenlenip uygulamaya konu l mas ı önemlidir. Eğ itim durum ları düzenlenirken; öğrenci yi hedeflen haberdar etme (gözden geçinne), dikkat çekme. güdüleme, pekiştireç, ipucu, dönüt (geribildirim) ve düzeltme gibi dersin işl enişin de verimlil iği arttıran etkinlikler kullanılmalıd ır.

program ını

lere kazandırılmak

belirteyen önemli öğel erden biri, ilgili derste öğrenci ­ istenen niteliklerin bir listesi olan hedef ve davran ı şlar­

dır.

Hedef: Öğrencilere kazandınlması planlanan niteliklerdir. Ertürk (1982: 25) hedefi: "Bir öğre ncin in, planlanmış ve tertiplenmiş yaşantılar sayesinde kazanmas ı kararlaştırılan ve davranış değişi kliği veya davranı ş olarak ifade edilmeye elverişli olan bir özelik. olarak tanımlamaktadır. Öğrencilere kazand ırıl ması planlanan nitelikler, bi lişsel . du yuşsal ve psikomotor alanlar1a ilgili özellikleri içerir. 2) içeriğin Düzenlenmesi Ders içeriğini n ; ✓

hedeflere uygunluk,



öğrenilebil i rtik,

✓ ✓ ✓ ✓ ✓

öğrenci ilgisini çekme, öğrencinin öz-yetertik düzeyi, otantikl ik-doğruluk, yarartılık ve

4) Ölçme ve Değerlendirme Haz ırtanan bir programda önce program ın hedefleri (kazanımlar) belirtenir. Sonra programın hedeflerine uygun o lacak şekild e içerik düzenlenir. Öğrenme öğretme etkinlikleri de içeriğe (dolayısıyla hedeflere) uygun olmalıdır. Ölçme değerlendinne etkinlikleri de mutlaka öğretim etkinliklerine (dola yı sıyla içerik ve hedeflere) uygun olmak zorundad ır .

uygulanabilirtik

bakımından uygun olması gerekmektedir (Omstein & Hunkins, 2016). Bir d ersin içeriğinin düzenlenmesiyle anlatılmak istenen; hedef davranışları kazandıracak biçimde ünite ve konuların düzenlenmesidir. Bir dersin içeriği aşamalılık i lkesine uygun olarak düzenlenmelidir. Yani , içerik; hedef da vranışlarta tutartı, öğ rencinin hazırbulunuşluk düzeyine uygun, somuttan-soyuta. basitten-ka rmaşığa, kolaydan zora, birbirinin önkoşulu ve bilinenden bilinmeyene şeklinde düzenlenmelidir. içerik, aşamalılık ilkesini

Öğretmenler, uyguladıkları bir programın ne derece etkili olduğunu bilmelidir1er ki, sorumlusu oldukl arı dersi veya kursu i yileştirebilsinler ve o ders veya kursla ilgili olarak daha isabetli karartar verebilsinler. Uygulanan

28

29

·-·> ·-

o.

Eğiliııule Ölçme ı•c De{,erlettdinttenitt )'eri ı•e Ötıemi 19

20

Şekil 1.2'de çok net olarak görüldüğü gibi, ölçme ve değerlendirme etkinlikleri olmaksızın programın revize edilmesi ve program geliştir­ mede süreklilik ilkesinin sağlanması düşünülemez.

programla ilgili olarak elde edilen ölçümler nitel ve nicel olarak analiz edilerek programın güçlü özellikleri, zayıf olan özellikleri ve gelişimsel ihtiyacı olan alanları belirlenir. Ölçme ve değertendirme yapmadan programın gelişimine yönelik uygulamalar profesyonelce yapılamaz. Anlaşılacağ ı üzere ölçme ve değertendinne öğretim programlannın önemli ve vazgeçilemez bir öğesidir. Hem yıllık hem de günlük ders pl anlarında ölçme ve değerlend irme etkinlikleri mutlaka yer almaktadır. Ölçme ve değerlendirme etkinlikleri, öğ­ rencilere kazandırılması planlanan hedeflerin kazan ıl ma düzeylerinin tespiti ve varsa aksaklıklann belirlenmesine yönelik aktiviteleri içerir: ✓ Ölçme ve değerlendirme işlemleri öncelikle sistemin giriş öğesin­ deki özelliklerin uygun l uğun un belirtenmesi amacı ile yapılmalı­

Progrıı m ın H.ı:url ;ınmıısı

Revizyon

dır. ✓

Sonraki

aşa mada öğretim

sürecinin yani

öğretim

Ö[;retiııule Ölçme ~·e Dt.'ğcrlc,,dimıe

(Cürw:el l tşti nne,

Oe&eı1endirme

Düze.itme)

etkinliklerinin

verimliliğin i belirlemeye yönelik ölçme ve değerlendirme etkinliklerinde bulunulmal ıdır.

✓ Öğretim sürecinin bitiminde elde edilen öğrenme ürünlerinin ye-

Uygu hı.m;J

ter1 iği ne

yönelik ölçme ve değerl endirme faaliyetleri yapı l malıdır , ✓ Tabii ki ö lçme ve değer1endirme etkinliklerin doğru şeki lde yapı lıp yap ılmadı ğı da değerlendiril melidi r. Ölçme ve değertendirme etkinlileri sonucunda sistemin çıktısı olan üıün­ ler yetersiz düzeyde ise, bu yetersizliklerin gerekçeleri tespit edilip düzeltilmelidir. Söz konusu yetersizlik gerekçeleri belirtenirken, lüm suçu tek bir kaynağa bağlama gibi amatörce bir hataya düşülmemelidir. Sistemin her bir öğesinin biıbirteriyle etkileşi m içinde olduğu ve yetersizlik kaynağı olarak sistemin tüm öğeleri nin bir bütün olarak ele al ınması gerekliği gözden kaçı­ rılmamalıdır. Oerşte işlenen konuların öğrenilme düzeyteri, programın etkilil iği , öğ rencil erde oluşan bilişsel ve duyuşsal gelişmele rin değerte ndirilmesi eğitim sisteminin geliştirilmesi için çok önemlidir.

Program Geliştirme Sürecinde Süreklilik ilkesi Ölçme ve Değerlendirmenin Yeri ve Önemi

Şekil

1-2: Program

Geliştirme Sürecinde Süreklilik

Şek il 1-2'den anlaşılacağ ı üzere, program geliştirme sürecinde öncelikle, arzulanan içerik ve hedefler doğrultu sunda, öğrenme.-öğretme ve değerfendirme etkinliklerinin neler olacağını aynntılı bir şekilde belirten bir plan hazırlanır. Sonraki aşamada ilk hazırlanan program uygulanmadan ö nce, programın uygulanacağı grup veya program uygulayıcıları ve diğer uzmanlardan faydalanarak bir revizyona (düzeltmeye) tabii tutulur. Revize ed ilmiş program uygulanır. Uygulama esnasında da değerlendirme etkinlikleri yapılarak gerek görülürse tekrar programda bir revizyon yapılabilir. Program uygul andıktan sonra da yine elde edilen ölçme sonu çlarından faydalanarak programın eksik ve yetersiz yönleri tespit edilip tekrar bir revizyon yapılır. Şekil 1-2'de görüldüğü g ibi revize edil miş programın uygul anması, uygulanan p rogramın değerlendiril mesi , değe rlend iril en programın tekrar uygulanması döngüsü sürekli olarak devam etmektedir. Anlaşı­ l acağı üzere program geli şti rmede süreklilik ilkesinin sağ lanması için ö lçme ve değerl endi rm e kilit rol oynamaktadır.

Açısından

Öğretim programının öğeleri dikkate alınarak bir öğretim programı hazırlad ıktan

sonra, bu hazırlanan progra mın sürekli olarak revize edilmesi gerekmektedir. Yani. hazırlana n programlar esnek ve güncellenebilir ol malıdır . Konu alan ı ile ilgili bilgiler sürekli olarak artmaktadır. Hem konu alanlarıyla ilgili hem de öğrenme psikolojisi ile ilgili bilimsel gelişmeler süreklilik arz etmektedir. Bütün bu bilimsel gelişmelere ek olarak, öğrencil er ve öğrencilerin etkileşimde bulunduğu sosyo-ekonomik ve teknolojik yapının da y ıl dan yıl a değişimi söz konusudur. Hiçbir değ işiklik yapmadan yıll arca aynı progra mın uygulan ma sı düşünül emez . Aşağıda (güncell eştiril mesi )

31

30

·-·> ·-

o.

Eğiliııule Ölçme ı•c De{,erlettdinttenitt )'eri ı•e Ötıemi 21

22

Ö[;retiııule Ölçme ~·e Dt.'ğerlc,,dimıe

Öğretmenlerin Ölçme ve Değerlendinmeyle İlgili Temel Becerileri

Ölçme Teorisin i Bilmenin önemi

Kazanmasının Önemi

Büyük ihtimalle, okullarım ızda teori ile uygulama arasında en çok farölçme ve değerlendirmed i r. Oku llarım ı zda ölçme ile ilgili bazı etkinlikler yapılmas ı na rağmen ölçmenin temeli, önemi, işlevi ve faydal arı yeterince an laşılmamıştır. Bazı durumlarda ölçme ve değerl endi rme mecburiyet gereği veya bir formalitenin yerine getirilmesi olarak görülmektedir. öğretmenlerimiz meslekleri boyunca birçok sınav yapmaları veya hazırlanmış olan sınavları kullanmalarına rağmen ölçme ve değerlendirmeyl e ilgili olarak çok az ders veya kurs alm ı ş durumdalar. Bir öğrencinin belli bir dersteki başarısını ölçecek. elde edeceği ölçümleri belirti ölçül veya ölçütlerle kıyaslayarak öğrencinin başarısı hakkında bir yarg ıya varacak bir öğretmen in ölçme teorisiyle ilgili olarak bazı bilgi ve becerileri kazanması önemlidir. Aksi halde anl amsız ve yanlış değerlen­ dirmeler yapılabilir. Örneğin Hopa'daki bir lisede matematik sınavından 100 üzerinden 50 puan alan bir öğrencinin matematik başarısı ile Ankara Fen Lisesinde farklı bir sınavın uygulandığı matematik sınavından 100 üzerinden 50 puan alan bir öğrencinin matematik başarısını aynı olarak yorumlanabilir. Yine, 100 üzerinden yapılan bir lngilizce sınavından 90 puan alan bir öğ rencinin. aynı sınavdan 30 puan alan bir öğrenciden 3 kat daha iyi lngilizce bildiği gibi yanlış yorumlar yapılabilir. Öğrenci başarıla­ rıyl a ilgili olarak, bu ve benzeri yanlış ve anlamsız yorumlarda bulunmamak için ölçme teorisi hakkında temel bilgilere sahip olmak gerekir. 3 litre benzin mi daha çoktur? Yoksa 2 galon benzin mi? Sorusunu cevaplarken ölçümleri ayn ı birime çevirmeden 3 litre benzin çoktur gibi bir yargıya varırsak, hata yapmış oluruz. Birimlerin farklı olduğu durumlarda 2 m i ktarı (faı1 ·-

o.

Eğiliııulc Ölçme ı•c De{,erlettdinttenitt )'eri ı•e Ötıemi 23





Ö[;retiımle Ölçme ~·e Dt.'ğcrlc,,dimıe

24

ÜN İTE SORULAR!

sınav süresinin etkili kullanı mını ve dikkat toplamayı gerektiren sınavlarda gözetmenlerin salonda sohbet etmeme, müzik d inlememe, çay içmeme gibi kurallara neden gerek duyulduğu ,

1. Bir dersin öğretimini, önceden planlamanın sağlayacağı faydaları açı k l ayını z .

defter kitap açık olarak yap ıl a n sınavlarda neden sadece bilgi düzeyinde

2. Eğitim sisteminin girdi öğelerinden "öğrenci" özelliklerinin. sistemin işleyişi ne etkisini kı saca açıklayınız.

soruların soru lmaması gerektiği.

3.

ÖZ.ET

Eğitim sisteminin değerlendirme öğesinin işlevi ni kısaca aç ıklayı­ n ı z.

Eğitim

etkinliklerinin sistematik ve plan lı bir şeki lde yerine getirilmesi eği ­ timde sistem yaklaşım ının benimsenmesini sağlamıştır. Eğ itim sisteminin amaçla rı na ulaşabi lme d üzeyinin artt ırılması için sistemi oluştu ran tüm öğe­ lerin kontrol edilmesi ve iyi leşti ril mesi gerekmektedir. Eğiti m e bir sistem yaklaş ı mıyla bakıldığ ında , her sistem g ibi eğ iti m sistemi de: girdi, süreç, çıktı ve değerl endinme(kontrol ) öğe lerinden oluşmaktadır. Bu öğe l erin herhangi birindeki değişiklik , eksiklik, yanlış işleyiş sistemin çalı şmasını ve elde edilecek ürünün niteliğin i etkiler. Çünkü sistemin tüm öğel e ri nin işl e­ yi şi nin bir sonucu olarak bireylere istendik davranışlar belli ölçüde kazan-

4. Eğitim sisteminin süreç öğesi nde "yönetim etkisini" k ısaca açıkla ­ yın ı z .

5.

Eğ itimde program geli ştirme sürecinde, süreklilik ne a nlama gelmektedir? K ı saca açıklayını z .

6 . Bir dersin işle nmesiyle ilgili öğrenme-öğretme aktivitelerinin neler olabileceğini örnek vererek açıklayını z.

7. Bir dersin işlenmesi aşamasında ve dönem sonunda dersle ilgili yapılabilecek ölçme ve değerlendirme etkinliklerinin neler olabile-

dırılabi lmektedi r.

ceğin i kısaca açıklay ınız.

Konu alanlarıyla ve öğrenme psikolojisi ile ilgili bilimsel gelişmelerin süreklilik arz etmesi, bu bilimsel geli şmelere ek olarak, öğ rencilerin ve öğ• rencilerin etkileşimde bulunduğu sosyo-ekonomik ve teknolojik yapının da yıldan yıla değişimi programl arın sürekli olarak geliştiri lmesin i zorunlu kı­ lar. Program geliştirme sürecinde, hazırlanan programların gerek uygulama aşamasın da gerekse uygulamadan sonra elde edilen ölçme sonuç-larından faydalanarak program ın eksik ve yetersiz yönleri tespit edilir. Bu tespitler ışı ğ ında mevcu t programda gerekli görülen düzeltmeler yapıl ır. Bu süreç bir döngü şeklindedir. Bir öğ reti m program ı, temelde dört öğede n oluşur; (1) hedefler ve davranış lar, (2) içeriğin düzenlenmesi, (3) öğrenme - öğretme aktiviteleri ve (4) ölçme ve değerlendirme. Öğretim programının öğeleri dikkate alınarak bir öğretim program ı hazırladıktan sonra, bu ha• zırlanan programın sürekli olarak revize edilmesi (güncelleştirilmesi ) gerekmektedir. Hiçbir değiş iklik yapmadan yıll arca ayn ı prog ramın uygulanması düşünülemez. Ölçme ve değerlendirme etkinlikleri olmadan da program ın revize edilmesi düşü nü l emez. Öğrencinin başarısı hakkında bir yargıya (değerlendirmeye) varacak bir öğretmenin ölçme teorisiyle ilgili olarak bazı bilgi ve becerileri kazanması ö nemlidir. Aksi halde anlamsız ve yan lı ş değe rlendirmeler yapabilir.

34

35

·-·> ·-

o.

Eğiliııule Ölçme ı•c De{,erlettdinttenitt )'eri ı•e Ötıemi 2S

SINIF-İÇİ UYGULAMA- 1

Elinizdeki kitabın veya yan ını zda bulunan herhangi bir ders kitabının içeriğinden faydalanarak, 14 hafta sürecek ve haftada 2 saatlik bir dersin öğretimine yönelik olarak, (amatörce de olsa) bir taslak ders öğretim pl an ı hazırlayınız. '

Bu ders öğretim

planında ,

1

dersin hedeflerini",

"dersin

içeriğ i ni",

1

' öğre nme-öğretme sürecini" ve

"ölçme ve etkinliklerini

değerlendirme•

planlayınız.

SINIF-İÇİ UYGULAMA- 2 Branşınızla

ilgili olarak aç ılacak seçmeli bir dersi okutmak üzere gö-

revlendirildiğinizi düşünün. Oğrenciler önceki yıllarda bu dersin ön koşulu olan 2 dersi almışlardır. Bu derse öğrenci seçimi dahil (derse müracaat eden 500 öğrenciden 20 tanesini seçmeniz gerekiyor) hangi amaçla (eğitim sisteminin tüm öğelerin i dikkate alarak) ne tür ölçme ve değerlendinne etkinlikleri (bilişse l, duyuşsal veya psiko-motor) yapabileceğinizi açı klayınız.

NOT: Açıklamalarınızı yaparl ·-

o.

Öğrt:ıimde Ölçme ,·e D.,ğerlemlirme

28

- - - - - - - - - - - - ' / ÜNiTE 2

Sözünü eııiffeııiı şeyi ölçebilirorsamı ı•e bun/an omm luıkkııulll bir şeyler biliyorsımıız demektir. Ltml Ke{ıriıı rııkamlllrla ıııılaıabiliycT$1ımz,

ÖĞRETİMDE ÖLÇME VE DEĞERLENDİRMEYLE İLGİLİ TEMEL KAVRAMLAR

ÖLÇME VE KAVRAMLAR

ÖLÇME VE DE~ERLENDIRME iLE iLGiLi TEMEL KAVRAMLAR

Değerlendirme

Eğitimdeki Ölçmelerde Karşılaşılan Temel Güçlükler Ölçülen Değişkenin Yapısından Kaynaklanan Güçlükler

Ölçme Örnekleminden Kaynaklanan Güçlükler Ölçme Türteri Temel Ölçme Dolaylı Ölçme (göstergeyle ölçme ve türetilmiş ölçme) Ölçme Sonuçlarının ifade Edilmesi Ölçmede Birim (Doğal Birim, Tanımlanmış Birim) Birimlerde Bulunması istenen özellikler Birimlerin Eşitliği Birimlerin Gen elliği Birimlerin Kullanıl ı ş Amacına Uygun luğu Ölçmede Sıfır Noktası

TEMEL

Öğretmenlerin, öğretimin etkililiğini arttırmaya yönelik yapacakları bil işsel amaçlı

ölçme ve değerl endi rme etkinlikleri: öğren ci hazırbu lu nuşl uk düzeyinin belirtenmesi, öğrenme güçlüklerinin ve eksikliklerinin belirlenmesi, öğrenme başarısının belirlenmesi gibi e tkinlikleri içerir. Öğretmenle­ rin öğ rencile r h akk ın da baz ı kararlar vermelerine yönelik ölçme ve değer­ lendirme etkinlikleri ise; öğrencil eri bir programa kabul etme, bir üst sınıfa geçirme veya bir programdan mezun etme gibi etkinlikleri içerir. Bir derste, öğrencilerin başarılarını ölçmek için bir öğretmenin yapacağ ı işl erden bazıları aşağ ıd a sunulmuştur.

Doğa l Sıfır

1.

Tan ı ml anm ı ş S ıfır Sınıflama (Adla nd ı rma)

İLGİLİ

Ölçme ve değertendirme verilecek birçok eğitim karartan için bilgi sağ­ lar. Öğrencilerin bir derse yönelik başarıları hakkında bilgi toplama söz konusu olduğunda öğrenci lerin öğrenme ve gelişme düzeylerinin ölçülmesine odaklanılır. Uygulanan bir programın eksik ve yetersiz yanlarının be• lirlenmesinde, öğretim in i yileştirilmesinde ve program geliştirme sürecinde ölçme ve değertendi rme etkinlikleri çok ciddi bir bilgi sağlama ve yönlendirme işlevi görür. Öğrencilerin başarılarını değerlendirecek olan öğretmen• lerin ölçme teorisiyle ilgili olarak bazı temel kavramları anlamış olması, ölçmenin öğretimdeki öneminin ka vranmasında ve ya pılaca k değerl end irmele­ rin d oğrul uğunun sağl anmasında önem taşımaktadır.

Ölçme Kuralı Ölçme Ölçüm Ölçüt

Ölçmede Ölçekler

DEĞERLENDİRMEYLE

Dersin hedef davranış larını belirleme.

2. Belirlenen hedef davran ışlardan kritik olan l arın ı tüm temsil g ücü yüksek olacak bir şeki lde seçme.

.. Olçekleri

Sıralama Ölçekleri

3.

Eşit Aralıklı Ölçekler

Kull an ılacak sın av

davran ışları

türünü seçme.

4. Seçilen kritik davranışları ölçecek sorular yazma veya soru ban• kasındaki mevcut sorular arasından seçim yapma. 5. Yaz ılan veya seçilen soru ları uygun bir formatta test formu haline getirme.

Eşit Oranlı Ölçekler

ÖZET ÜNiTE SORULAR! SINIF-IÇİ UYGULAMA

6.

Hazırlanan sına vı

7.

Sın av kağıtlarını puanlama.

uygulama.

39

38

·-·> ·-

lipmimde Ölçme ,·e Dejjerlı:mUrmt)'lt! İlgili Temı:I Kı,vrcımlar

Ölçme Kuralı

Öğretmenlerin yukarıdaki işlemleri tüm sınav1ar için yapmaları söz konusudur. öğretmenler sadece öğrencilerin belli bir konu veya dersteki başarıl arını nicelemekle kalmazlar. Elde ettikleri ölçümlerden faydalanarak öğrencilerin başarıları hakkında "başarılı-başarısıi', "pekiyi- iyi- orla- geçer- zayıf' gibi bazı değerlendirmel erde de bulunurtar. Nihayetinde öğret­ men ölçümlerden faydalanarak öğrencilerin dönem sonu başarı puanları gibi bir genel başarı puanı hesaplar. Bu genel başarı puanın a bakıp öğ­ renciler hakkında nasıl karar vereceği kendisine önceden sunulmuş olunan (aşağıda örnek olarak verildiği gibi) ölçüt veya ölçütlerden faydalanarak yapı lır.

Başarılı

iiproıimde Ölçme ,·e D.,ğcrlemlirme

30

29

Ölçme işlemleri belirti kurallar doğrultusunda yapılır. Uzunluk ölçmede hangi miktardaki uzunluğa "1.00 metre" den i leceğ i nin belirtenmesi, aynı zamanda ölçme işi nin nasıl yapılacağ ın ın belirtenmesine bir örnek olur. An l aşılacağı üzere ölçme kuralı; ölçme i şi ni yaparken niteliğin hangi miktarına ne değer (başarı ölçmede puan) verileceğini belirtir. örneğin, yazılı yoklama yapan bir öğretmenin "3. soruya tam cevap verenlerin o sorudan alacakları puan 10'dur" demekle yaptı ğ ı iş, o soruyu eksiksiz (doğru) cevaplayanlara kaç puan verileceğ ine dair bir ölçme kuralı nı belirtemesidir. Sınavl arın puanlanması için h azırl anan cevap anahtarı da ölçme kurallarına örnektir. Ölçme kuralı, ölçme yapabilmek için konulan kurallardır.

olma için ölçüt örneği:

"dönem sonu başarı ortalaması 45 ve üstü olanlar başarılı sayılır", "akademik yıl içerisinde 10 günden fazla devamsızlık yapan başarı­

Ölçme Kuralına Örnekler: ►

s ı z sayılır:

Yazılan bir kompozisyonun puanlanmasında, başlığa 5 puan, gi riş bölümüne 1O puan, geliştirme bölümüne 35 puan, sonuç bölümüne 15 puan, sayfa düzenine 10 puan ve noktalama işa­

retlerine 25 puan

Bir bilim dalıyfa ilgili temel kavraml arın doğru öğrenilmesi, o bilim dilini daha doğru kullanmayı ve a nlamayı sağlar. Bilim dalıyla ilgili temel terim ve kavramlar tam olarak öğrenildiğinde , üst düzeyde bilimsel açıklama ­ larda ve tartışmalarda iletişim kolaylığı sağlanır. Kavramlara yüklenen anlamlarda anlam birfiği sağlandığında o bilim dalını öğrenme daha hızlı ve doğru olur. Kavramların doğru anlaşılması ve kullanımı tüm bilim dall arının öğrenilmesinde çok önemlidir. Ölçme ve değertendinne ile ilgili konuların daha net bir şekilde anlaşıl­ masını kolayl aştınnak için bazı temel kavramlar detaylı olarak aşağ ı da



Sınava

verileceğinin

girmeyenlere

sıfır

puan

belirlenmesi. verileceğinin

belirlenmesi.

Ölçme Ölçme, ölçülen niteliklerin aralarındaki ilişkileri (büyüklük küçüklük gibi) koruyacak şekilde bu niteliklere sayı, s ıfat veya sembollerin atanmas ı iş lemleri olarak tanımlanabil ir. Bir öğrencinin boy uzunluğun u ölçmek için metre kullanarak öğrencin in boy uzunluğun u sayı ile ifade edene kadar yapıl anlar ölçmeye örnek olur. Yani "Nifay'ın boyu 1.8 metredir" veya "NiJay'ın tansiyonu 120 ye BO'dir" sonuçlarına ulaşana kadar yaptığımız /§.: ~ ölçme olarak adlandırılır. Öğrencilerin boy uzunlukları ölçülüyorsa, boyu uzun bir öğrenciye a tanan bir sayı , boyu kısa bir öğrenciye atanan bir sayıdan daha büyük olmalıdır. Benzer bir şekilde belirti bir ölçme hatası olsa bile az lngilizce bilen bir öğrenciyle, çok iyi lngilizce bilen bir öğrenciye atayacağımız lngilizce başarı puanları aynı olmamalı. çok iyi lngilizce bilenin puanı daha fazla olma lıdır.

açıklanm ı ştır.

Linn ve Gronlund'a (1995) göre ölçme · ne kadar?' sorusunu cevaplamaktadır. Özgüven (1994) ölçmeyi herhangi bir çoklukta belirli bir birimden

kaç iane olduğunu saptama süreci olarak tan ı ml amaktadır. Çok basit olarak ölçme, nitelikleri niceleştirme işlemidir. Bu tanım dikkate alındığında ölçme işlemi üç aşamayı içermektedir.

40

41

·-·> ·-

o.

lipmimde Ölfmt! ,·e Dejjerlı:mUrmt)'lt! İlgili Temı:I Kı,vrcımlar

31

iiproıimde Ölrmc ,·e D.,ğcrlemlirme

32

Ölçme işleminin Aşamaları

Ölçme Kavramına Örnekler:

(a) Ölçülmek istenen niteliklerin ne olduğunun tespit edilmesi (niteliklerin belirlenmesi).



Bir insanın tansiyonunun belirtenmesi işlemleri



Bir dakikada okunan kelime



Bir öğrencinin zeka düzeyinin belirlenmesi işlemleri.



Öğrenci cevaplarının puanlanması işlemleri.



Öğrencileri boy sırasına göre dizmek.



lngilizcede öğrencilerin yazdıkları bir metindeki yazım hatalarını (sayarak\ belirlemek.



Bir çocuğun bir haftada kaç saat televizyon izlediğinin belirten-

(b) Ölçüleoek niteliklerin hangi sayı veya sembollerte ifade edileoeğine karar verilmesi (niceliklerin belirtenmesi). (c) Belirli kurallara göre niteliklerle nicelikleri eşleştinne işlem inin yapılması (eşleştirmeni n yapılmas ı). Başa rı

ölçmede sonu çları belirtirken sıfat veya sembollerden ziyade Bir öğrencini n bir dersteki başa rısını 50 puan gibi nicel olarak ifade etmeden önce yap ıl ması gereken temel işlemle r aşağ ıd a vesayıl arı ku llan ı rız . rilm işti r:

✓ ✓

Ölçülecek niteliklerin (davranışların) seçimi Bu nitelikleri ölçeoek soruların yaz ılı p bir ölçme aracının

hazırlan -

mas ı



Bu ölçme a rac ın ı n

uyg ulanması



Öğrenci cevaplarını n puanlaması

ve

Anlaşılacağı

üzere . ölçme yapmak için öncelikle ölçmeyi ama çlad ı ğım ı z ne olduğu nu deta ylı bir şek ilde belirtememiz gerekmektedir. Başarı ölçmede bu iş dersin hedef davranışlarının net olarak belirlenmesi yoluyla yapıl ır. Tutum, zeka gibi değişkenl er öl çüleceği zaman tutum veya zekanın ne tür dav ranışları içerd iğ i ne yönelik teorik anlamda içerik analizinin yap ı lmas ı gerekir. Başarı ölçmede, genellikle ölçme sonuçları say ı sal olarak ifade ed il eceğ inden . ölçme sonu çlarının hangi ölçeklerte ifade edileceğinin de belirlenmesi gerekir. Ölçme işleminin son aşamasında, ölçme ku rallarına uygun olarak ölçme işlemlerini n uygulanmas ıyl a ölçme tamamlanm ış olunur. Yani, nitelikler niceliklerle eşleşti ri lm iş olunur. değ i şkeni n

sayısının

belirlenmesi istemleri .

mest işl em leri

Ölçüm Ölçüm, ölçme sonucudur. Başka bir deyişle, öl çme işlemi sonucunda elde edilen sayı, sıfat veya semboldür. Bir öğren ci nin yap ılan bir sınavda n almış olduğu puan, bir ölçümü ifade etmektedir. K ısacası , ölçme i şlemi bittikten sonra elde edilen nicelik veya sonuç ölçümdür.

Ölçme için ölçme kurallarından faydalanılır ve ölçme işlemleri bittikten sonra ölçüm elde edlllr. Ölçüt Ölçüt bize ölçümlerimizle ilgili olarak değerlendinneyi neye göre yapacağı mızı belirtir. Oeğerlendinne yaparken ölçümlerin başarılı veya başarı­ sız sayılabilecek bir performansı ifade etme durumunu ölçütlerden fayda•

!anarak belirleriz. Ölçütler değertendinne yapmada kullanılacak kurallar olarak al gılanabilir. Anlaşılacağı üzere ölçüt: ölçümler hakkında bir karara varırken kullanı l an kriterlerdir.

42

43

·-·> ·-

o.

lipmimde Ölf mt! ,·e Dejjerlı:mUrmt)'lt! İlgili Temı:I Kı,vrcımlar

Ölçüt Kavramına Örnekler: ►

iiproıimde Ölrmc ,·e D.,ğcrlemlirme

34

33

Soru:

Yapılan

bir değer lendirmenin doğruluğu nelere

bağlıd ır?

Bir öğrenci nin başarılı sayılabilmesi için istendik davranışların '¼50'sini kazanmış ol mas ı ve %30'dan fazla de vamsızlık etmemiş ol mas ı .



Başa rı ortalaması

100 üzerinden en az 45 ol anl arın

başarı lı

sa-

Yapılan bir değerlendirmenin uygunluğu hem ölçümlerin gerçeği yansıtma düzeyine (doğruluğuna) hem de ölçüt veya ölçütlerin u ygu nluğuna b ağlıd ır. Gerçeği yansıtmayan, fazla miktarda hata içeren ölçme sonuçlarından faydalanarak yapılan bir değerlendirme hatalı olur. Benzer şekilde, ölçüt veya ölçütlerin çok yanlı ş olarak belirlenmesi sonucu yapılan bir değerlendirme. yani verilen karar da hatalı olur.

yılmas ı. ►

18 futbol takımıyla oynanan Türkiye Süper liginde. sezon sonunda 15. sıranın altındaki takıml arın küme düşecek ol ması .



Açlık

kan şekeri 110'un üstünde olanların şeker hastası sayıl­

ması .

Ölçme kuralı. ölçme, ölçüm, ölçüt ve değerlendirme kavramları arasın­ daki ili şki aşağıdaki şekilde özetl en miş ti r.

D eğerlendi rme

Bu kıs ı mda değerlen dirme öğren ci başarıs ının değerlendiril mesi olarak ele alınmıştır. Değerlendirme: öğrenci başarısı h akkında bir yargıda bulu n maktır. Daha da teknik olarak: değerlendirme, ölçümlerin ölçüt veya ölçütlerle kıyaslanarak bir karara varma işidir. Geçme pua nı 50 ölçütüne göre; geçme puanı 40 olan bir öğren ci nin "başarısız", 60 olan bir öğrencin in "başarılı • olarak değeı1endiril mes i nde "başarılı" veya "başarı ­ sız" yargısı bir değerlendirmedir. insanların kilo ve boy ölçümlerinden faydalanarak vücut kitle indeksinin hesapla n mas ı ve vücut kitle indeksinin yoru m l anması için belirl enmiş olunan baz ı ölçütlerden faydalanarak, insanlara zayı f veya obez denmesi de bir karar verme yani değeı1endirmedi r. Farklı

Ölçme Kuralı

Şeki l

Ölçüt

Değerlendirme

40

50 90

Başarıs ı z

Ölçüm < Ölçüt

Başarıs ı z

Ölçüm < Ölçüt

70

Başarısız

Ölçüm < Ölçüt

30 50

Başarılı

Ölçüm 2 Ölçüt

Başarılı

Ölçüm 2 Ölçüt

80 60 40 60

Yukarıdaki

örneklerden de

anlaş ıl acağı

gibi

Gerekçe

değerl endi rme

a~+ ·o

c::> Değerlendirme

iŞLEMLER

ölçüm ve ölçütlere göre değe r lendirme örnekleri

Ölçüm

-+ Ölçme -+ Ölçüm; Ölçüt

2-1:

içme ve değerl endi rme

kavram l arı arası ndaki ili şki ler

Şekil 2-1 'den de anl aş ıl acağı üzere, ölçme işl em i nin yapılabil mesi için ölçme kuralları konur. Ölçme kuralları uygulanıp ölçme işlemi tamamlanınca ölçümler elde edilir. Ölçümler de bazı ölçütlerle kıyaslanarak değer­ lendirme yapılır.

Soru: Ölçme kuralı ile ölçüt arasındaki temel fark nedir? Ölçme kuralları ölçme işleminin; ölçütler ise değerlendirmenin yapıl­ için gereklidir.

ması

ölçme so-

nuçları ve ölçütlerden faydalanılarak yapılmaktadır. Ölçüt veya ölçütleri sağlaya n

ölçümlere sahip bireyler başarılı olarak değerlendiril ir.

44

45

·-·> ·-

o.

lipmimde Ölfmt! ,·e Dejjerlı:mUrmt)'lt! İlgili Temı:I Kı,vrcımlar

iiproıimde Ölrmc ,·e D.,ğcrlemlirme

36

35

örnek Olay:

Eğitimdeki Ölçmelerde Karşılaşılan Temel Güçlükler

Olcay doktora gidip genel kontrolden geçiyor. Doktor sırasıyla aşağıdaki etkinliklerde bulunuyor:

cevabın ı zı yazı p a rkadaşla rınızla ıartı şın ı z.

Eğitimde ölçmenin doğasını anlayabilmek

1. Olcay', yaylı kantara çıkartı yor ve 11 Okilosunuz diyor. 2. Olcay'ın bir cetvelin önünde durmasını istiyor ve boyunuz 1.84 metre d iyor. 3. Olcay'ın vücut kitle indeksini VKI = 110/(1.84)2 eşitliğiyle hesaplıyor ve 32.49 olduğunu söylüyor. 4. Elindeki bir referans listesinden VKI değeri olarak 32.49'un yer aldığı kategoriyi belirliyor. 5. Olcay'a siz obezsiniz diyor. Soru: Bu örnek olayda ö lçme kuralı , ölçme, ölçüm, ölçüt ve lendirmeyle ilgili örnek veya örnekleri açık l ayınız?

için aşağıdaki sorulara yönelik

Soru: Bir masanın boyutları olan eni, boyu ve yüksekliğini ölçme ile bir öğrencinin başarısını ölçme işlemlerinden hangisi daha kolaydır? Neden? Cevabınızı yazınız ve sınıf arkadaşlarınızla tartış ınız:

değer­

Soru: Bir masanın boyutlarını n uzunluklarını 1 gün, 1 ay, 1 yıl ve 5 yıl sonra ölçmekle elde edeceğimiz ölçümlerdeki benzerlik düzeyi ile bir öğ­ rencinin herhangi bir dersle ilgili akademik başarı sını 1 gün, 1 ay, 1 yıl ve 5 yıl sonra ölçmekle elde edeceğimiz ölçümlerdeki benzerlik düzeyi aynı olur mu? Neden? Cevabınızı yazınız ve sınıf arlkadaşlarınızla tartışınız:

Uygulama: Yukarıdaki örnek olayda olduğ u gibi, ölçme kuralı, ölçme. ölçüm, ölçüt ve değerlend i rmeyi içeren bir örnek olay yazınız.

Yazdığınız örnek olayda hangi ifadenin hangi kavrama örnek olduğunu (ifadeden sonra parantez içinde) yazınız.

örnek Olayınız: Eğilim le ilgili ölçmelerde ölçülen değişkenin yapısından kaynaklanan bazı durumlar, ölçme işin i zorlaştırmaktadır. Bili ndiği üzere eğ itimdeki ölçmelere konu olan değişkenler genellikle; başarı, motivasyon, ilgi, tulum, kişi lik gibi değişkenlerdir. Bu tür değişken ler için doğruda n yapılacak gözlemlerle ölçme iş lem lerinin tamamla nması mümkün değ ildir. Eğitim ve psikoloji ile ilgili değişkenl erin ölçülmesinde çoğu durumda, tüm davranış ve özellik.lerden ziyade ölçmeye konu olan bu davranışla rın bir örneklemi alı­

nır. Özellikle başarı ölçmede, ilgili dersin tüm davranışları yerine, bu davra nışları temsil gücü yüksek olan kritik davranış ları ölçülür. Eğitimde ve psikolojideki ölçmelerde, ölçme işlemi nin yapı l dığı zaman da bir örneklemdir. Çünkü faı1d ı zamanlarda yapı lan ölçmelerde anl aml ı düzeyde farklı ölçümler elde edilebilmektedir. Aşağıda eğ i ti mle ilgili değ i ş­ kenlerin ölçülmesinde hem ölçülen değişkenlerin yap ı sında n hem de örnekleme ha tasından kaynaklanan bazı g üçlükler ele alı nmıştır.

46

47

·-·> ·-

o.

lipmimde Ölçme ,·e Dejjerlı:mUrmt)'lt! İlgili Temı:I Kı,vrcımlar

iiproıimde Ölçme ,·e D.,ğcrlemlirme

38

37

Ölçülen Değişkenin Yapısından Kaynaklanan Güçlükler

tedir. örneğin; sınıfta öğrencilere kazandırılmak istenen ve çok zaman ay. rılan davranışlarla ilgili sorular sormayıp, önemsiz ayrıntıların sınavda so,.. rutması gibi. Eğitimde ölçme ve değerlendirme alanında herhangi bir kurs a lmamış test uygu layıcıl arının veya öğretmenlerin, sınavda yoklanması gereken davranışları örneklemede yapabilecekleri bu hala çok yüksek düzeyde olabilmektedir.

Eğilimde ölçülen nitelikler sabit değil değişkendirter. Öğrencinin bir dersle ilgili bil işsel düzeyi, tutumu, eğ i ti m hizmetiyle ilgili etkinlikleri al g ı la­ ması Qibi özellikler bazen çok k ısa bir zaman d iliminde bile değ i şebil mek­ tedir. Ölçmek istediğimiz nitelikler sadece kişiden kişiye değil, durumdan duruma ve zamandan zamana da farklılık gösterirter. Eğiti mdeki temel amaçfanmı zdan biri de zaten öğrencilerde bir davranış deği şikliğ i meydana getirmektir. Bu davranış değişikliğinin istendik yönde ve düzeyde olması arzu l anır. Nihayetinde, bu davranı ş değişikl ikleri ni gözlemek amacıyla ölçme işl emleri yapılmaktadır.

Ölçme işleminin yapıldığı zaman da, sınavın yapılabileceği olası zabir ömeklemidir. Her şeyden önce eğiti mdeki ölçmelerde ölçülen deği şkene ait bilgi ve beceriler k ı sa sürede deği şebi l mektedir. Baz_ e n öğ ­ rencilerin, •sınav bir gün sonra olsaydı daha da başarılı olurdum" gı bı yarg ıl arda bulu nmal arı nın a l tınd a yatan sebeplerden biri de budur. Bunun dı­ şında sınav anındaki öğrencinin sağlık, psikolo!ik durum~ gibi etk!nler de öğrencinin sınavdak i performansını etkı lemektedır. Fı zı kı oı ç­ melerde genellikle bu tür sorunları n olmamasına rağ men eğitimdeki ölçmelerde genelde bu tür sorunlarta karşı karşıya kalın maktadır . Bu gerçek, eğitimdeki ölçme işini n daha başlangıçta , ölçülen değ işken i n doğas ından kaynaklanan güçlüklerden dolayı daha zor ol d uğun u göstermektedir. manların

Bi lindiği üzere değişkenlerin farklı sınıflandırı lmaları söz konusudur; bağımlı-bağı msız, sürekli-süreksiz. somut-soyut gibi . Eğitimde ölçmeye konu olan değişkenler genelde soyutturlar; başarı, zeka, ilgi, kişilik, tutum gibi . Eğiti mde öğrenci başarıs ını ölçmede, başarının soyut bir_ d_eğişken çıması öleme jşıemterini zorıastınnaktad ır. Uzunluk, kütle gıb ı somut (gözle görülebilir, elle tutulabilir) değişkenleri n her şeyden önce tanımı_a~­ ması, sonra bu değişkenl eri ölçecek ölçme aracının hazırl anması (gehştı•

Ölçme örnekleminden kaynaklanan hatalar aşağıdaki şekilde özetlenmektedir.

rilmesi) ve ölçme i şlemin in yapıl mas ı nispeten daha kolaydır ve daha az hata içerir. Başarı değişkeni soyut olduğu için; 1. Ölçülecek niteliğin tanımlanması (hedef davranışların belirtenip, ö lçmeye konu olacak kritik davranışları n belirtenmesi) ve

Ölçme örnekleminden Dolayı Hata Kaynakları

2. Bu n iteliği ö lçecek ölçme aracın ın ge liştiril mesi ve uygu lanma sı somut değişkenlerde old uğu kadar kolay değildi r ve ölçümlerde nispeten daha fazla hata olur. Anlaşılacağı gibi, ölçülecek değişkenin soyut olması ölçme iş lemin i n her aşamasında hata yapmamıza sebep olabilir. Ölçme Örnekleminden Kaynaklanan Güçlükler Ölçmeye konu olan tüm davranışların ölçülmesi. izleme testleri hariç, hem ekonomik olmamakta hem de bazı durumlarda buna gerek duyulmamaktadır. örneğin bir başarı testinde, tüm davranışlar yoklandığında sına­ vın 2-3 saat veya daha fazla sürmesi söz konusudur. Tabii ki bu süre testin ku lla nı şl ılığın ı olumsuz olarak etkilemektedir. Ayrıca bazı davran ı şl arı n yoklanması da gereksiz görülebilir. Dol ayısı yla, ölçmeye konu olacak davran ı şl arı n bir örnekleminin seçilmesi söz konusudur. Bu örnekleme işi yapılırken. haliyle bir örnekleme hatasının da yapılma ihtimali vardır. Örnekleme h atası yl a kastedilen; sınavda yoklanan davranış l arın. o dersteki başarı n ın göstergesi olabilecek davranışları yeterli düzeyde temsil etmemesidir. Ayn ı şeki lde, s ın avda yoklanmak amac ı yl a seçılen dav ranışları ö lçme amacıyla yazılan sorular da bir tür örneklemdir. Örne_~emin yetersiz veya ha talı olması , birinci derecede ölçme aracının geçerlıgı nı etkıl emek-

Sınava dahil edi-

lecek

davranış •

tarın örneklen. mesi hatası

Davranışları amacıyla

ölçme yazıl an

veya seçilen !2!!:!: !ardaki örneklem hatası

Ölçme

işleminin

yapıldığı !!!!!!!!a bağlı olarak öl-

çümlere örneklem

karı şan hataları

Ölçme işlemi sonucunda elde ettiğimiz ölçümler aynı zamanda istatis• tiktirler. Yani belli bir davranış takımının, testin ve zama nın bir örneklemi a lınır. Dolayısıyla , ölçümlerimiz bir örneklem üzerinden elde edilmektedir. Bu örnekleme hatasının az yapılması için ne gibi tedbirlerin al ındığı açık• l anmalıdır. Ayrıca, ömeklemden elde edilen istatistiklerin bir de parametre

48

49

·-·> ·-

o.

lipmimde Ölfmt! ,·e Dejjerlı:mUrmt)'lt! İlgili Temı:I Kı,vrcımlar

39

iiproıimde Ölrmc ,·e D.,ğcrlemlirme

40

değerleri, yani evrendeki gerçek değerleri vardır. Eğitimde ölçülen deği ş­ kenin yapısından ve örneklemeden dola yı ölçme işleminin her aşama• sında hatalar ya pılabilir. Bu nedenle, eğitimdeki ve psikolojideki ölçme-

Ölçme Türleri Ölçme işleminin dolaysız veya dolaylı bir şekilde yapılması ölçütüne göre ölçme türleri temel ölçme ve dolaylı ölçme olarak iki gruba ayrılmak­

lerde; ✓ (a) ölçümlerimizin gerçeği (parametreleri) ne derece temsil ettiğini ✓ (b) yapılan ölçme işleminin mümkün olan en iyi ölçme işlemi olduğunu ve ✓ (c) nitelikle ri niceleştirmed e kulland ı ğ ı m ı z sayı (625 puan gibi), sıfat (Atletik tip gibi) veya sembollerin (A+ gibi) ne anlama gel diğini açıklaya bil mek gerekir.

tadır .

1. Temel

(dola ysız)

ölçme

Ölçülecek değişkenin doğrudan gözlenmesi sonucu yapılan ölçmeye temel ölçme denir. Bu tür ölçmelerde dolaysız bir şekilde gözlem yapıla­ bildiğinden, ölçülen değişkenler genelde somuttur. Öğrenci performansı­ nın direkt olarak ölçülmesi de temel ölçmeye örnek o lur: Örneğin bir ülkenin başkentini sorduğunuzda öğrencini n cevabından, bu bilgiye sahip olup olmadığını direkt olarak ölçmüş olursunuz.

örnek: ►

Bir sınıftaki öğrencilerin sayısını belirteme. kaç tane s ıra ol duğu nu belirteme.



S ı n ı fta



Öğrencileri boy sırasına koyma işlemleri.



Bir basketbol maçında bir oyuncunun kullandığı serbest atışl ardan kaç tanesinin isabetli ol duğunun belirlenmesi.

2. Dolaylı ölçme Ölçülecek değişkenin doğrudan gözlenemediği durumlarda bu ölçme türüne başvurulur. Öğrencinin öğrenmeye karşı tutumunu somut bir şe­ kilde direkt olarak ölçemeyiz. Öğrenme tutumunu, teorik olarak göstergesi o lan tutum maddelerinden oluşan bir ölçme aracıyla (dolaylı olarak) ölçebiliriz. Dola ylı ölçme, bir değ i şkenin (o değ işkeni n bir göstergesi o l duğu düşünü l en) başka bir deği şken veya değişken l er yard ı mıyla veya tanımla ­ nan bir bağ ın tı yardımıyl a ölçülmesidir. Yani ölçülen değişken i n dola ylı bir şekilde gözlenmesi yoluyla yapılan ölçmelerdir. iki tür dolaylı ölçme vardır. a) Göstergeyle ölçme: Bir değişke ni n başka bir değ i şken yardımıyla ö lçülmesidir. W u, Tam ve Jen'ın (2016) belirttiği gibi öğren cileri n akademik başarıları, yalnızca belirli görevlerdeki performans gibi gösterge değişken­ ler aracılığıyla ölçülebilir. Göstergeyle ölçmeye örnek: Yay1 ı kantar, yetenek testleri, yazılı yoklama, çoktan seçmeli testler. cıva l ı ve santigrat derece cinsinden gösterim sağlaya n termometreler. Göstergeyle ölçmede, ölçülen değişkenin birnevi göstergesi olabilecek başka değişkenden faydalanma durumu vardır.

50

51

·-·> ·-

o.

lipmimde Ölçme ,·e Dejjerlı:mUrmt)'lt! İlgili Temı:I Kı,vrcımlar

seçmeli testlerde "0 -1 " puanlama yöntemi kullanıld ığ ında ve yanlışlar doğ­ rulan götü rmediğinde, b irim (doğru cevaplan mış bir soru) "1 puandır."

Örnek:





iiproıimde Ölçme ,·e D.,ğcrlemlirme

42

41

Öğrencileıin bir dersteki başarılarını gözlemek amacıyla yapılan s ın avlardaki scrulara öğ rencil erin verecekleri cevaplar başarı ları ­ nın bir göstergesi kabul edilir. Öğrencinin akademik başarısını direkt bir şekilde ölçemeyiz. Bir tutum veya motivasyon ölçme aracındaki sorulara öğre nci l erin verdikl e ıi cevaplardan faydalanarak öğ rencilerin tutum veya motivasyon l arını dol aylı olarak ölçebiliriz.

Ölçme sonuçlarının cm, kg, puan gibi bazı birimlerte ifade edilmesi hem ölçme işlem i nin yap ılmas ın ı kolayl aştır ır hem de (ölçümlerde bir standartlık sağlayacağ ından) ölçümlerin neyi ifade ettiği nin daha da net olarak anlaşılmasını sağlar. Örneğin 1 m. kumaş denince herkesin aklına hemen hemen aynı uzunluk gelir. Ölçmeye konu olan tüm değişkenlerin birimleri aynı özellikleri taşıma­ maktadır. Birimler doğal ve tanımlanmış o lmak üzere iki grupta toplanabi-

lir.

b) Türetilmiş ölçme: Ölçmek istediğimiz değişken, bir fonnülün uygulanması d ış ında bir ölçme işlem i yapmadan, ölçülen değişkenl e diğer değişkenler arasındaki bir bağ ıntı dan faydalanarak ölçüml eıin elde edilmesi işlemid ir.

1) Doğal Birim

Bir değişkeni n hangi miktarına "1 birim• den ileceğ i bilim adaml arı tarabirimde ölçülen

Ömek: ►

fından tanımlanmamı ş birimlere doğal birim denir. Doğal değişkenin her bir parçası 1 birim kabul edilir.

Öğrencileıin dönem sonu başarı ortalamalarının, ara ve final sınavları arasında tanımlanmış bir bağıntıdan faydalanarak hesaplanması işlemi.

0.40)+(Final Sınavı Puanı x 0 .60). Kütle/Hacim" eşitl i ğ ini n uygu l a nması. Öğrencilerin okul mezuniyet ortalamasının hesaplanması . Vücut kitle indeksinin hesaplanması: VKI - Kotıc(i ·-

o.

lipmimde Ölfmt! ,·e Dejjerlı:mUrmt)'lt! İlgili Temı:I Kı,vrcımlar

43

iiproıimde Ölçme ,·e D.,ğerlemlirme

44

Birimlerde Bulunması istenen Özellikler

3. Birimlerin kullanılış amacına uygunluğu Bir birimin kullanılış amacına uygun olması hem birimin kullanışlılığı hem de birimin anlamıyla ilgilidir: (1) Birimin kullan ı şlı olup o lmaması : Yani. bir ki şi nin kütlesini ifade etmek için külle birimi olarak "ton" un alın ması uygun_olmaz. Bir insanın küt: lesini ifade edeıl1 old uğundan dolayı ) söylenemez. Anl aşılacağı üzere, kodlamada kullanıl an bu numaralara dört işl emi uygulamanın bir anlamı yoktur. ma n ların sayı sı

Ölçeklerin az bilgi sağlayandan çok bilgi sağlayana doğru sıralanması aşağ ıd a sunu l maktad ır.

1. Sın ıflama !çekleri (Nominal scales) 2. Sıralama Ölçekleri (Ordinal scaJes) 3. Eşil Aralıklı Ölçekler (lnterval scales) 4. Eşil Oranlı Ölçekler (Ratio scales)

..

~

Oran lı

56

57

·-·> ·-

o.

lipmimde Ölçme ,·e Dejjerlı:mUrmt)'lt! İlgili Temı:I Kı,vrcımlar

2. Sıralama Ölçekleri

3. Eşit Aralıklı Ölçekler

Bu ölçek niteliklerin belli bir boyutta, büyükten küçüğe, küçükten büyüğe, iyiden kötüye veya kötüden iyiye doğru sıral anmasıyla elde edilir. Bu s ıralar sayı ile ifade edileb ileceği gibi bazı sı fatlarla da ifade edilebilirler; pekiyi-iyi-orta-geçer-kalır (veya 5-4-3-2-1), en uzun-uzun-kısa (veya 3-21) gibi. Bu tür ölçeklerde öğrencilerin tüm grup içindeki yeri belirlenmektedir. Birinci, ikinci, ... . gibi numaralar öğren cileri n tüm grup içindeki konum• ! arın ı

iiproıimde Ölçme ,·e D.,ğcrlemlirme

48

41

Eşit aralıklı ö lçek birimlerde eşitliğin sağlandığı ve sıfırın tanımlan­ m ış olduğu ölçek türüdür. Eşit aralıklı ölçeklerde sını flar arası ara lıkların

eşitliği de sağlanmıştır. Ölçümlerin yorumlanmasında kullanılan Z ve T standart puanları eşit aralıklı ölçek türünden ölçümlerdir. Sıcaklık ölçmede çok kullanılan ve bilinen Celcius ve Fahrenheit ölçekleri birimlerde eşitl iği sağlayan eşit aralıklı ö lçekler için uygun örneklerdir. Her iki ölçme aracında da sıfır tanımla nm ı ş s ıfırdır. Bu sebeple, eşit ara lıklı ölçeklerde ölçümlerin birbirine oranlanması an lamlı değildir. Yani Celcius ölçeğiyle 10° olan sıcaklığın 5° olan bir sıcaklıktan iki kat fazla ol duğu söylenemez. Çünkü belli bir miktardaki s ıcaklığa sı fır değeri atanmıştır. Aynı şekilde, eğ itimsel ölçmelerde de zeka puanı 120 olan birinin zek8 puanı 60 olan birinden iki kat zeki ol duğu söylenemez. Eşit aralıklı ölçeği n sı ralama ölçeğinden üstünlüğü, ölçü mler arasındaki farkın miktarının anlamlı olması­ dır. Zeka puanı 120 olan birinin zeka puanı 60 olan birinden 60 puan daha fazla al dığını söyleyebiliriz. Yani iki ölçüm arasındaki farkın miktan anlam kazanmaktadır. Anlaşılacağı g ibi sıfırın tanımlanmış olduğu ve birimlerde eşitliğin sağland ığı durumlarda eşit aralıklı ölçeğe ulaşılmı ş olunur. Aynı s ı caklıkların Celcius ve Fahrenheit ölçeklerindeki değerle rine yönelik bazı örnekler aşağıda verilm iştir (Celcius ölçeğinde suyun donma noktasına O ölçek değeri ve suyun kaynama noktasına 100 ölçek değeri

belirlemede kull anı labilir.

Sıral ama öl çeğinde . s ı n ı flamadan fazla olarak sıra sayıl arı arasında büyüklük küçüklük ilişkis i vard ır . S ı ra lama ölçeğ i veriler aras ın da bir kı ­ yaslama yapma olanağı sağ l amaktad ır. Belli bir özellik açısından, o özell iğe az sahip olan veya çok sahip olan ifadesi kullan ıl abil mektedir. Yani belli bir özellik bak ım ından bir karş ıl aştırma yapma ol anağ ı vardır. Bu ölçekte belli bir boyutta sıra la r aras ındaki büyüklük, küçüklük yorumunu yapmak anlamlıdır. Buna rağmen. iki sıra aras ın daki farkın m iktarını söylemek anlams ızd ır. Başarı s ıralamasına göre veya boy uzunl uğu s ıral amas ın a göre elimizde sadece sırayı belirten ölçümler varsa (1 .. 2., .. gibi), ikinci öğrencinin dördüncü öğrenciden iki birim daha üstün olduğu söylenemez. Her bir ardışık sıra num arasını alan öğrenciler arasındaki fark bir derece o lsa da bu farkın aynı miktarı ifade ettiği söylenemez. En başarılı ilk beş öğrencinin belirlenmesi bu ölçeğe bir örnektir. Bu ölçek türüne de dört işlemi uyg ulamanın bir anlamı yoktur. Birinci ile ikincinin toplamı üçün• cüyü vemıez.

atanmıştır):

Sıralama Ölçeğine Örnekler: ►

Beden ölçülerinin S, M, L, XL, XXL, XXXL olarak belirlenmesi.



Bir resim yarışmas ında resimlerin güzellik sırasına göre 1. , 2., ve 3. olarak sıra lanması . Eğ iti m düzeyi (okul öncesi, ilköğreti m , lise, lisans. yüksek lisans. doktora)



Celcius 10°

200 Fahrenheit

50• Anlaş ılacağı üzere, sıcaklık ölçmede kullan ılan Celcius ve Fahrenheit ölçeklerindeki sı fır noktaları farklı tanımlanmıştır, Her iki ölçek de farl ·-

o.

lipmimde Ölçme ,·e Dejjerlı:mUrmt)'lt! İlgili Temı:I Kı,vrcımlar

51

iiproıimde Ölçme ,·e D.,ğcrlemlirme

52

ÜNİTE SORULAR!

ÖZET Ölçme kuralı; ölçme işini yaparken niteliğin hangi miktarına ne değer (ba• şarı ölçmede puan) verileceğinin belirlenmesidir. Ölçme; ölçülen niteliklerin aralarındaki ilişkileri koruyacak şekilde bu niteliklere sayı veya sembollerin atanması işleml eridir. Ölçüm; ölçme işlemi sonucunda elde edilen sayı veya semboldür.

1. Ölçme kuralı, ölçme, ölçüm, ölçüt ve değerlendirme kavramlarını bir örnek üzerinde açıklayınız. 2. Eğitimsel ölçmelerde ölçülen değişkenin yapısından kaynaklanan ne gibi güçlükler söz konusudur? 3.

Ölçüt; ölçümler hakkında bir karara varırken kullanılan kıstaslardır. Öğretimde değerlendirme; öğrenci başarısı hakkında bir yargıda bulunmaktır. Değertend irme, ölçümlerin ölçüt veya ölçütlerle kı yasl anarak bir karara varma i şidir .

Eğilimsel ötçmelerde ölçme örnekleminden kaynaklanan ne gibi güçlükler söz konusudur?

4. Ölçme lürterinden temel ölçmeyi bir örnekle açıklayınız 5. Ölçme türlerinden dolaylı ölçmeyi bir örnekle açıklayınız 6. Ölçme sonuçlarını bir birimle ifade etmek ne fayda sağlar?

Eğilimde ölçmeye konu olan d eğişkenler genelde soyutturlar. Eğitimde öğrenci başarısını ölçmede, başarının soyut bir değişken olması ölçme İ Ş·

7. Ölçmede kullanılan birimlerde eşitliğin sağlanmaması ne gibi sorunlar d oğurur? 8. Sını flama öl çeğin i n temel özellikleri nelerdir?

lemlerini zortaştırmaktadır. Ölçme işlemi sonucunda elde ettiğimiz ölçümler a ynı zamanda istatistiktir1er. Yani belli bir davran ış takımının, testin ve zama nın bir örneklemi alınır. Dol ayı s ıyla , ölçümlerimiz bir ömeklem üze. rinden elde edilmektedir. Tabii ki, ömeklemden elde edilen istatistiklerin bir de parametre değerleri , yani evrendeki gerçek değerleri vardır. Verilen bu bilgi ış ığın da bizim ölçümlerimizin gerçeği (parametreleri) ne derece temsil ettiğini belirlemek gerekmektedir (temsil sorunu). Ayrıca, yapılan ölçme işleminin mümkün olan en iyi ölçme işlemi olup olmadığının da açık­ lanması sorunu vardır (teklik sorunu). Elde ettiğimiz ölçümlerin niceleştiril­ mesi aşamasında kullandığımı z sayı, sembol veya kodların ne anlama geldiğini açıklama sorunumuz da vard ır (anlamlılık sorunu). Ölçme sonuçlarını anlaşılır standart bir birimle ifade etmek, ölçümlerin anlamlılığı sorunun çözmede bize katkı sağlar . Eğiti mde ve psikolojide ölçmelerde en çok kullanı l a n ölçekler sıralama ve eşit aralı klı ölçeklerdir. Sı­ nı flama ve eş it oranlı ölçekler nadiren kullan ı lırlar . Sınıflama ölçeklerinde: elemanlar taş ıd ıkl arı özell iğe göre s ını flara tasnif edilirter. S ın ıfl ama ölçeğinde, sın ıfl ardan herhangi birine giren tüm elemanlar eşi t , farklı sını flar­ dan alınan elemanlar ise farklı olur1ar. Sıralama ölçekleri; niteliklerin belli bir boyutta sıra l a nmasıyla elde edilir. S ın ıfla madan fazla olarak s ıral ar arasındaki büyüklük küçüklük i lişki si vard ır. Eş it aralıklı ölçek birimlerde eşit­ liğin sağlandığı ve sıfırın tanımlanmış olduğu ölçek türüdür. Eşit aralıklı ölçeklerde sınıflar arası aralıkların eşitliği de sağl anmış olur. Eşit aral ıklı ö lçeklerde ölçümler arasında ki farkın miktarı anlaml ıdır. Eşit oranlı ölçek: birimlerde eşitliğin sağl andığı ve sıfırın gerçek (mutlak) sıfır olduğu ölçek türüdür. Tanımdan da anlaşıldığı gibi bu ölçeğin öncekilerinden ü stünlüğü sıfı rın gerçek anlamda yokluğu ifade etmesidir. S ıfırın gerçek sıfır olması değişkenin iki farklı miktarının birbirine oranının ölçümlerde de korumasına olanak sağl ar.

9. Sıralama ölçeğini , sın ıflama ölçeği nden üstünlüğü nedir?

SINIF-iÇi UYGULAMA Aşağıdak i

kavramlara (gerekçesiyle bi rlikte) özgün örnekler veriniz.

1. Ölçme kuralı 2. Ölçme 3. Ölçüm 4. Ölçüt 5. Değerl endirme 6. Örnekleme hatası 7. Temel ölçme 8. Göstergeyle ölçme 9. Türetilm iş ölçme 1O. Doğal birim

62

11. Tan ı m l anmış birim 12. Birimlerin eşitli ği 13. Birimlerin gen elliği 14. Birimlerin amaca uyg unlu ğu 15. Doğal sıfır 16. Ta nıml anmış sıfır 17. S ınıflama ölçeği 18, S ıral ama öl çeği 19. Eşit a ralıklı ölçek 20. Eş it oranlı ölçek

63

·-·> ·-

o.

54

Test Sonuçları için Temel İstatistikler, Yorumlanması ve Geri Bildirim

_ _ _ _ _ _ _ _ ___,/ ÜNiTE 3

Sınav sorularından veya sınavın tümünden elde edilen ölçümlere ait ortalama, standart sapma ve aynı grubun aldığı sınavlardan elde edilen ölçümler arasındaki korelasyon gibi istatistikler hesaplanarak soruların ve sınavın bazı niteliklerine yönelik yorumlar yapılmaktad ır. Yani madde analizi işlemleri nde veya elde edilen ölçme sonuçlarını betimleme ve yorumlamada laydalanılan bazı istatistiksel teknikler vardır. örneğin, bir grup olarak öğ re ncile rin başarılarını betimlemede ve b u grubun ölçülen değiş­ ken açısında n ne derece homojen veya heteroje n bir yap ıda ol d uğun u anlamada bazı istatistiksel tekniklerinden laydalanılır. Öğrencilerin aldıkları puanlara bakıp o sınıfın veya grubun başarısı hakkında yorumda bulunur• ken, grupları karşılaşlırıri ·-

o.

Test $Qmıçlıırınm >'onımlanmas, re (;eri 8ilılirim

61

Öğretiı,u/e Ölçme ,·e Değe.rler,dinrıe

62

Sx =

Formülünden faydalanarak, standart sapma aşağıdaki gibi hesaplanır: Sx =

Kareler toplamı 11

J932

=

10 =

= v93.2

II Ll=l

(rr.,xı}'

x2

1 -

'

Yukardaki formülü kullanarak ölçümlere ait standart sapma hesa planırken aşağıdaki aşamal a r izlenir:

= 9.65

Yuka rıda

verilen standart sapma eşitli ğ i , standart sapman ın puanların ortalamadan sapmasın ın bir tür ortalama değeri olduğunu anlama için daha etkilidir. Bu eşitli ğin pay kısmının açılım ı yl a hesaplamada (ortalama tam sayı olmadığı durumlarda) daha kullanışlı olan aşağıdaki standart sapma formülü elde edilmiştir.

Puanların kareleri alınıp toplanır,

1.

aıitme tik

Sx

=

Lıı : ı

ta:r.,

sonuçtan çıkartılarak kareler toplamı bulunur, LP. 1

n

xr - (~

n

'

)

n

Lr. 1 xr: X puanlarının karelerinin toplamı a lınır,

Birinci aşamada elde edilen sonuç ikinci aşamada elde edilen

3.

x~- ıı:r. , x,) ı

rr., Xl

2. Puanlar toplanır, bu toplamın karesi alınıp öğrenci sayısına bölünür, X;) 2 ]/n

2

' ··-

o.

Test $Qmıçlıırınm >'onımlanmas, re (;eri 8ilılirim

Oğrenci

Test Pu anı, X;

1

04

16

2

10

100

3

11

121

4

15

225

5

18

324

6

22

4 84

7

25

625

8

29

841

9

30

900

10

36

1296

Toplam, L

200

4932

(ı4

63

x,2

Öğretiı,u/e Ölçme ,·e Değe.rler,dinrıe

Normal Dağılım Eğrisi Eğitim ve psikolojiyle ilgili birçok de ğişkene ait ölçümlerin frekans dağılımı çan eğrisi, G auss eğrisi veya normal dağılım eğrisi olarak adlandırı ­ lan eğriye benzemektedir. Uzunluk, tansiyon, zeka gibi bir çok özellikle ilgili puanların dağılımı incelendiğinde aritmetik ortalama civarında daha

fazla ölçümlerin olduğu ve aritmetik ortalamadan uzaklaştıkça öl-

çümlerin azaldığı belirtendiğinden , doğadaki değişkenleri n hemen hepsinin evrendeki dağılım ının normal dağılım gösterdiğ i beli rtenmi ştir. Eğ i­ timde ölçme ve değerten d irme ve istatistikte normal dağ ılı m eğ ri sine dayalı birçok bilimsel parametre kestirim metodu ve u yg ulamal arı mevcuttur. Ölçme ve değertendirmede kullanılan istatistiksel işlemlerin daha net bir şeki lde anlaşıl mas ı için çok basit olarak normal dağılım eğ ri si nin özellikleri bilinmelidir. Ölçümlerimizin evrende normal dağıldığını varsayar ve bu varsayım analizleri yaparız. Evrenin tüm elemanların ın gözlenip, ö lçme işle m inin yapıldı ğı durum pek az görülür veya hiç mümkün d eğild ir. Bazı durumlarda dağılımın gerçek şekli asla bilinmeyebilir. istatistiksel olarak elimizdeki ölçümlere ait dağ ılı mın normal dağ ılı m özelliklerini ta şı yıp doğru ltu sunda bazı

ta şımadığ ını kontrol etmek mümkündür. Aşağıda normal dağılımın bazı özellikleri beti mlenmiştir.

Yukandaki tabloda göriildüğü gibi, son sütunda her bir puanın karesi alınmıştır. Örneğin birinci öğrencinin puanı 4 'dür. Bu puanın karesi ise 16 'dır. Sonra, puanların kareleri toplanmış ve 4932 bulunmuştur. Puanla-

Normal

rın karelerinin topla mı bulunduktan sonra formülü uygulayabilmek için tüm değişkenler elimizde mevcuttur.

Sx=

Kareler toplam ı

4932 - (?OO)ı

4932 -4000

n

10

10

ı -----=

••

im

rıo=9.65

dağılım eğrisi

0.341 3

Görü ldü ğü gibi her iki formülde aynı sonucu vermektedir. Veri sayı sı çok oldu ğund a veya aritmetik ortalama tam sayı olmadı ğınd a bu son for-

0,3413

0.0215 0.1359

mülün kulla nımı daha pratiktir.

x-2Sx

x-Sx

x

Z=

x-3 Sx -3

-2

-1

o

T=

20

30

40

50

Şek il

X+Sx

60

x+2Sx

x+3Sx

2

3

70

80

3-1: Normal dağ ılı m eğri si

75

74

·-·> ·-

o.

Test $Qmıçlıırınm >'onımlanmas, re (;eri 8ilılirim

65

6(i

Şekil 3-1 'de gö rüld üğü gibi normal dağ ılı m eğıisini n yatay ekseni a lı ­ nan puanları belirten ölçek olarak kullanı l maktadır. Bu ölçek oluşturul ur­ ken, puanlara ait aritmetik ortalama ve standart sapmadan faydalanılmak­ tadır. Puanların aritmetik ortalamas ı ölçeğin tam orta nok tasını belirlemektedir. Aşağıda sunulduğu gibi Z ve T standart puanları aritmetik ortalama değerine gelen bu orta noktaya farklı değerler vermektedir. Şekil 3-1 'de görüldüğü gibi Z standart puanı ölçeğin bu orta noktasına 0.00 ve T standart puanı ise 50.00 değerini vermektedir. Bu ölçekte bir de birim vardır. Birim olarak puanlara ait standart sapma kulla nılmaktad ır. Z standart puanı için birim yani standart sapma 1.00 iken T standart pua nı için birim 10.00 puandır.

3. Normal dağ ılı mda mod, ortanca ve aritmetik ortalama birbirine eşittir . 4. Normal dağ ılı m -~ . • ~ a ralığ ında ta n ım lanm ıştır. ama pratikte bu tanım aralı ğı -3, +3 arasında s ını rland ı nlm ı şt ır ki bu ta nı m aralığ ı zaten eğ rin in %99.74'Iük bir k ısmını olu ştu rmaktad ır. Birim normal dağılımda Y ordinat yüksek liğ i için hazırlanmış istatistiksel tablolar mevcuttur (bakınız: Ekler, Tablo 2). Aşağıda test puanlarının Z ve T standart puanlara dönüştürülmesi açıkla nm aktadır.

Ham Puanların Z ve T Standart Puanlarına Dönüştürülmesi

Normal dağı lım eğ risinde ölçekteki birimler arasında eğrinin belli bir alanı va rdır. Bu alan oran olarak ifade edilmektedir. Eğri altındaki tüm alan 1.00 olup, Z=O.OO'dan küçük puanlar için eğri altınd aki alan 0.5000 (toplam alanın yarısı) olur. Benzer şekilde Z=0.00 değerin in üstündeki kı sım için de eğri altındaki alan 0.5000 olur. Z standart puanı cinsinden 1.00 puan ile 2.00 puan arasında ki alan 0.1359 olur. Z standart puanı 1.00 ile 2.00 aras ındaki alan; kitabın Ekler kı sm ında verilen Tablo 1'den (Bir Z değeri için Birim NormaJ Dağ ılım Eğ risini n Solunda Kalan Alan) faydalanarak bulunur. Birim Normal

Öğretiı,u/e Ölçme ,·e Değe.rler,dinr,e

Standart p uanlar; ham puan ların standart bir dağ ılıma dönüştürül me­ siyle elde edilir. Bu amaçla k ull a n ılan Z ve T gibi dönü ştürme formülleri va rdır. Standart puanlar öğrenci başarısını yorumlama. (öğrenci puanının aritmetik ortalamadan ne kadar iyi veya kötü olduğunu veya öğren­

cinin tüm öğrenciler arasındaki konumunu belirleme) olanağ ı sağlar. Ayrıca farklı s ınıflardaki öğrenci lerin farklı testlerin kullanıldığı bir dersten a ldıkları puanlara bakarak bir karşılaştırma yapmak yanıltıcı olabilir. Aynı şek ilde farklı yıllarda yapılan sına vlardan alınan puanlara bakarak bir karşılaştırma yapmak da bizi yanıltabilir. Bu gibi durumlarda öncelikle puanların ortak bir ölçeğe dönüştürülmesi gerekir. Böylelikle öğ rencinin grup

Dağılım

içindeki başarı d urumunun göstergesi olarak bir l eşm i ş olur.

Birim normal dağ ı lım eğri si . orta l aması "O" ve standart sapmas ı "1.00" o lan normal dağ ıl ım eğ risid ir. Yani , yatay ekseni Z standart puanı şekli nde belirlenen bir dağ ılı mdır. Normal dağ ılı ml a ilgili tüm istatistiksel tablolar (z tablosu, y ordinat yüksekliğ i tablosu gibi) birim normal dağ ılım eğrisine göre hazırlanmıştır. Yani, her bir faı1d ı ortalama ve standart sapma için farklı normal dağılım eğrileri söz konusu olduğundan, tüm normal dağ ılım özelliği gösteren dağılımlar biıim normal dağılıma dönüştürülür. Bu dönü ş­ türmede puan dağılımını normalleştirme eşitliği olarak bilinen Z standart puanının hesaplanmasıyla sağlanır. Böylece nonnal dağılım özelliği gösteren farklı dağılımlar. birim normal dağılıma dönüştürülerek bir nevi standartlaşma sağlanmış olunur.

puan ın a nla m ı

daha net-

Aşağ ıda öncelikle ham puanların Z standart puanı na sonra da T standart puanına dönüştürülmesi sunulmuştur.

Z Standart Puanı : Aritmetik ortalaması 0.00 ve standart sapması 1.00 o lan bir puan türüdür. Öğrencileıin sınav puanlarından faydalanarak, aşa­ ğıdaki eşitlik ya rdımıyla sınav puanları Z standart puanı cinsinden ifade edilebilir.

X;

- 1?

Zı= -­

Sx

örnek soru: Nil a.ritmetik ortalaması 40 ve sta ndart sapması 6 olan bir 46 puan alm ı şt ır. Nil'in bu s ı navda n aldığı puanı Z standart pu a n ı cinsinden kaça eşittir?

Normal Dağılım Eğrisinin Temel Özellikleri :

sınavda n

1. Normal dağılım eğrisi bir olasılık dağıl ım eğrisidir.

z1 -- s;X,- X - ◄6-,o - 1 00 - - .- - '

2. Normal dağ ılı m Z=0.00 (aritmetik ortalama) noktasından simetriktir.

76

77

·-·> ·-

o.

Test

$Qmıçlıırınm >'onımlanmas,

re (;eri 8ilılirim

61

Öğretiı,u/e Ölçme ,·e Değe.rler,dinr,e

68

Bir s ın avda n alınan 46 puan ın öğrencin in grup içerisindeki ba şa rısını ne derece iyi veya kötü bir puan old uğu n a karar verebilmek için elimizde yeterli bilgiler yoktur. Buna rağmen Z=1.00'in anlamı öğre n ­ cinin grup içindeki ba~rı göstergesi olarak çok daha kesindir. Z standart puanı 1.00 olan bir öğ rencinin puanı nın s ınıfın yakla şık olarak %84'ünden daha iyi bir puan olduğunu veya aritmetik ortalamadan bir standart sapma d aha fazla puan aldığını an larız. Çünkü p(Z ··-

o.

Test $Qmıçlıırınm >'onımlanmas, re (;eri 8ilılirim

Farklı korelasyon katsayıları için iki değişken arasındaki ilişkiyi gösteren bazı grafikler aşağıda sunulmuştur.

Korelasyon Ölçümler arasındaki ilişki düzeyini sayısal olarak beli~emede korelasyon tekniği nden faydalanırız . Bu kitab ın içeriği gereği korelasyon dendiği zaman basit (iki değişken arasındaki) doğrusal korelasyon teknikleri kastedilmektedir. Korel8syon katsayısının karesi bize iki değişken arasındaki "ortak değişkenliği" gösterir. örneğin iki değişken arasındaki korelasyon 0.80 bulunmuş ise bu korelasyonun karesi olan 0.64. bu iki değişkenin ortak olan kısmıdır. Yani A ve B kümesinin kesişen a lanı gibi bu 2 değişkenin %64'ü aynıdır.

(a) r,, = 1.00 Mükemmel pozitif ilişki

Korel8syon katsayılarından ölçme ve değerfendirmede ölçümlerin hem güvenirlığini hem de geçerliğini tahmin etmede faydalanırız. Bunların dışında ; iki davranışın önkoşuı ili şkisini betimlemede. eğ itimde başarı ile ilişkisi çalışılan değişkenlerin tespitinde vb gibi durumlarda korelasyon tekniğinden faydalanırız. Basit doğrusal bir korelasyon katsayısının işareti (+) veya(-) bize ilişki nin yönünü gösterir. Eğer korelasyon katsay ıs ının işa reti (+) ise iki değişken arasında pozitif doğrusal bir ilişkinin olduğu.(-) ise negatif veya ters yönde bir ilişkinin olduğu anlaşılır. Korelasyon katsayısının işaretine bakılmaksızın, korelasyon katsayısının değeri bize ilişkinin miktarını veya düzeyini verir. Bazı korel8syon katsayıları ve anlamları aşağı• daki tabloda sunulmuştur.

Tablo 3-2:

Bazı

Korelasyon

Katsayıları

(b) r.,. = -1 .00 Mükemmel negatif ilişki

...

(c) r.., = .70

(d)

r.., = - .70

ve Anlamları

rxy

Anlamı

.00

iki değişken arasında ilişki yok. Değişkenler tamamen birbirinden bağ ımsız.

-1 .00 veya +1 .00

Öğretiı,u/e Ölçme ,·e Değe.rler,dinr,e

12

71

(e) r,, = .00 İlişki yok

iki değişken arasında mükemmel bir ilişki vardır. Eğer bir kişinin X deği şkenine ait ölçümü biliniyorsa Y değişkenine ait ölçümü mükemmel bir şekilde tahmin edilebilir. Korel8syonun işareti pozitifse bu ilişki aynı yönde, negatifse lers yönde olur.

Şekil

Korelasyon katsayısının muttak değeri "1 .00" değerine yakl aştıkça iki değişken arasında yüksek bir il işki , değerine yaklaştıkça düşük bir ilişki var demek-1.00< r,.,< 1.00 lir.

3-2: 5 Farklı Korelasyon Katsayıs ın ın Grafiksel Sunumu

Bu kıs ımda Pearson korelasyonu açıklanmış olmakla bi~ikte Çift-serili Korelasyon Katsayısı ve Nokta Çift-serili Korelasyon Katsayısının kullanımı ve hesaplanmasına y/Jnelik bilgiler bu kitabın "Başarı Testi Geliştirme ve Uygulama' ünitesinde sunulmuştur.

·.oo·

82

83

·-·> ·-

o.

Test $Qmıçlıırınm >'onımlanmas, re (;eri 8ilılirim

Pearson Momentler Çarpımı Korelasyon Katsayısı

73

74

Öğretiı,u/e Ölçme ,·e Değe.rler,dinr,e

(r,1 )

{The Pearson Product-Moment Correlation Coefficient)

Tablo 3-3:Öğrencilerin Matematik Başarılarını Ölçen Bir Testin iki Uygulamasında Aldıkları Puanlar

Sosyal bilimlerde en çok kullanılan basit doğrusal korelasyon tekni ğidir. Pearson korelasyonu her iki değ i şken de sürekli değişken olduğund a ve puanlar normal dağılım özelliği gösterdiğinde kullanılır. Ölçek tü~eri açısınd a n ifade edecek olursak. her iki değ i şken de eşit aralıklı ve/ya eşit oranlı ölçek yapıs ın da iken kullanılır.

X

y

XY

X'

Y'

40

41

1640

1600

1681

2

37

36

1332

1369

1296

3

35

30

1050

1225

900

4

34

28

952

1156

784

5

29

28

812

84 1

784

6

29

26

754

841

676

.E Xı Yı : Her bireyin X ve Y puanlarının çarpımlarının toplamı

7

25

26

650

625

676

EXı : X puanlarının toplamı

8

25

26

650

625

676

EYı : Y puanl arı n ı n

9

25

26

650

625

676

10

25

26

650

625

676

11

20

22

440

400

484

12

20

22

440

400

484

13

20

20

400

400

400

14

18

17

306

324

289

15

18

16

288

324

256

Pearson korelasyon katsayısının hesa planmasına örnek olarak; farklı zaman aralıklarında, aynı öğrenci grubuna 2 kez uygulanan bir başarı testinden öğrencilerin aldıkları puanlar arasındaki ilişkinin hesaplanması aşa-

16

17

15

255

289

225

17

15

14

210

225

196

ğıda sun ulmuştur.

18

14

13

182

196

169

19

13

12

156

169

144

20

10

9

90

100

81

r

469

453

11907

12359

11553

L XıYırxy

(E X1) 2

:

=

Oğrenci

cı:xııa:v,ı

"

[L v2 - a:v,ı'] [LX~ı - cı:xı>'] n i n

toplam ı

X puanlarının toplamının karesi

(L Yı)2 : Y puanlarının toplamının karesi

rxr

: X puan larının karelerinin topl am ı

EY;'

: Y puanlar ının karelerinin toplamı

84

85

> ··-

o.

Test $Qmıçlıırınm

._. X y _

/J

l'xy

1 1

re (;eri 8ilılirim

Bireysel Olarak Madde Cevaplarına Yönelik Geri Bildirim

n

= -:===========

saı:ııama

[rxf -cı: :ı>'] [tv;ı _ ']

Öğrencilerin her test maddesine verdiği cevaplar ve bu cevaplar yanlış ise doğru

cevaba yönelik aşağ ı daki gibi (Çoktan seçmeli testter için) ciye detaylı dönüt sağ lan abilir.

469(4 ·-

o.

Test $Qmıçlıırınm >'onımlanmas, re (;eri 8ilılirim

1. Her iki uygulamaya ait test

puan l arın ın

aritmetik

81

82

Öğretiı,u/e Ölçme ,·e Değe.rler,dinr,e

SINIF-İÇİ UYGULAMA- FORM 2

ortalamalarını

hesaplay ın ı z.

Lise 2. sınıf matematik dersinde bir çoktan seçmeli test 30 öğrenciye 15gün ara)'1a 2 kez uygulanmıştır. Öğrencilerin her iki uygulamadan aldık lan test puanları aşağıda sunulmuştur.

2. Her iki uygulamadan elde edilen test puanların a ait standart sap• maları hesapl ayın ı z.

3. Her iki uygulamadan elde edilen test puan ların ı Z standart puanlarına dön üştürünüz ve Z standart pua nl arının aritmetik ortalama ve standart sapmasın ı hesaplayınız .

Qiirenci 1 2 3 4 5 6

4. Her iki uygulamadan elde edilen test puanların ı T standart puan• farına dönüştürünüı: ve T standart puanl arının aritmetik ortalama ve standart sapmasını hesaplayınız. 5. 20. Öğrencinin 1. Uygulamaya ait Z standart puanını yorumlayı­

1 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

nız.

6. Her iki uygulamadan elde edilen puanlar arasındaki korelasyonu hesaplay ıp yorumlayın ı z .

1.U~g. Puanı 1 X

9 10 8

6 10 5 10 9 1 10 8 5 1 5 6 1 6 1 8 12 6 3 6 15 8 9 8 11 8

7

2.U~g.

Puanı 1

Y

11 12 6 5 12 5

9 8 6 11 9 6 6 4 6 5 5 5 1 14 4 5

7 10 6 6 11 1 8 10

Yukarıdaki verilerden faydalanarak aşağıda istenilenleri bulunuz.

92

93

·-·> ·-

o.

Test $Qmıçlıırınm >'onımlanmas, re (;eri 8ilılirim

1. Her iki uygulamaya ait test

puanlarını n

aritmetik

Öğretiı,u/e Ölçme ,·e Değe.rler,dinr,e

84

83

SINIF-İÇİ UYGULAMA- FORM 3

ortala mal arın ı

hesaplay ın ı z.

Lise 2. sınıf matematik dersinde bir çoktan seçmeli test 30 öğrenciye 15 gün aray1a 2 kez uygulanmıştır. Öğrencilerin her iki uygulamadan aldık lan test puanları aşağıda sunulmuştur.

2. Her iki uygulamadan elde edilen test pua nların a ait standart sap• maları hesapl ayın ı z.

3. Her iki uygulamadan elde edilen test puan l arın ı Z standart puanlarına dön üştürün ü z ve Z standart puan l arının aritmetik ortalama ve standart sapmasın ı h esaplay ı nız .

Qiirenci 1 2 3

4. Her iki uygulamadan elde edilen test puanlarını T standart puan• farına dönüştürünüı: ve T standart puanl arının aritmetik ortalama ve standart sapmas ı nı h esaplayını z .

4

5 6 1 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

5. 20. Öğrencinin 1. Uygulamaya ait Z standart puanını yorumlayı­ nız.

6. Her iki uygulamadan elde edilen puanlar aras ındaki korelasyonu hesaplay ıp yoru mlayın ı z .

1.U~g.

Puanı 1

6 7 12 6 10 5 10 9 7 10 8 5 7 5 5 7 6 1 8 9 6 3 6 15 8 9 8 11 8 7

X

2.U~g.

Puanı 1

Y

9 6 15 3 12 5 7 8 3 8 9 6 3 4 4

5 5

5 7 12 4

5 7 10

6 6 7

1 8 10

Yukarıdaki verilerden faydalanarak aşağıda istenilenleri bulunuz.

95

94

·-·> ·-

o.

Test $Qmıçlıırınm >'onımlanmas, re (;eri 8ilılirim

1. Her iki uygulamaya ait test

puanlarını n

aritmetik

86

85

Öğretiı,u/e Ölçme ,·e Değe.rler,dinr,e

SINIF-İÇİ UYGULAMA- FORM 4

ortala mal arın ı

hesaplay ın ı z.

Lise 2. sınıf matematik dersinde bir çoktan seçmeli test 30 öğrenciye 15 gün ara)'1a 2 kez uygulanmıştır. Öğrencilerin her iki uygulamadan aldık lan test puanları aşağıda sunulmuştur.

2. Her iki uygulamadan elde edilen test pua nların a ait standart sa p

4

maları hesapl ayın ı z.

3. Her iki uygulamadan elde edilen test pu an ların ı Z standart puanlarına dön üştürün ü z ve Z standart puan l arının aritmetik ortalama ve standart sapmasın ı h esaplay ı nız .

Qiirenci 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

4. Her iki uygulamadan elde edilen test puanlarını T standart puanlarına dönüştürünüı: ve T standart puanl arının aritmetik ortalama ve standart sapmas ı nı h esa p layını z . 5. 20. Öğrencinin 1. Uygulamaya ait Z standart puanını yorumlayı­ nız.

6. Her iki uygulamadan elde edilen puanlar aras ındaki korelasyonu hesaplay ıp yorumlay ını z .

29 30

1.U~g.

Puanı 1

6 7 8 3 4 5 7 9 7

X

2.U~g.

Puanı 1

5 7 6 3

10

5

8 3 4

9 2 3 4 1 1

5 2 1 6 7 8 9 4 3 6 7 8 9 8 9 8 7

Y

5 6 9 3 2

5 5 5 7 4 3 7

6 6 6 7 7 8

5

Yukarıdaki verilerden faydalanarak aşağıda istenilenleri bulunuz.

97

96

·-·> ·-

o.

Test $Qmıçlıırınm >'onımlanmas, re (;eri 8ilılirim

1. Her iki uygulamaya ait test

puanlarının

aritmetik

87

Öğretiı,u/e Ölçme ,·e Değe.rler,dinr,e

88

SINIF-İÇİ UYGULAMA- FORM 5

ortalamalarını

hesaplayın ı z.

Lise 2. sınıf matematik dersinde bir çoktan seçmeli test 1O öğrenciye 15 gün ara)'1a 2 kez uygulanmıştır. Öğrencilerin her iki uygulamadan aldık lan test puanları aşağıda sunulmuştur.

2. Her iki uygulamadan elde edilen lest puanların a ait standart sapmaları hesapl ayınız.

3. Her iki uygulamadan elde edilen test puanlarını Z standart puanlarına dönüştürünüz ve Z standart puan l arının aritmetik ortalama ve standart sapmasını hesaplayınız . 4. Her iki uygulamadan elde edilen test puanların ı T standart puanların a dönüştürünüı: ve T standart puanl a rının aritmetik ortalama ve standart sapmasını hesaplayınız. 5. 20. Öğrencinin 1. Uygulamaya ait Z standart puanını yorumlayı­ nız.

6. Her iki uygulamadan elde edilen puanlar arasındaki korelasyonu hesaplayıp yorumlayın ı z.

Öğrenci

1.U~. Puanı 1 X

1 2 3 4

6 6

2.UJl:g.

8

5

2 4

6 7 8 9 10

7 8 7 7

5

Yukarıdaki

Puanı 1

Y

6 6 7 3 2 5 6 7 3 5

verilerden faydalanarak aşağıda istenilenleri bulunuz.

1. Her iki uygulamaya ait test

pua nlarının

aritmetik

ortalamalarını

hesaplayın ı z .

2. Her iki uygulamadan elde edilen test puanlarına ait standart sapmaları hesaplayın ı z.

3. Her iki uygulamadan elde edilen test puanlarını Z standart puanları na dönüştürünüz ve Z standart puanlarının aritmetik ortalama ve standart sapmasını hesaplayınız. 4. Her iki uygulamadan elde edilen test puanlarını T standart puanlarına dönüştürünüz ve T standart puanlarının aritmetik ortalama ve standart sapmasını hesaplay ını z . 5. 1O. Öğrencinin 1. Uygulamaya ait Z standart puanını yorumlayı­ nız.

6. Her iki uygulamadan elde edilen puanlar arasındaki korelasyonu hesaplayıp yoru mlayın ı z.

98

99

·-·> ·-

o.

Test $Qmıçlıırınm >'onımlanmas, re (;eri 8ilılirim

89

SINIF-IÇI UYGULAMA- FORM 6 Lise 2. sınıf matematik dersinde bir çoktan seçmeli test 1O öğrenciye

15 gün arayla 2 kez uygulanmıştır. Öğrencilerin her iki uygulamadan aldıklan test puanları aşağ ıd a sunul muştur . Ö~renci

1.Uİ9 . Puanı,

1

8

2

7 9

3 4 5 6

2.U:i,!g,

X

Puanı 1

4 5

7

8

5 6 8 6 8

5 4 3

9

7

2

10

6

4

7

Y

4

2

Yukarıdaki verilerden faydalanarak aşağıda istenilenleri bulunuz.

1. Her iki uygulamaya ait test puanlarının aritmetik ortalamaların ı hesaplayınız.

2. Her iki uygulamadan elde edilen test puanlarına ait standart sapmaları hesaplayınız .

3. Her iki uygulamadan elde edilen test puanlarını Z standart puanları na dönüştürünüz ve Z standart puanlarının aritmetik ortalama ve standart sapmasını hesaplayınız.

4. Her iki uygulamadan elde edilen test ları na dön üş türünüz

ve T standart

ve standart sapmasını

puanlarını

puanların ın

T standart puan-

aritmetik ortalama

hesaplayınız.

5. 1O. Öğrencinin 1. Uygulamaya ait Z standart puanını yorumlayı­ n ız .

6. Her iki uygulamadan elde edilen puanlar arasındaki korelasyonu hesaplayıp yorumlayın ı z .

101

100

·-·> ·-

o.

____________

92

Ö[;retümle Ölçme ~·e Dt.'ğcrlc,,dimıe

__,

Bu ünitenin yeterli düzeyde anlaşılması için

l üNiTE4

"Öğretimde ölçme ve değerlendirme ile ilgili temel kavramlar ve Test Sonuçlarının Yorumlanması ve Geri Bildirim" ünitelerinin ôğrenilmesi gerekmektedir.

ÖLÇÜMLERİN GÜVENİRLİĞİ VE STANDART HATASI

ÖLÇÜM LERİN GÜVENİ RLİĞİ VE STANDART HAT ASI Bu ünitede. ölçümlerin güvenirliğinin ve ölçmenin standart hatası~~n (?iğer bir ifadeyle, hata puanlarının standart sapmasının) nasıl keslınl ebıle­ ceğ i ne

ÖLÇÜMLERiN GüVENIRLl~I Güvenirtiğin Anlamları (Hassasiyet, iç-tutarlıl ık, Tutarlılık ve Karartı­

yönelik açıklamal ar yer almaktad ır.

ÖLÇÜM LERİN GÜVENİ RLİĞİ

lık)

Klasik Test Teorisinde Güvenirlik Ölçmede Hala Türteri (Sabit, Sistematik ve Tesadüfi Hata) Güveniı1ik Kestinne Yöntemleri Test Tekrar-Test Yöntemi Tek Form Yöntemi Alternatif Form Yöntemi iç Tutarlılık Katsayıları Testi Yarılama Yöntemi KR,o Güvenirlik Katsayıs ı Alfa Güvenirlik Katsayıs ı ÖLÇMENiN STANDART HATASI

Soru: Bir test uygulayıcısının, "test puanlarındaki tesadüfi hatalar çok sizin için ne anlam ifade etmektedir? Kısaca yazınız .

düşüktür" demesi

Soru:

Yapmış olduğunuz

gerçeği yansıtma

bir testle ilgili olarak size, "test puanlarınızın düzeyi nedir?" sorusu sorulursa, bu sorudan ne anlar-

smız? Kısaca yazınız .

Hesaplanması

Yorumlanması

Gerçek Puan için Güven Aralığının Bulunması Öğrenci Başarısını Değerlendirmede Ölçmenin Standart Hatasının Ku llanımı Güven irti ği

Etkileyen Faktörter Testin Uzun luğu ve Test Soru ların ın Kalitesi Zaman Testin Güçlüğü ve Denekler için örnekleme Hatası

Bu ünitede, güvenirtik kavramı klasik test kuram ına göre açıklanmakta ve güvenirtik kestirimlerinde de klasik test kuramına Qöre gel iştiril en y!5ntemler açıkl anmaktadır. Klasik test kuramında göreoeh anlamda gu ve n ırl ı k kestirilrr. Göreceli anlam demekle kastedilen bireyler arasındaki gerçekte var olan fa rklılıkl arı n ölçümlerimizde de en uygun şeki lde gösterilmesidir. Yani ölçülen değişken bakımından bireyler arasındaki sıralamanın en doğru şekilde yapılması amaçlanmaktadır. Ölçümlerimizin klasik test kuramından faydalanarak hesaplanan güvenirtiğinin yüksek olması demek ö lçümlerimizdeki tesadüfi hataların az olması demel ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·e St,ııultırl HltttlSJ

93

Ö[;retiımle Ölçme ~·e Dt.'ğcrlc,,dimıe

94

Öğrenci başarısını değerlendirirken, öğrencilerin sınav puanlarından

Güvenirliğin bir anl amı da ölçümlerin tutarlılığı veya kararlılığıd ır. Aynı sınav kBğıtlarını okuyan iki veya daha çok öğretmen in. kBğıtlara verdikleri puanların benzerliği de güvenirlik (puantayıcılar-arası güvenirtik)

faydalanmaktayız. Bu nedenle, sınav puanlarının yani ölçümlerimizin güvenirli ği yeterli olmalıdır. Yap ılan sınavlardan elde edilen ölçümlerin güvenirtiği, öğrencinin başarısı ha kkında verilecek yargıların doğruluğunu etki-

göstergesi o lur. Öğrencilerde aynı değişkenin (zeka gibi) tekrar tekrar ölçülmesi sonucunda karartı bir şekilde aynı ölçümlerin elde edilmesi de güvenirliğin bir göstergesidir. Uzun sürede değişmeyen yapıdaki deği şkenl e­ rin belli aralıklaı1a tekrar ıekrar ölçülmesi sonucu elde edilen sonuçlar benzer olduğunda ölçümlerin kararlı olduğu veya kararlı bir şekilde ölçüldüğü yorumu yapılır. Pratikte, özellikle eğitimdeki ölçmelerde, hemen hemen hiçbir zaman mükemmel şekilde tu tarlı veya karartı ölçümler elde etmek pek mümkün olmaz. Öğrenci başarısını değerlendirmede kullanılacak olan sınavlardan elde edilen ölçümlerin güve n irliğ i nin yüksek olması , yapılacak değerlen ­ d irmelerin daha sağlıklı olması açıs ından önemlidir. Güveni rl iği çok düşük ö lçümlerden fayda l anılarak yapılan değerlendi rmeler eğiti m sisteminin kusurlann ı ve eksikliklerini yans ıtma ve isabetli eğiti msel kararlar verme şan ­ sımızı azaltacaktır. Ölçme ve değerlendirmede önemli sorunlardan biri de ö lçümlerimizin güvenirliğinin ne düzeyde old uğunu belirlemektir.

ler. Ölçmede, öğrencilerin cevap kBğıtlarını farklı kişiler okuduğunda, önemli bir düzeyde farklı puanlar veriyorlarsa, bizim bu puanlara güvenimiz azalır. Çünkü aynı cevap k§ğıtlarına farklı puanlar verilmektedir (pua nlayıc ılar-ara sı güvenirlik dü şük tü r). Ayrıca , bir öğ re ncinin sınavı a l d ı ğ ı li!!lIDl ve sınav ortamının öğrencinin s ınav perfonnansını olumsuz bir şe­ kilde etkilememesi arzulanır. Bu arzu sağlandıkça, öğrencilere verilen puanlara güvenimiz artar, aksi durumda azalır. Benzer şekilde, ölçümlerin güvenirliğinin yüksek olması için öğrencilerin bilgi düzeyinde bir yetersizlik olmadığı durumlarda, sorulan sorul arı net olarak anlamaları gerekir. Öğrencilerin gerçek başarısı veya gerçek puanı bilinemediğinden güvenirli ği yani ölçümlerimizin gerçeğ i temsil etme düzeyini dolaylı bir şekilde kestiren yöntemler geli ştiri lmiştir. Bu yöntemler ölçümlerin duyarlı lığı (hassasiyeti), aynı değişken i n tekrarlı olarak ölçülmesi sonucu elde edilen sonuçları n tutarlılı ğı veya daha genel anlamda kararl ılı ğı , aynı özelli ği ölçen sınav soru larına veya duyuşsal alanla ilgili bir ölçme aracında yer alan maddelere verilen cevapların iç-tutarlıl ı ğ ı gibi ölçütlere dayanmaktadır .

Klasik test teorisinde göreceli olarak elde edilen güvenirtik katsayıları­ daha iyi yoru m lanması ve anlaşı l mas ı için ölçmede hata türlerinin iyi a nlaşılmas ı gerekmektedir. nın

Güvenirliğin Anlamları

(Hassasiyet, İç-tutarlılık, Tutarlılık ve Kararlılık)

Ölçmede Hata Türleri

Güvenirl iğin bir anlamı hassasiyet veya duyarlılıktır. Duyarlılıkla kastedilen, ölçme aracının daha fazla ayrıntıları ölçebilmesidir. Ölçme aracının daha fazla ayrıntıları ölçebilecek nitelikte olması ölçümlerdeki tesadüfi hala miktarını azaltıp ölçümlerimizin gerçeği yansıtma düzeyini arttırır. örneğin 5 sorudan oluşan bir kısa cevaplı sınav yerine aynı içeriği ölçen 20 sorudan olu şan bir kısa cevaplı sınav daha duyarlı ölçümler vereceğin­ den dolayı daha güvenilir olur. Bir ölçme aracının hassasiyet veya duyarlılık düzeyinin artması, o ölçme arac ın dan elde edilecek puanla rın güve-

Ölçümlere karışan hataları çok genel olarak sistematik ve sistematik olmayan halalar diye ikiye ayırmak mümkündür. Sistematik hatalar daha ziyade bir sonraki ünitede sunulacak olan ölçümlerin geçerliği ile ilgilidir. Teorik olarak da olsa, sistematik halaların kaynakları tanımlanabilir. Ölçümler sistematik hala içermedikçe geçerliği yüksek olur. Sistematik olmayan hatalar ise tesadüfi hatayı içeren ölçümlerin güvenirliği ile ilgilidir. ö lçümlerimize, ölçme araçlarında n, ölçme araçlarının uygulan ması ve puanlanmasıyla ilgili durumlardan, testi alan öğ rencileri n bazı özelliklerinden vb. durumlardan dolayı, hata puanları karışmaktadır. Ölçme teorisinde hatalar farklı şekillerde sın ıflandırılmaktad ır. Bu sın ıflandırmal arda n biri h ataları sabit, sistematik ve tesadüfi olmak üzere üç gruba ayırır.

nir1iğinin artmasını sağlar. Güvenirliğin bir anlamı da ölçümlerin iç-tutarlılığıdır. Aynı niteliği ölçen birden çok test maddesinden elde edilen madde puanların ın tutarlı olması beklenir. Örneğin (tek boyutlu olan) belli bir konuya karşı (ülkenizdeki yabancılara , ma temati ğe, paraya karş ı gibi) tutumu öl çüyorsanız , bu ö lçekte yer alan maddelere bireylerin vereceği cevaplar arasında tutarlılık varsa yani madde puanları aras ında pozitif ve yüksek korelasyonlar varsa elde edilecek tutum pu anl arın ın i ç-tutarlılığ ı yani güveni rliği yüksek olur.

104

105

·-·> ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·e St,ııultırl HltttlSJ

96

9S

a) Sabit hata

Ö[;retiırule Ölçme ~·e Dt.'ğcrlc,,dimıe

c) Tesadüfi (rastgele) hata

Tüm ölçümlerdeki hata miktarının aynı olmasıdır. Yani sabit hatada yapılan hata miktarı hep aynı kalmaktadır. Başka bir ffadeyle, sabit hata bir ölçmeden diğeri ne m iktarı değişmeyen hatadır. Bir terazinin herkesi 2 kg daha fazla !artmas ı g ibi. Bir öğrelmenin herkese 5 puan fazladan vermesi suretiyle yaptığı hata da sabit hatadır. Çünkü bu şekilde yapılan hata miktarı her öğrencide aynıdır. Sabit hata ölçümler arasındaki sıralamayı

Tesadüfi hatada yapılan hatanın ka ynağı bilinmez. Söz konusu hata• nın tesadüfen olduğu varsayılır. Tesadüfi hatanın en önemli özelliği; hata• nın hem pozitif hem de negatff yönde olacağıdır. Tesadüfi hatada bir sistemalik yoktur. Bu sebeplen dolayı teorik olarak aynı değişkene ait ölçümlerin sayısı arttıkça hata puanlarının orta lamas ı sıfıra yaklaşır. Öğrenci başarılarını ölçmek amacıyla yapılan sınavlarda, sabit, siste• matik veya tesadüfi hata türlerinden herhangi birinin ya da hepsinin birden mevcut olma ihtimali vard ır.

değ iştirmez .

Sabit hata sonucu ölçümler arasındaki sıra ve bu s ıralann birbirine göre konumu (yakınl ığı veya uzaklığı) değişmeyeceği nden, sabit hata göreceli anlamda hesaplanan güvenirlik katsayısını etkilemez.

Eğitimdeki ölçmelerde, ölçülen değişkenin soyut olması ve ölçme örneklemi gibi nedenlerden dola yı ölçümlerimizde her zaman bir hatanın özellikle tesadüfi hatanın olacağı kesindir. Örneğin sınav anında öğrenci­ nin fizyolojik ve psikolojik durumu bir tesadüfi hata kaynağı olur. Ölçmede bu tesadüfi hatanın miktarının tahmin edilmesi istenir. Klasik test teorisinde. ölçümlerin güvenirliğini kestirmede ve yorumlamada birbiriyle il işkili iki islatistikten faydal anılmaktadır.

b) Sistematik hata Hata miktarının gözlemden gözleme, durumdan duruma, nitelikten ni• tel i ğe fa ı1d ılı k göstermesidir. Sistematik hatada yap ıl an hata miktarı herkes için ayn ı değild ir. Bir terazinin bazı ağırlıkları 3 kg razla !artarken bazılarını 2 kg razla tartması gibi.

Bunlar:

Sabit hata veren bir ölçme aracını n rarklı sayıl arda tekrarlı kullanım ı da sistematik hatayı doğurur. örneğin. 4 kg olan bir ağırlığı 5 kg olarak tartan bir tartı taşının 2 kere kullanımında (8 kg ağırlığa 1O kg denir) ölçümlerdeki hata 2 kg olur. 3 kere kullanıldığında (12 kg olan ağırlı ğa 15 kg denir) ölçümlerdeki hata 3 kg olur. Yani bu tartı taşın ın fa rklı sayılard a tekrarlı olarak kullan ımı sonucunda elde edilen ölçümlerdeki hata sistematik hata olur. Bu örnekte ağırlıklar arasındaki sıralama deği şmese bile ağırlık• lar arasındaki rark deği şir (4 kilo ile 12 kilo arasındaki raı1< gerçekte 8 kilo iken ölçümlerimizde 10 kilo olur). Bir öğretmenin yazılı yoklama sınav1annı puanlaı1 ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·e St,ııultırl HltttlSJ

98

97

Ö[;retiımle Ölçme ~·e Dt.'ğcrlc,,dimıe

Klasik Test Teorisinde Güvenirlik

ı

Eğitimde başarıyı ölçmede; ölçme yapan kişinin temel amacı mümkün oldukça hatasız ölçümler elde etmektir. Ölçme sonuçlarında yanlılığın veya sistematik hatanın olmad ığını ve aracın oevap anahtarının yanlış olması, sınavda yoklanacak hedef davranışların uygun bir şek il de örnekıenmemesi, veya herkese aynı miktarda hatalı puan verme gibi durumlardan kaynaklanan sabit bir hatanın yap ıl mad ı ğ ı varsayılırsa, ölçümlerimiz; ölçülen değ i şke ne ait gerçek puanla tesadüfi hata puanının toplamından ibarettir. Bu durum aşağıdaki eşitlikte görülmektedir.

Pxr

2

ur

2

Ur

= u2X = u2r + u2E

/GOveniıfik Katsayısı =Gerçek Puan Vaıyansı /

Gi!zlenen Puan Varyansı}

p~ = Gerçek puanlar1a gözlenen puanlar arasındaki korel8syonun karesi, güvenirlik katsayısı

GI=Gerçek puanlar varyansı q}= Gözlenen puanlar varyansı qf= Hata puanları varyansı

X=T+E (Gözlenen puan= Gerçek puan+ Tesadüfi Hala puan~

Güvenirlik katsayıları model sayıltıl arı sağland ığ ında O ile 1 arasında bir değer alır. Güvenirtik katsayısı 1'e yaklaştıkça güvenirli ğin yüksek olduğ u, O'a yaklaşt ıkça g üveni rl iği n düş ük olduğu anlaş ılır. Teorik olarak, ölçümlerin güven irli ği mükemmel olduğunda öğrencilerin gerçek puan sıra­ l amaları elde edil miş olur. Klasik test teorisinde, güvenirlik katsayısının değeri, testi alan gruba bağlıdır. Güvenirliğin klasik tanımı: Ölçümlerin tesadüfi hatalardan arınık o lma derecesidir. Bu tanımdan da anlaşılacağ ı üzere ö lçümlerin güveni rl iği ile tesadüfi hata mi ktarı arasında ters yönlü bir ilişki vardır. Ölçümlerdeki tesadüfi hata miktarı az oldukça bu ölçümlere ait güvenirtik katsayısı yüksek olur. Ayn ı şekilde ölçümlerdeki tesadüfi hata miktarı çok oldukça ölçümlerin güve nirl iği aza lır.

Buradaki "X" öğrencinin gözlenen puanını, "r öğrencinin gerçek puanını ve "E• ise puanlara karışan tesadüfi hatayı ifade etmektedir. Klasik test teorisinde güvenirlik tesadüfi hataya odaklanı r. Bu eşitlik; (a) ölçme hatas ının gerçek puanla korelasyonunun sıfır (p,.= O) olduğu ve

(b) hatanın tesadüfi olduğu varsayımına dayanmaktadır. Klasik testteorisinde tesadüfi hataların toplamının beklenen değeri s ıfırdır. istatistikte, korelasyonun genel bir simgesi olan 11 r'1 kestirilen güvenirlik katsayıs ını ifade etmede kullanılmaktadır. Güvenirtik katsayıları 0-1 arasında değerter almasına rağmen bir korelasyon katsayısıdır. X puanlarının kestirilen güvenirliği ise, "rx" olarak gösterilmektedir. Aynı testin iki kere uygulanmasıyla elde edilen ölçümler aras ındaki korelasyonla kestirilen güvenirlik katsay ı sı r,..- ite gösterilir. Benzer şekilde , bir testin iki paralel formunun (Form A ve Form 8) uygulanmas ın dan elde edilen ölçümler arasındaki korelasyon katsayısının hesaplanması ile kestirilen güvenirlik katsayıs ı rA8 simgesiyle gösterilmektedir. Klasik test teorisine göre güvenirlik, gerçek puanlarla, gözlenen puanlar arasındaki koreı:.syonun karesidir. Bu tanım r!,T olarak simgeleş• tirilmektedir. Gerçek puanlarla gözlenen puanlar arasındaki korelasyonun karesi olarak tanımlana n güvenirlik katsay ısının; gerçek puan varyansı­ nın, gözlenen puan varyansına oranı olduğu psikometristter tarafından (bazı varsayımlar altında) kanıtlanm ıştır. Gerçek puan ve hata varyanslarından faydalanarak tanımlanan güvenirlik katsayısının formülü (evren parametreleri simgeleriyle) aşağ ıda verilmiştir (Lord & Novick, 1968).

108

109

·-·> ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·t St,ııultırl HitltlSJ

100

99

Öğrdim,le Ölçme ve Degerlcndirmt

1. Tek Form Yöntemi: Tek bir test formu belli bir zaman aralığı yla iki kez aynı öğrencilere uygulanır. iki uygulama sonucu, elde edilen ölçümler arasındaki korelasyonun hesaplanmasıyla güvenirtik kestirilir. Tabii ki, ayn ı grup üzerinden elde edilen bu ölçümler arasındaki uyum veya benze rliğin (istatistiksel olarak) derecesini bize korelasyon tekniği verir.

Güvenirlik Kestirme Yöntemleri Ölçümlerimizin güvenirlrğini somut olarak ortaya koymak veya sayısal bir değer olarak beliı1emek amacı yla bazı güvenirlik kestirme yöntemleri geliştirilmiştir.

Bir ölçme aracının; (a) uygulanı ş sayıs ın a (tek veya çoklu uygulama), (b) ölçme aracını puanlamada k ulla nılan yönteme ("0-1" veya dereceleme yöntemi vb) (c) ölçülen değişkeni n boyut sayı sına (tek veya çok boyutlu gibi) ve

Tek form vöntemivle aüvenirlik kestirme asamalan 1. Testin bir gruba u ygulanması. 2. Belirti bir zaman geçtikten sonra, aynı testin aynı gruba tekrar uygu lan ması .

3. iki uygulamadan elde edilen ölçümler arasındaki korelasyon kat-

(d) uygulanan ölçme teorisine (klasik test teorisi, genellenebilirtik teorisi, madde tepki teorisi) göre kullanılan güvenirlik kestirme yöntemi deği ş­ mektedir. Aşağıda klasik test teorisinde, test tekrar-test ve iç-tutarlılık katsayıl a rı yl a güvenirlik kestinne yöntemleri sunu lmaktadır.

sayısının hesaplanması. katsayıs ının yorumla nmas ı.

4. Elde edilen korelasyon

Tası ı

Tası ı

a) Test Tekrar-Test Yöntemi Test tekrar-test yöntemi kararlılık anlamındak.i güvenirlik katsay ıs ı­ nın elde edilmesine yönelik bir yöntemdir. Bu yöntemle aynı değişkenin birden çok ölçülmesi sonucu elde edilen ölçümler arasındaki benzerlik veya ilişkiyi belirleyerek ölçümlerin güvenirli ği kestirilir. Test tekrar-test yöntemleri, aynı denekler üzerinden aynı konuda birden çok ölçümün yapılması sonucu elde edilen ölçümler arasındaki korelasyon ka tsayısının hesapla nmasıyla güvenirliği kestiren yöntemlerdir. Anlaşılacağı üzere, test-tekrar test yöntemlerinde, tekrar tekrar aynı değişkenin ölçülmesi söz konusudur. Aynı değişken tekrar tekrar ölçül düğünde elde edilen ölçümler arasındaki benzerlik, korelasyon tekniği ile hesaplanabilir. Uygun ko• reıasyon tekniği ile hesaplanan bu katsayı her bir uygulamadan elde edilen ölçümlerin güvenirliğini ifade eder. Test tekrar test yöntemi; tek form ve alternatif form yöntemi olarak uygulanmaktadır.

Uygulama 1

Uygulama 2

Güvenirlik Kestirimi

Uygulama 1 ve Uygulama 2'den elde edilen ölçümler arasındaki korelasyon katsayıs ı (r,.•)

Test tekrar-test yöntemlerinden tek form yöntemiyfe güvenirlik katsayısı kestirilirken (diğer bir ifadeyle aynı ölçme aracının iki kez uygulamasınd an elde edilen ölçümler arasındak i koreliısyonla güvenir1ik katsayısı

kestirilirken) sağ lanması gereken iki temel

koşu l vardır:

Koşul 1: iki uygulama arasında geçen süre içinde, öğrencilerin

ölçülen değişkene ait gerçek puanlarında bir değişikliğin olmaması.

Koşul

2: Birinci uygulamanın, ikinci uygulamadan elde edilecek etkilememesi.

puanı

Pratikle, yuk ar ı daki iki koşu lun da sağland ı ğı durumlara çok az rastlaBirkaç sebepten dolayı , iki uygulama arasında geçen sürede öğrenci­ lerin gerçek puanları sabit kalmayabilir. Yani, ikinci ölçmede •unutma" nır.

ili

110

·-·> ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·t St,ııultırl HitltlSJ lOJ

102

veya "'öğrenme düzeyinde bir artışın olması" söz konusu olabilir. Aynı şe­ kilde. ilk uygulamada sorulara verilen cevap veya sorulann doğru cevap-. larının ikinci uygulamada hatı rtanması ve dolayısıyla ikinci uygulamada gerçek puan değ işmese bile daha çok puan alma durumu söz konusu olabilir. Aynı test formunun iki kez uygulanmas ıyla elde edilecek ölçümler aras ın­ daki farklılıkla rın , yukarıda belirtilen iki etkiden kaynaklanan değişkenl iğ in bir göstergesi veya ölçme aracını n güvenirtiğinin düşük olmasının bir göstergesi mi? olduğu dikkate alınarak yorumlanmalıdır. Tek form yöntemi, zaman içerisinde kolayca değişmeyen yapıdaki değişkenleri ölçmede, güvenirliği bulma için kullanımı uygun olan bir

Öğrdim,le Ölçme ve Degerlcndirmt

Soru:

Bir edebiyat öğ retmeni bir hafta arayla öğrencilerin kompozisyon yazma becerilerini (ay nı konuda kompozisyon yazdırarak) 2 kez ölçm ü ş­ tür. Elde ettiği ölçümler aşağıda sunulmuştur. Öğrencilerin kompozisyon yazma becerilerini ya ns ıtan ölçümlerin g üvenirt iğin i hesaplayıp yorumlayı• nız.

Öğrenci

tekniktir.

iki uygulama koşu l u ndaki ölçme i şlem ve ortaml arının farklılığ ı da neden olabilir: Puanlama hataların ın olmas ı , şans başarısı , öğrencilerin işaretleme hataları yapmaları, vb. gibi durumlar hata kaynağ ı olabilir. Aynı test formunun kullanı l mas ı yl a, test tekrar-test yöntemiyle kestirilen bu güvenirtik katsayısına •kararlılık katsayısı· (ooefficient of stability) denir. Güvenirli ğin düşük olmasına

İlk ölçüm ıxı İkinci öl~üm {Yl

Nuray Efay Lara izel Nil

9

Ulaş

7

7

Buket

6

8

Barış

6

8

Emir Bir1can

7

7

9

8

8

9 8 9

9

8

8

6

9

Mine

6

7

Erdal

7

8

Sevil

8

7

Selim Kubilay Sevda Olcay Ekrem

9

5

8 6

6

7

7

7 9

8

Nurhayaı

7

7

hayda

8

8

Korelasyon Katsay ı s ı : .................... . Yorum: .......... ......... .......... ..... .... .

112

113

·-·> ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·t St,ııultırl HitltlSJ l03

104

2. Alternatif (Eşdeğer, Paralel) Formlar Yöntemi: Test tekrar ıest yöntemlerinden altemalif form yönteminde de aynı değişken genelde iki kez ölçülür. Her iki ölçmede elde edilen puanlar arasındaki korelasyonun hesapla nmasıyla ölçümlerin güvenirliği kestirilir. Alternatif form yönteminin tek form yönteminden farkı; ikinci uygulamada aynı test yerine bu testin paraleli olan bir başka testin kullanılmasıd ır. Yani ilk uygulamada paralel testlerden biri uygulanır ve ikinci uygulamada da paralel testin diğeri

Aite mat~ form yöntemiyle elde edilen güvenirlik katsayısı ölçmede "kararlılık ve eşdeğerlik" (coefficient of stability and equivalence) anlamında bir güvenirlik katsayısını ifade eder. Eğer elde edilen korelasyon, yani güvenirtik katsayı sı, yüksek ise ölçümlerin karartı oldukları ve dolayı­ sıyla güvenilir oldukları anlamı ç ıkar. Hesaplanan korelasyonun yüksek olması (aynı zamanda) test forml arının eşdeğer oldukları anl amına da gelir, Anlaşılacağı üzere alternatifformlar yöntemi, tek form yönteminde sağlan­

uygul anır.

ması gereken koşullardan sadece birinci uygulamanın ikinci uygulamadan elde edilecek puanı etkilemesi koşulunun sağlanması sorununu gidennektedir. iki uygulama arasında geçen sürede, öğrencilerin gerçek puanlarında bir değişiklik olmamas ı koşulu bu yöntemde de sağlanmalı­

Furr ve Bacharach (2018) İki testin sadece (a) aynı gerçek puanlar selini ölçtüğü ve (b) aynı miktarda hata veryansına sahip olmal arı durumunda eşdeğer veya paralel testler olabileceğ ini belirtmektedir. Pratikte iki test formu mükemmel eşdeğeıtiği sağlamaz. Ölçülen gerçek puanlarda ve ölçmeye karışan rastgele hata mi ktarl arında testten teste farklı lı k görülebilir. Paralel formlar ol uştu rulurken öncelikle. aynı davranışları ölçen farklı sorular hazırlan malıdır. Bu testlerin paralel olma duru m ları, birinci ve ikinci uygulamadan elde edilen puanlara ait aritmetik ortalamaların ve varyansların farklılığın ın (hipotez testiyle) test edilmesiyle kontrol edilebilir.

dır.

Sınıf-içi

Uygulama

Aşağıdaki kavram veya yöntemlere özgün örnekler veriniz ve verdiğiniz örneğin neden doğru olduğunu açıklayınız.

1) 2) 3) 4) 5) 6) 7)

Alternatif form yöntemiyle güvenirlik kestirme aşamaları 1. Test formlarında n birinin bir gruba uygulanması. 2. Belirti bir zaman geçtikten sonra, aynı gruba diğer test formunun uygulanması .

3. İki uygulamadan elde edilen ölçümler arasındaki korelasyon katsayısı­ nın hesap lanması.

4. Elde edilen korelasyon

Öğrdim,le Ölçme ve Degerlcndirmt

Hassasiyet Kararlılık

iç-tutarlılık Sabit hata Sistematik hata Tesadüfi hata Test tekrar-test yöntemiyle güveni ıtiğin kestirimi

katsayıs ının yoruml a nmas ı .

Fonn A

Form§

Gllvenirtik KHtirimi

Uygulama 1

Uygulama 2

Form A ve Form B uygulama l arından elde edilen ölçümler arasındaki korelasyon katsay ıs ı

(r.a)

114

115

·-·> ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·t St,ııultırl HitltlSJ l05

Öğrdim,le Ölçme ve Degerlcndirmt

106

b) İç-tutartılık Yöntemleri

ki, alt testlerde kullanılan maddelerin sayısı az olduğundan dolayı bu güvenirlik katsayısı, öğrencilerin testin tümünden ald ıkları puanların güvenir• liğinin bir alt sınırını verir. Testin tümünden elde edilen ölçümlere ait güve• nirlik katsayısını kestirme yöntemlerinden biri Charles Spearman ve William Brown tarafından geliştirilen Spearman-Brown formülünü kullanmak• tır. Spearman-Brown formülü iki alt test için aşağıda sunulmuştur.

Güvenirlik katsayısını kestiıme yöntemlerinden iç-tutarlılık yöntemleri, testin bir kez uyg ulanması suretiyle güvenirl iğin kestirilmesini içerir. Bu yöntemlerden bazı l arı , testi yarılama , Kuder-Richardson-20 (KR20), Kuder-Richardson-21 (KRı,) ve Cronbach alfa (a) güvenirlik katsayılarıdır. 1. Testi Yarılama Yöntemi (r 11): Testi yarılama yönteminde, iki eş­ değer form tek bir form halinde düzenlenerek uygulanır. Bu yöntemde, öğ­ rencilere tek bir test foımu uygul anıyo rmuş g ibi tek bir oturumda sınav uy-

r =

gulaması yapılır; ama bu test foımu gerçekte iki alt testten oluşur. örneğin

X

20'şer maddeden oluşan (A ve B formu gibi) iki eşdeğer testteki maddelerden, 40 maddelik tek bir test formu belirli yöntemlerle oluşturul abi l ir. Bu yöntemlerden bazıl arı şun l ardır:

2r 11

1 + l°1t

ru = AJt test puanların a ait güvenirlik katsayısını rx = Testin tümünden elde edilen puanlara ait güvenirlik ifade etmektedir.

(a) A formundaki maddelerin ilk 20 maddeyi , B foımundaki maddelerin ise ikinci 20 maddeyi oluşturmas ıyla 40 maddelik tek bir test formunun (C formu gibi) o luşturul ması ,

katsayıs ını

Örnek soru: Testi yanlama yöntemiyle elde edilen g üve nirlik katsayısı (r 11 ) .80 çıkmıştır. (a) Bu katsayı neyi ifade etmektedir? (b) Testin tümünden elde edilen puanlara ait güvenirlik katsayısı kaçt ır?

(b) Tek numaralı maddeler A formuna ve çift numaralı maddeler B formuna ait olacak şekilde tek bir test foımunun oluşturulması. (c) A ve B foımundaki maddelerin test foımlarına konular bazında tesadüfi olarak dağ ı tarak tek bir test foımunun ol uşturulmas ı. Foım l arın tek form olarak düzenlenmesiyle ilgili dikkat edilecek bir nokta da şudur. iki paralel foımdan tek bir test formu oluşturmada kullanı­ lacak yöntemler farklı olabileceğinden, bu yöntemlerden elde edilecek ölçümlerin güvenirliği de farklı olabilir.

(a) Testi yarılama yöntemi ile elde edilen güvenirlik katsayısı (,80) alt test puanlarının güve nirl iğini ifade eder. Her iki alt test puanlarına ait güvenirlik katsayıs ı birbirine eşi t olup .80'dir.

Uygulama bittikten sonra , A ve B gibi 2 test formunun bi rleştiri l mes iyle test formundan öğrencilerin hem A hem de B formundan ald ığ ı puanlar ayrı ayrı hesapl anır. Bu suretle öğrenci lerin iki test foımu ndan (A ve B foımundan) aldıkları puanlar belirlenmiş olur. Öğrencilerin iki alt testten (A ve B formundan) ald ıkları puanlar arasındaki korelasyon katsayıs ı hesapla nır ve bu korelasyon katsayı sı (r11) A veya B foımu ndan (alt testlerden) elde edilen test puanlarının güvenirlik katsay ı sı olarak yorum lanır. Eğer bir test ikiden çok alt testten ol uşacak şekilde d üzen l enmişse (veya tek bir testle aynı davranış için 3 veya daha fazla soru sorul muşsa) alt testler arasındaki tüm olası ikili korelasyon katsayıl arı hesaplanıp, bunların aritmetik ortalaması alınarak r11 katsayı sın ı kestiıme yoluna gidilebilir. Hesaplanm ış olan güvenirlik katsayı sı alt testlerden herhangi birine ait güvenirlik katsayısıdır ve alt testlerin güvenirliklerinin aynı olduğu varsayılır. ol uştu rula n

(b) r

2r

11 x -- ı+r 11 '

r X

=1+(.80) 2(.80) =.89

Testin tümünden elde edilen puanlar alt testlerden elde edilen puanlann toplamıdır. Ölçümlerinin güvenirliği .80 olan bir teste paraleli bir test daha eklendiğinde elde edilen test puanlarının g üveni ~iğ i .89'a çıkmak­ tadır.

Alt test sayısı testi yarılama yönteminde olduğu g ibi iki tane olmayıp, daha fazla olduğunda Speaıman-Brown foımülünün genel hali aşağıda

Testi yarılama yöntemiyle elde edilen korelasyon katsayıs ı öğrencile­ rin sadece tek bir alt testten aldıkları puanların güvenirliğini kestirir. Tabii

su n ulmuştur .

116

117

·-·> ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·t St,ııultırl HitltlSJ l07

108

2. KR20 Güvenirlik Kestirimi: Madde puan ları arasındaki kovaryansfaydalanarak hesaplanan güvenirlik bulma yöntemlerinden biridir. KR20 güvenirlik katsayısı, bir defa uygulanan bir ölçme aracının iç.tutar1ılık ölçüsünü veren bir güvenirlik katsayısıd ır. Testi oluşturan tüm maddeler · 0-1• puanlama yöntemiyle pua nlandığında KRıo formülü uygulanabilir. KR20 ayn ı zamanda bir korel8syon katsayısıdır. Bu korel8syon güven irliğin tanımı gereği bir oranı ifade ettiği için; sayıllılar sağlandığında, ile "1" a rasında değerler alır. Yüksek bir KRıo korelasyon katsayısı ölçme aracını oluşturan maddelerin tek bir değişken i ölçtüğünü, yani tek boyutluluğu da ifade ettiği ölçme ltteratüründe belirtilse de Tan (2009c) ölçülen deği şkenin faktör analizi sonucu çok boyutlu olmasına rağmen KR20 güvenir1ik katsayısının yine de çok yüksek çıkabileceğini bel irtmiştir. Tan (2009c)'a göre, testi oluşturan maddelerin homojen olduğunun bir göstergesi olarak KR,o'nin ku llanılması yanıltıcı olabilir. Bu nedenle tek boyutlu bir deği şke­ nin ölçüldüğü varsayımına d ayalı olan KR20'yi uygulamadan önce faktör analizi uygulanarak testin tek boyutluluğu sağlayıp sağlamadığı kontrol edilmelidir. larından

kr11 rx = - - - - - 1 + (k -1)r11

Buradaki "k" all testlerin

sayısı nı

·o·

ifade etmektedir.

ömek soru: 7 alt testten oluşan bir sınavdan elde edilen puanlar için her bir alt test pua nların ın güvenirlik katsayısı .60 bulunmuştur. Testin tümünden elde edilen puanlara ait güvenirlik katsayısı kaç olur?

r

krıı

x

= - - ' " - --

ı+ (k -l)ru'

rx =

7(.60) 1+(7-1)(.60)

= •91

Belli bir öğretim programında öğrenci başa rılarını ölçmek amacıyla uygulanan bir başarı testi puanlarının KR:ıo g üvenirlik katsayısının çok yüksek çıkması genelde beklenmez. Çünkü öğrencilerin çoğun un ders veya kurs hedeflerini kazanmaları beklenir. Hedeflerin öğ rencileri n çoğu tarafın ­ dan kazanılması durumunda, madde güçlük değerleri yüksek olacak ve hem madde va ryansı hem de test varya ns ı düş ük olacag ından KRıo güvenirlik katsayıs ı pek yüksek olmaz. Kehoe (1995) 10 -1 5 civarı maddeden o l uşan çoktan seçmeli testler için .50 kadar bir KR20 güvenirlik katsayısının yeterli ol acağ ı ve 50 maddenin üzerindeki testler için ise KR:ıo değe rinin en az .80 olmas ı gerektiğ i ni belirtmiştir. Kehoe (1995) ayrıca , bir öğ renci hakk ındaki önemli kararların KR20 g üvenirlik katsayı s ı O.BO'in altınd a olan tek bir teste dayanarak verilmemesi gerektiğini ifade etm i şti r.

Anlaşılacağı üzere, ölçümlerin güvenirliği .60 olduğunda teste benzer nitelikte sorular ekleyerek testteki soru sayısı 7 kat arttırıldığ ında elde edilen ölçümlerin güvenirliği .91 'e yükselmektedir.

Unutmamak gerekir ki, Spearman-Brown formülü, alt testlerin kesin paralellik varsayım ına dayanır. Alt testlerin paralelliği sağlanmadıkça, formülün kullanımıyla elde edilecek olan güvenirlik kestiriminin uygunluğu azalır.

Testi

varılama

vöntemivle aüvenirlik kestirme

Öğrdim,le Ölçme ve Degerlcndirmt

asamaları

1. Eşdeğer iki test fonnu haz ırlay ı n ı z. 2. Testi tek form halinde d üzenleyip uygulayınız . 3 . Her iki form için ayrı ayrı toplam pua nları hesaplayını z. 4. Öğrencilerin test formlarından aldıkları toplam puanlar arasındaki korelasyonu hesaplayınız. 5 . Speannan-Brown formülünü kulla narak testin tümünden elde edilen ö lçümlere ait (kestirilen) güven i rli ğ i hesaplayınız.

118

119

·-·> ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·t St,ııultırl HitltlSJ l09

KRı,o

Güvenirlik

J 10

Öğrdim,le Ölçme ve Degerlcndirmt

Bir maddenin doğru cevaplanma oranı ile (P;l doğru cevaplanmama q; değeri: "1-p;" eşitliği ile hesaplanabilir. Bir maddenin PJ ve q1 değerterinin çarpımı. o

Katsay ı sının Hesaplanması

oranının (q;) toplamı 1.00 olur. O halde Pi bilindiğinde

KR20 güvenirtik katsayısının hesapl anmasında kullan ılan formül aşa­ ğıda sun ulmuştur:

madde puanlarının varyansını verir, sı2 =p1 q1 . Madde puanlarının varyans.

larının toplamı ('f.f=ı P;q; veya f,~ 1 s{) alınarak formülün hesaplanması için gerekli verileri elde etm iş oluruz.

p, q,

+ pzqz + p3q 3 + p,q, + PsQs + ... + PKQK]

K

s'

[

""

']

L.j•l S;

KR20 =İ ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·t St,ııultırl HitltlSJ l l l

J 12

Öğrdim,le Ölçme ve Degerlcndirmt

Bilindiği gibi madde puanları varyansı, maddeyi doğru cevaplayanların oranı (Pj) ile o maddeyi doğru cevaplayamayanların oranının (qj) çarp ı­

3. KR21 Güvenirlik Kestirimi: Testteki tüm maddelerin madde güç/üka /erinin aynı olması durumunda KR20 formülü aşağı da sunulan KR2, formülüne eş it olur. Elimizde sadece test istatistikleri varsa içatu tart ılık anlaa

mına eşittir.

mında güvenirliğin

Birinci madde için varyans: p 1 q1 = (.10)(.90) = .09 olur.

Buradaki; "pı'";

1. maddeyi doğru ceva playanların oranı ve ..q," ise; 1.

maddeyi doğru cevaplayamayan ların ora nıdır, (q 1

KRzı =

= ı - p 1) .

Bu 10 madde için hesaplanan madde puanları varyansları aşağıda hesap-

K [ X(K - X)l K- 1 l KS~

Testteki madde güçlükleri eşit olduğunda hesaplanan KR21 ve KR:ıo değer­ leri eşil çıkar. Testteki madde güçlükleri farklılaştıkça KR21 , KR:ıo değerin­ den daha dü şük çıkar.

l anm ı şt ır:

Pı q,

alt sınırı aşağıdaki KRı, fomıülüyle de kestirilebilir:

= (.10)(.90) = .09

P2q, = (.20)(.80) = .1 6 p3q3

= (.30)(.70) =.21

4- Cronbach Alfa (a) güvenirlik kestirimi: Alfa güvenirlik katsayıs ı tek bir uygulama gerektiren güvenirlik bulma tekniklerinden biridir. Ağırlıklı puanlama veya dereceleme yöntemiyle puanlama uygul andığı dunı mlarda kullanı l abi l ecek bir güvenirlik bulma tekniğ i dir. Testi oluşturan maddelerin dereceleme ölçeğine göre puanlanması (1'den S'e kadar veya O'dan 4'e kadar gibi) genellikle psikomotor becerileri ölçmek amacı yla h azırl anan ölçme araçlarının puan l anmasında veya tutum ölçeklerinin puanlanmasında kullan ıl makla birlikte kı sa cevaplı testler ve yazılı yokl amaların güvenirli ğin i n kestirilmesinde de kull anılabilir. Cronbach alfa katsayı sının kull anım ı için tüm maddelerin ayn ı puanlama öl çeğinde ol ması veya aynı puanlama ölçeğ i ne dönü ştürü lmesi gerekir (yani soru l arın bir k ı smı 4 bir k ısm ı 3 üzerinden puanlan mamalı, pua nlan m ı şsa da hepsi aynı ölçeğe dönüştürül me li veya madde puanları z standart puanlarına dön üştürül me­ lidir),

p.q. = (.40)(.60) = .24 p,q, = (.50)(.50) = .25

P6q6 = (.50)(.50) = .25 p,q, = (.60)(.40) = .24 p9q9 = (.70)(.30) = .21

= (.80)(.20) = .16 p 10q 10 = (.90)(.10) = .09 ve madde varyansl arı toplamı bulunur: p9q9

K

L, p1q1 = .09 + .16 + .21 + .24 + .25 + .25 + .24 + .21 + .16 + .09 =

1. 90

}: l

Cronbach alfa katsayısı KR20 güvenirlik ka tsayısının genelleştiril mi ş bir şeklid i r, Diğer bir anlatımla, KR:ıo güvenirlik katsayısı Cronbach alfa (a) güvenirlik katsayısının özel bir durumudur. Cronbach alfa güvenirlik katsayısı da tıpkı KRıo güvenirlik katsayıs ı gibi bir iç-tutarlılık ka tsayısı­ dır ve O ile 1.00 aras ında değer almaktadır. Crcnbach alfa güvenirlik katsayısı bir iç-tutarlılık katsayısı olduğundan, ölçülen değişken bir boyutlu

Şimdi

test puanlarının güvenirliğini kestimıek için KR20 formülünü uygulayabiliriz:

sf]

1

K [1 - !:f,.,- = 10- 1 - -1.90] = .58 KR20=-K- 1

s?

10 - 1

z2

o lmal ıdır.

Ölçümlerin KR:ıo güvenirlik katsayısı .58 bulunmuştur. Bilindiği gibi KR20 güvenirlik katsayısının minimum değeri -o· ve maksimum değeri ise · 1. 00 "d ır. Testteki soru sayı sın ın (çoktan s~eli test için ) az (10 tane) olmasından dolayı .58 düzeyindeki bu güvenirlik katsayı sı yeterli kabul edilir,

Cronbach Atfa

i ç-tutarlılık katsayı sın ın h esapla nmas ı

için kulla-

nılan fomıül aşağıda sunul muştur.

a = -K- [ı K- 1

Lf..ı sf]

--=-~-'-

s~

a={Madde sayısı//Madde sayısı-1)x/1-(Madde varyansları toplamı/Test varyansı))

122

123

·-·> ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·t St,ııultırl HitltlSJ l13

J 14

ölçümlerin güvenirtik katsayı sı. testi ya rılama yöntemiyle elde edilecek güvenirtik katsayı sına benzer olur. Linn & Gronlund (1995) gerçekte, KR20 ve Cronbach alfa güvenirlik katsayılar ının, test edilen gruplar için mümkün olan tüm testi yarılama yöntemleriyle elde edilecek güvenirtik katsayıları­ nın ortalaması olarak düşünülebileceğ ini belirtmişlerd ir. Haliyle, bu durum oldukça homojen yapı daki bir içeriğin ölçülmesinde test tekrar-test yönle• mini kullanmaktansa, tek uygulama ve tek form gerektiren KR20 veya Cronbach alfa güvenirtik katsayılarıyla g üvenirl iğin kestirilmesini daha avantajlı kılmaktadır. Ölçülecek değişken daha heterojen bir yapıda ise KR20 veya Cronbach alfa güvenirlik katsayılarının kullanımı, testi yarıl ama yönteminden daha düşük bir güvenirlik ka tsayıs ı verir. Bu durumda, testi yarıl ama yönteminin kullanımı daha uygun olur ve daha yüksek güvenirtik katsayısı elde edilir. Kestiri len bir güvenirlik kat sayısı nın , belli bir yöntem sonucu elde edilen güvenirl ik ka ts ayıs ı olarak belirtilmesi gerekir. Çünkü her güvenirtik kestirme yönteminin bazı varsayımları ve özellikleri vardır. Örneğin: test tekrar- test yön temleıi nden "tek form yöntemi' ku llan ıldığı nda. elde edilecek güvenirtik katsayıl arı iki uygulama arasındaki sürenin (5 dk, 1 gün. 2 hafta. 1 ay gibi) uzun l uğuna göre fa rklı lık gösterebilir. Bu durumun tek form yöntemiyle elde edilen güveni rli ğ in yorumunda dikkate alınmas ı gerekir. Yoksa sadece ölçümlerin güvenirtiği şu değerdir gibi bir yoruma gitmek yan ıl tıcı olabilir. K ı saca. güvenirlik ka tsayıs ı kull anılan güvenirlik bulma yöntemine göre yo rumla n malıdır, genel bir güvenirlik katsayı s ı olarak yoru m l a nmamalı dır .

Formüldeki sI2= j. madde puanlarına ait varyansı belirtmektedir.

NOT: Ölçme aracı çok boyutlu olduğunda toplam test puanlannın güvenirliğini kestirmek için Cronbach, Schonemann, and Brennan (1965) tarafından önerilen tabakalanmış affa (Stratified alpha) formülü kullanılabilir.

ö rnek soru: 5 tane yazılı yoklama sorusundan oluşan bir sınav. puanlama yöntemi ku llanı l arak her bir sorudan öğrenci l ere ·o ile 5" arasında puanlar verilmiştir. Öğrencilerin sınavdaki 5 sorudan aldık• !arı puanlara ait standart sapmalar aşağ ı da veril miştir: ağırtıklı

Soru

Sj

1

1.25

2

1.30

3

1.00

4

1.40

5

1.50

Öğrdim,le Ölçme ve Degerlcndirmt

Öğrencilerin sınav puanlarına ait varyans (si) 25 ise bu yazılı yoklama pu a nlarına

ait Cronbach alfa güvenirtik katsayı sı kaç olur?

a = _5_ [ _ (1.25) 2 1 S -1

+ (1.30) 2 + (1.00) 2 + (1.40) 2 + (1.50)2] = _ 25

83

KR,oveya Cronbach alfa güvenirtik katsayıl arı aynı özelliği ölçmek için maddeler arasında ki benzerliğin veya paralelltğin bir derecesini ifade eder. Kapsam bakımından oldukça homojen bir testten elde edilen

yazılan

124

125

·-·> ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·t St,ııultırl HitltlSJ l15

J l6

Ölçmenin Standart Hatası

Yorumlanması:

(Hata puanlarının standart sapması)

Bu esitıikten favdalanarak asaaıdaki soruları cevaoıavın ız Soru 1: Güvenirtik maksimum (r, =1) olduğu nda, S, değeri ne olur? Cevabınız: ...

Hesaplanması:

Bir testten elde edilen puanlardaki hata miktarını belirten diğer bir indeks de ölçmenin standart hatasıdır. Ölçmenin standart halası ölçümlerdeki hata puanları dağılımının birimini ham puan cinsinden kestirir. Bilindiği üzere standart sapma normal dağılı m eğrisinde birim olarak kullanıl maktaydı . Benzer şeki lde bu kısımda hesaplanan ölçmenin standart hatası da hata puanları dağ ılımı için normal dağ ılım eğrisinde birim olarak kullanılır. Önceden belirtildiği gibi klasik test teorisinde; bazı sayıltı­ lar sağlandığında gözlenen puan, gerçek puanla hata puanının toplam ı olarak ifade edilebilir.

Soru 2: Güvenirtik minimum (r,=O) olduğunda, Cevabınız:

Klasik test teorisinde, ölçmenin standart hata sı tirilir:

=s, J(t -

aşağ ıdaki eş itlikl e

kes-

Soru 3:

oı çmenin

Soru 4:

Yukarıdaki

r,)

sapması

sorulara verd iğin iz cevaplardan faydalanarak ölçümlerin güvenirti ğ i ile standart hatası arasındaki ilişkiyi ve ölçmenin standart hatas ının alabi leceğ i değMe ri açıklayınız.

Cevabınız:

...

Formülden de a nlaşıl acağı gibi, ölçümlerin güvenirliği ile standart haters yönlü bir ilişki vard ır. Yani, standart hata azal d ı kça ölçümlerin güvenirliği artar. Örneğin; güvenirlik 1.00 ise ölçmenin standart h atası 0.00 olur ki bu ölçmenin standart hatasının al abil eceği en küçük değerd i r. Güvenirlik 0.00 ise ölçmenin standart hatas ı standart sapmaya eşit olur ki bu ölçmenin standart hatasının maksimum değeri olur. Ölçümlerin varyansı. gerçek pua nları n varyans ı y1a hata puanlarının varyansın ın toplamı olduğundan, standart hatanın maksimum de1jeri ölçümlerin standart sapması olur. Standart hata kullan ılan puan ölçeğinde bir kestirim olduğundan, ölçümlerin standart sapması arttıkça ölçmenin standart hata ölçeği (al abi l eceği değerle rin ta n ı m aralığ ı ) de artmaktadır.

Ölçmenin standaıl hatası = Ôlç(imlerin standaıl sapması ile 'Güvenirlik katsayısının !'den fark.mm k.arek.ök.ünün"çarpımı

tas ı arasında

Buradaki r, (test tekrar test, testi yarı lama, KR:ıo veya Cronbach alfa g ibi yöntemlerin herhangi biriyle elde edilmiş olan) güvenirlik katsayısını belirtir. Formüldeki 1 - rx test pua n larındaki hata varya n s ın ın oranın ı belirtir.

örnek soru: Güvenirtiği .84 ve standart sapması 5 olan ölçümler için ölçmenin standart hatası kaç olur?

s. =s, Jcı - r,)

s. değeri ne o lur?

...

standart hatas ı (Se) ile ölçümlerin standart (Sx) aras ında na sıl bir ilişki vard ır? Cevabınız: ...

X=T+E

Se

Öğrdim,le Ölçme ve Degerlcndirmt

=s Jcı - .84) =2.00

126

127

·-·> ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·t St,ııultırl HitltlSJ l 17

Gerçek Puan için Güven

Öğrdim,le Ölçme ve Degerlcndirmt

J 18

öğrencilerin yaklaşık

Aralığının Bulunması

olarak hata puanları dağılım ı aşağı da belirtildi ği gibi

olur:

Bir öğrencinin gerçek puanını tam olarak bilmemekle birlikte, hangi sı• nırla rda olabileceğini belli bir hata payı (a) ile tahmin edebiliriz. Bu sınırla­ rın belli bir olasılık dahilinde belirlenmesine de güven aralığının bulunması denir. Belli bir olasılık düzeyinde. ölçmenin standart hatasının ve kestirilen gerçek puanın bir fonksiyonu olarak, güven aralığı aşağıdaki eşitlikle bulunabilir.

0.3413 GA(1-oı

= X;±

(Z1-o)Se 0.1359 0.0215,-.,.--

0.0215 0.1359

(1-a) o/ası/ık düzeyinde güven aralığı= Öğrenci puanı r{1-a düzeyi için normal dağılımdaki Z değeri)x(Ölçmerıin standart hatası)

Normal

0.3413

Se Se=3ise

dağılım eğrisi

-3Se

-2Se

-Se

-9

-6

-3

o o

Se

2Se

3Se

3

6

9

%68'indeki hata puanı ·-3 ile +3", %13.5'inin pua n ındaki hata "+3 ile +6", 0.3413

-3Se -2Se

Z puan ı ·3

-2

%2'sinin test pua nındaki hata "-9 ile -6" puan

0.1359 0.021~--

0.0215 0. 1359

Se

%13.S'inin test puanındaki hata "-6 ile -3", %2'sinin test pua nla rında ki hata •+6 ile +9· ,

0.3413

-1Se

-1

o o

+1 Se +1

+2Se +3 Se +2

E ş itlikte

aras ındadır.

Z değeri "± 2.00" birim alınd ı ğında veya Z

değeri "± 3.00" birim

a lındığında normal dağılım tablosunda bildiğimiz olasılık değerleri aşağıda

+3

verilmiştir.

Şekil 4-1: Ölçmenin Standart Hatasının Normal Dağılım Eğrisinde Sunumu

=

Xı:ı: 1Se (Z "-1.00 +1 .00 aralığı" için) yaklaşık olarak .68 olasılıkla gerçek puan güven sın ırı

Bu eşitliktek i Z pua nı normal dağılım eğrisi nde n bildiğimiz, belli bir alana karşılık gelen Z değeridir. Bil indiği üzere Z değeri ortalamadan 1 birim {standart sapma) uzakl aştığında ; ± 1 birimlik (Z puan ı cinsinden) ölçmenin standart hatas ı için normal dağılım eğrisi alt ındaki alan yakl aşık olarak ".68" olur. Başka bir ifadeyle, .68 olasılık la gerçek puan için bir güven sınırı bulmak istiyorsak değerini 1.00 olarak alırız . Aynı zamanda öğrencil erin %68'inde yapılan "hata" pua nlarının alacağı değe~er •-1" birim ve •+1" birim Se arasında ol acaktır.

Xı± 2Se (Z = · -2.00 +2.00 gerçek puan güven sınırı

ara lı ğı"

için)

yaklaş ık

olarak .95

olasılıkla

=

Xı± 3Se (Z · -3.00 +3.00 ara lığ ı" için) yakl aşı k olarak .99 olasılıkla gerçek puan güven sın ırı

z...

Bu eşitlikler verilen belli bir olasıl ık için öğrencinin gerçek puanının hangi sınırtarda olduğunu tahmin etmede kullanılabilir.

Öğrencilerin test puanlarındaki hata puanlarının dağılımı normal dağı. lım özelli ği

gösterirse hata puanlarının dağılımının aşağıda belirtildiği şe­ kilde olması beklenir. Ölçmenin standart hatası 3.00 puan bulunmuş ise;

128

129

·-·> ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·t St,ııultırl HitltlSJ l19

J20

Öğrditrule Ölçme ve Degerlcııdirmt

Ornek soru: Test puanl ann ın güvenirlik katsayı sı .64 ve standart sap1Oise bu testten 73 puan alan bir öğrencin in .95 ol as ılıkla gerçek

Öğrenci Başarısını Değerlendirmede Ölçmenin Standart Hatasının

puanının

Bir öğrencinin puanının ölçmenin standart hatası hesaba katılarak , belli bir sınırlar içinde yorumlanması. verilecek eğitim kararının daha uy-

mas ı

Kullanımı

hangi sınırlarda olduğunu bulunuz.

gun olmasına katkı getirir. Eğer ölçmenin standart hatası yüksek ise öğ­ rencinin başarısını ifade eden puanın güven aralığ ı da geniş olacaktır. Tan (2005) •gerçekte başarılı olan• öğrenciler için "başarı s ızdır" şek­ linde bir yanlış karar verme ihtimalini azaltmak için öğrencilerin geçme pua nlarının h esapl anmas ı nda iki yol önermektedir. Bunlardan ilki öğrencil e­ rin geçme puanl arı nın , ölçümlerin güvenirfikleriyle ağırfıklandırılarak hesaplan mas ı d ır. D iğer ö neri ise öğren ci pua nl arına ölçmenin standart hatasının eklenmesidir. Tan (2005) ölçümlerin güvenirlik katsay ılarıyla ağırlık­ landırılmas ının , elde edilecek geçme pu anla rın ın güven i rliğ i ni arttıracağın ı ve ölçme hatasını azaltacağından dolayı doğru karar verme açısından önemli olduğunu be l irtm i şti r. Tan (2005) ayrıca öğrenci pua nlarına ölçmenin standart hatasının eklenmesinin öğren cileri n test puan l arın ı şişirece­ ğini , ölçümlerin güvenirliğini arttırmayacağını ama "gerçekte başarılı olan· öğrencil erin "başarıs ı z" olarak değerlendiril me hatasın ı önemli ölçüde azaltacağını vurgulamaktad ır . Tan (2005) bu uygu l amanın ayn ı zamanda •gerçekte başarıs ı z o lan" öğrenci l er için "başarılıdır" şek l indeki hatalı değerlendirme yapma ihtimalini de artırdığın ı belirtmektedir. Bu durumda, karar veri ıken hangi tür ha tayı yapma ihtimalini (karar verme teorisinde olduğu gibi "başarısızlara başarılı deme· hatası veya "başarılılara başarıs ız deme" hatas ı ) azaltmanın daha önemli olduğu belirlenmelidir. Sonuç olarak, öğrencil eri başarılı olarak değerlend irmedeki kriter puanın bir standart hata puanı kadar altında puan alan öğren cilerin (örneğin geçme kriter pua nı 50, Se=5 ise 45 ile 50 arasın da puanı olan öğrencileri n) başarısız olarak değerlendirilmelerinde öğretmenler bir kez daha dü şünmelidirler.

Öncelikle ölçmenin standart hatası hesaplanır:

s.

=SxJ(l -

r,)

=ıoJ(ı - .64) =10(.60) =6 puan

Son olarak, .95 olasılık (normal dağılım eğrisinden Z=0.00 noktasında ve sola eşit olarak toplamda .95 alana denk gelecek şeki lde g idildiğindeki Z değeri ) için yaklaşık olarak Z puanı :t 2.00 ola cağından, aşağı­ daki eşiUikten faydalanarak güven aralığı bulunur: sağa

GA(.9sJ = X ;± (Z.95)Se GA(.osı = 73 puan ± 2(6 puan) =(61 S Gerçek Puan s 85) Not: Normal dağılımda güven aralığı için .95 düzeyinde 1.96 olan Z değeri 2 kabul edilmiştir)

Yorum: Bu testten 73 puan alan bir öğrencini n .95 puanı .

ol ası lıkla

gerçek

61 ile 85 arasındadır.

130

131

·-·> ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·e St,ııultırl HltttlSJ l21

Güvenirliği

J22

Öğrdim,le Ölçme ve Degerlcndirmt

fazla verildiğinde cevapla rı bilmeyen öğrencilerin kopya çekmeye yönelmeleri söz konusu olabilir. Sınav süresinin gereğinden az verildiği durumlarda ise öğrencilerin bazı sorulan hiç okuyamamaları durumu söz konusudur. Anlaşılacağı üzere sına v süresinin uygun olarak verilmemesi öl• çümlerin güvenirliğin i düşü rür.

Etkileyen Faktörler

Güvenirlik katsayısının olduğundan fazla, ya da az tahmin edilmesine sebep olabilecek bazı faktörter aşağıda sunulmuştur. 1. Testin Uzun luğu (Testteki soru sayısı) ve Test Sorularının Kali-

tesi

3. Testin Güçlüğü ve Denekler için Örnekleme Hatası

Genelde bir testteki soru sayısı arttıkça (çok aşırı olmamak kaydıyla), o test puanlarının güvenirliği de yüksek olur. Hatta testçilikte. aynı veya benzer nitelikteki sorulardan kaç tanesinin o testte kullanıl dığıyl a, test pu• anlarının güvenirli ği arasındaki ilişkiyi veren formüller elde edil mi ştir. Testteki soru sayıs ın ın artt ırıl ması. öğrencinin gerçek pu anına daha yakın bir gözlenen puan elde etme ihtimalini arttırır. Yani, soru kalitesinde bir azalma olmadan testteki soru sayısının arttırılması ölçümlerimizin güveni rti ği de arttırır.

Klasik test teorisinde hata varyansına oranla gerçek puan varyansının

Testi oluştura n

sorul arın

'

fazla olması ölçümlerin güveni~iğini ( ,°'_, ) arttırır. Testin öğrenciler için Oi+IJi

çok zor veya çok kolay olması, alınan puanlann birbirine çok yakın olmasını sağlar. Test çok zor ise, öğrencilerin çöğ unun test puanı çok düşük o lur. Eğer test çok kolay ise öğren ci leri n çoğu nu n test puanı çok yüksek o lur. Bu durumda teslin, öğrenciler arasındaki farklıl ığı yansıtma düzeyi veya öğrencileri n gerçek bilgi düzeylerini yansıtma düzeyi düşe r ve ölçümlerin güvenirliği azalır. Worthen, White, Fon, &. Sudweeks, (1999:1 16) kolay testlerden elde edilen ölçümlerin, zor testlere nazaran daha güvenilir o ldukl arı nı belirtmekle birlikte, her iki durumda da ölçümlerin güvenirliğinin , maddelerin orta güçlükte olduğu kadar olamayacağ ın ı vurgula-

teknik özellikleri de testten elde edilecek pu-

anların gü venirliğini etkiler. Test sorula rının tesadüfi hatalara sebebiyet vermemesi, ipucu vermemesi ve madde güçlüğü gibi özellikleri önemli ölçüde test puanlarının güvenirliğini etkiler. Worthen, White, Fon, &. Sudweeks, (1999:116) teste, ölçülen değişkenle ilgisi olmayan maddelerin eklen-

maktad ırlar.

mesi, karmaşık ve teknik olarak kötü yazıl mış maddelerin eklenmesi durumunda, testin uzunluğunu n artmasına rağmen, test puanlarının güvenirfi. ğini arttırmaktan ziyade düşeceğini vurgulamaktadırlar. Anlaşılacağı üzere. teste eklenen soruların teknik özellikleri de test pu anlarının güve• nirliğini etkiler. O halde ölçümlerimizin gü ven irliğini artt ırmak için hem daha fazla soru sormaya hem de soruların uygulandığ ı grup için kalitesini arttır• maya çalışma lı yız.

Ölçmede karşılaştığımız önemli bir hala kaynağı da örnekleme halasıdır. Ölçme ve istatistik literatüründe "ranjda daralma (restriction of range)" ifadesiyle de tanımlanan, denekler için örnekleme hatasıyla kast edilen; testin uygulandığ ı veya ölçümlerin elde edildiği grubun evreni temsil etme düzeyini zayıflatacak şekilde (ölçülen değişken bakımından çok üstün yetenekli veya çok düşük yetenekli gibi) az sayı da elemandan oluş­ ması sonucu, test puanlarının güveni rliğinin olduğundan çok daha düşük çıkmasıdır. Korel8syon katsayısının ranjda daralma sonucu olduğundan farklı elde edilmesi sorunu gibi güvenir1ik katsayısının kestirilmesinde de ranjda daralma sorunu vardır. Başarı ölçmede daha çok ölçümlerin güveni rliğini lahmin etmede kullanılan öğrencilerin sadece belli bir yetenek dü• zeyinde olmaları durumunda ortaya çıkan bir sorundur. Klasik test teorisinde, bir testin yetenek düzeyi düşük öğre ncilere uygulanmasıyla, yetenek düzeyi orta ve yüksek öğrenci lere u ygula nmas ı durumunda elde edilecek ölçümlerin güvenirlik katsayıla rı faı1 ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·e St,ııultırl HltttlSJ l23

J24

güvenirliği (ranjda daralma sorunundan dolayı) olduğundan çok daha dü-

Öğrdim,le Ölçme ve Degerlcndirmt

Kopya Çekme Davranışı

şü k ç ıkar.

4 . Şans Başarısı Ba şarı ölçmede ku llanılan bazı sın av türterinde, bir öğrencini n hiç bil• mediği bir test maddesini sadece şans yardı mıyla cevaplayabilmesi söz

konusudur. işte, bir madde için cevabı hiç bilmeyen öğrencinin sadece şansla cevaplama olasılığı, o soru için şans başarısıdır. Örneğin doğru­ yanlış testlerinde şans başarısına yönelik bir tedbir alınmazsa, testin içe• riğini hiç bilmeyen bir kişi tüm soruları "Doğru• veya "Yanlış" olarak işaret• lem işse testten 100 puan üzerinden 50 veya daha fazla (veya az) puan alma şa nsına sahiptir. Soru l arın yarısının cevab ı " D oğru" ise tüm sorulara aynı cevab ı veren, konu hakkında hiçbir bilgisi olmayan bir öğrencinin ala• cağı bu 50 puan tamamen şans başarısıdır. Öğrencilerin şans yoluyla puanlarını arttımıa l arı ölçmede hata kaynaklarında n biridir. Şans başa rıs ı hata puanı olduğundan veya gerçek bilgi ve beceriyi yansıtmad ığında n, ölçümlerin g üven i rl iği ni düşü rü r. 5. Testi Uygulama

Koşulları

tur.

Kopya çekme davranış ı hemen hemen her eğ iti m düzeyinde mevcutBilindiği üzere günümüzde, öğrencilerin uygun kopya çekme tek-

nikleri hakkındaki fikir ve deneyimlerini paylaştıkları ve elektronik kopya çekme cihazlarının satıldığı internet siteleri mevcuttur. Artık

Testin uygul a nmasıyla ilgili etkenler de güve nirliği olumlu veya olumsuz yönde etkiler. Sınav salonunun koşulla n, öğren ci lerin testte ilg ili açık­ lamaları okumamaları, yanlış anlamaları, ölçme ortamını n uygunluğuyla ilgili durumlar, öğ rencile rin sınav anındak i performansl arı gibi etkenler testten alınacak puanların güvenirliğ ini etkilemektedir.

kopya çekme olayı akademik bir problem ol muştur. Dirik'in (1996a) ça lı ş­ masında öğrenci ler , Tür1 ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·t St,ııultırl HitltlSJ l2S

J26

rından ev ödevlerini kopyalamak veya kopyalatmak. Dirik'in (1996a) bulgularına göre öğrenciler kopya çekmede; "not hazırfamak". "sıranın üze• rine veya duvara yazmak", sın av anında birbirteriyle konuşmak'", "hesap

Öğrdim,le Ölçme ve Degerlcndirmt

Lickona (1991) kopya çekmenin neden belirtmektedir.

yanlış olduğuna

da.ir 5 sebep

(1) Kopya çekme nihayetinde kişinin kendisine olan saygısını azaltır. Çünkü bir insan kopya gibi hak etmediği yollardan elde ettiği şey­ lerle gurur duyamaz.

makinesinin içine yazmak" ve "saatin içine yazmak· gibi yöntemleri kullanmaktadırlar. Dirik(1996a) kız öğrencilerin cezalandırmada kendileri için risk oluştunnayacak yöntemleri (konuşma yöntemi ve kanıtları n öğrenciye ait olup olmadığı tartışılabilecek s ıraya ve duvara yazma gibi) tercih ederken erkek öğrencilerin kanıt oluşturma aç ısından riskli yöntemlerden olan · not hazırlayarak" kopya çekmeyi en çok kullandıklarını belirtmiştir.

(2) Kopya çekme her şeyden önce bir yalan d ır, çünkü kopya çekmek; ol duğun uzdan daha bilgili olarak düşünüleceğini zden dol ayı diğer insa nları aldatmaktır.

Bazı araştırma larda; zeka veya okul başarısı ile kopya çekme ara-

(3) Kopya çekme, öğrencinin verilecek ödevleri yapacağı konusunda öğretmenin güvenini yok eder. Öğretmende güvensizlik duygusunun oluşmas ı, öğ retmen ve sınıf a rasındaki tüm il işkiyi de zedeleyebilir.

sında anla m lı i lişkil er bu l unmuştur. Bushway ve N ash ' ın (1977) ifade ettiği g ibi birçok çalışma zeka düzeyi veya okul başarısı düşük olan öğrencil erin daha çok kopya çektiklerini ortaya koymuş ve kopya çekmedeki başarının da. kopya çekme davra nı şını önemli ölçüde etkilediğini vurgulam ı ştır. Literatür kopya çekerken yakalanma ihtimalinin yüksek olduğu durumlarda. öğrencil erin kopya çekme ihtimalinin çok az ol duğunu göstermektedir.

(4) Kopya çekmek, kopya çekmeyenlere yapılan bir haksızlıktır. (5) Eğer öğrenciyken kopya çek.iyorsanız, ileriki hayatta karşılaşa ­ cağınız diğer

olaylarda da kopya çekme gibi aldatıcı davranış ­ larda bulunma ihtimaliniz artar. Çok yakın arkada şlık ilişkileri ­ nize bile bu durum genellenebilir.

Kopya çekmeyi etkileyen bazı sosyal faktörler de mevcuttur. Bunlardan bazdan; öğren ciler üzerindeki üniversiteyi kazanma bask ısı , başarı­ sızlık korkusu, ailenin iyi not arzusu, hatta bask ısıdır. Dirik(1996b) öğre tim elemanl arının kopya çeken öğren cilerin tanımına i lişkin görüşl erind e, "düzenli ça lışmayan öğren ciler" görüşü ilk sıray ı alırken, bunu "fırsatlardan yararlanan öğrenciler" görüşünün i zlediğini belirtmiştir. Comehlsen' ın (1965) araştırmasının sonu çları ; aileden, öğ retmenden ve/ya yöneticilerden gelen her türlü baskının kopya çekme davranışını arttırd ığını ortaya koymu ştur. Aslında sosyal açıdan kopya çekmek ·anti-sosyal" bir davranıştır. Çünkü öğrencil er kopya çekerek yüksek notlar alıp, ailelerini mutlu etmek için çaba göstennektedirler. Kopya çekmeyi etkileyen faktörler arasında. müfredat program ı yla ilgili faktörlerden de söz etmek mümkündür. Birçok öğ retme n. kendi branş ı yla ilgili tüm önemli konul arı işl emek arzusundad ır. Bu durumda , çal ı şıla cak çok materyalin ol ması söz konusudur. Bu da kopyayı çare olarak kabul etme anl ayışın ı arttırır. Bu d urumu önlemenin bir yolu; öğretimi ve s ın av­ ları mümkün oldukça bireyselleştirmekti r. Bu suretle, öğrenciler yetenekleri doğru ltu sunda bireysel çalışmalara yönel eceğ i nden daha etkili bir öğ ­ retim söz konusudur.

Araştırmala r dersin öğretim sorumlusunun; öğretim stili ve kişiliğinin kopya çekme durumunu belirteyen faktörlerden biri olduğunu ortaya koymuştur. Hiç şüphesiz, öğretmenler, tutum ve davranışlarıyla, sınıflarda kopya çekilme davranışlarını etkiler. Öğretmenler kopya çekmeyi önlemede, tespitte ve cezalandırmada çok önemli bir rol oynamaktad ır. McCabe (1993) çalışmasında, üniversitelerde belirti ödüller a lmı ş öğret­ menlerin kopya olaylarına karş ı daha titiz ve kopya olayl arını rapor etmede daha duyarlı olduklarını ve öğ retmenlerin sisteme inandıklarında, sistemi kullanmada daha istekli olduklarını belirtmektedir. Dirik (19g6a) çalışma­ sında öğrencilerin, kopya çekme oranlarının art ışını öncelikle "öğretim elema n larının tutumlarına· daha sonra sırasıyla "derslerin iyi işle nmeyişi ne" , · ders konul arı nın zor1uğuna", sını fların ve sınav sa lonlarını n kal aba lık ol• masona• bağlad ıkl arın ı beli rtmi ştir.

Ölçme açısından; sınavda kopya çekilmesi elde edilecek ölçümlerdeki sistematik hata miktarının fazla ol masına, dolayısıyla ölçümlerin geçerliği­ nin d üşük olmas ına neden olmakla birlikte, ölçümlerin güvenirli ğini n de düşük olmasın a neden olur. Bu durum, a lınacak eğitim kararların ın sağlıklı o labilmesi ihtimaJini de düşürür. özellikle günümüzde sınavların kalabalık sınıflarda yapılması ve diğer bazı koşullardan dolayı öğrencilerin kopya çekme ihtimalleri mevcuttur.

136

137

·-·> ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·t St,ııultırl HitltlSJ l27

J28

Kopya Çekmeyi Önlemeye Yönelik Bazı Tedbirler

4.

Oğrenci lerin

test uygulamas ı nı aksatacak müsaade edilmemesi.

şek ilde davranmaları na

5, Sınav anında öğrencilerl e bireysel olarak, fısıldayarak konuşul ma­ ması. Açıklanması gereken bir şey varsa tüm gruba açıklanması .

Öğrenim gördüğünüz bölümde öğrencilerin kopya çekme davranış/arını

Öğrdim,le Ölçme ve Degerlcndirmt

önlemek için ne tür tedbirler alınabileceği konusundaki maddeler halinde yazınız:

6. Fiziki

görüşlerinizi aşağıya

koşulların

uygun olması durumunda öğrencilerin bir sıra atla-

tıl arak (bir sı ra dolu bir sıra boş) oturlulması.

Cevabınız:

7. Testin h azırlanması. sakla nması ve uygulanmasında gerekli özen ve titizl iğ i n gösterilip, güvenlik tedbirlerinin alı nması.

1.

2. 3. 4. 5. 6. 7.

8 . Öğrenmenin arttırılmasında sınavların çok önemli bir yer tuttuğu­ nun bilincine varma. 9. Sınavda n önce öğrencilerden sıralarını temizlemelerini isteme (hem mateıyaller hem de sıra üstündeki yazılar için). 10. Matematik gibi derslerde işleml er için karalama kağıd ı kullanıldıysa , bu kağıdın da testle birlikte alı nması.

8.

9. 10.

Sınavda kopya çekilmesi alınacak eğitim kararlarının sağlıklı olabil• mesi açısından hiç arzu edilmeyen bir durumdur. Günümüzde s ınavla rda öğrencilerin kopya çekmeleri çok sık karşılaşılan bir durumdur. Tan (2001a) araştırmasında, yüz yüze yapılan sınavlarda, öğretmen lerin kopya çekmeyi önlemeye yönelik olarak alabilecekleri bazı tedbirler önermiştir.

Tan'ın (2001a) önerdiği tedbirler, önem sırasına göre aşağıda sunu l muştur.

1. iki test formunun kullanılması ve arka arkaya oturan öğrencilerin faıl ·-

Öiçümkri.n Giiı'tnirlıği ı"t Slandar1 Hal@ 133

Öğrdimıle Ölçme ve Degertcndirmt

134

SINIF-IÇİ UYGULAMA- FORM 2

Yukandaki verilerden faydalanarak aşağıda istenilenleri bulunuz. 1. Her iki test formundan elde edilen ölçümlere aij güvenirliği hesapla-

Tesli yarılama yöntemiyle, 30 öğrenciye uygulanan 40 soruluk bir leslin iki ayrı formuna ait öğrenci pua nları ve A formu için her soruyu doğru cevaplayan öğrenci sayısı(lj) aşağıda sunulmuştur.

yıp yorumlayınız.

2. Birinci son.ıda elde etliğiniz alt test ölçümlerinin güvenirliğinden faydalanarak testin tümünden elde edilen ölçümlere ait güvenirliği hesaplayıp yorumlayınız.

Öğrenci Form A Puanı

Form B

Puanı

Form A için lj değerleri

3. A formuna ait ölçümlerin güvenirliğini KR,o formülünü kullanarak hesaplayınız.

4. KR,o güvenirlik kestirme formülüyle elde edilen güvenirlik kalsayıla­ nndan faydalanarak A formuna ait ölçümlerin standart hatasını hesaplayıp yorumlayınız.

5. 26. Kişinin A formundan aldığı puan için .95 olasılıkla güven aralı­ ğını bulunuz.

1 2 3

17

4

14

5 6 7

11

8

9 7 7 9 9

9 10

11 12 13

14 15 16 17

18 19 20 21 22 23 24 25 26 27

144

18 19

13 14

19 14 10 16 9 12

17 14 6 8 9 6 7 8

28

12 14

29 30

15 17

15 15 16 16 10

Madde

li

1

11

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

24 18 9 9 18 21 24 15 18 27 15 27 18 24 12 24 12 15 18 12

16

12 8 9

11 10 18 16 10

12 11 13

18 12 8

2 3

4

8 7 7 9 9 10 15 16 12

145

·-·> ·-

Ölçiimlcriıı Gii~·enirliği ı·t St,ııultırl HitltlSJ 135

Öğrdim,le Ölçme ve Degerlcndirmt

136

SINIF-İÇİ UYGULAMA- FORM-3

Yukandaki verilerden faydalanarak aşağıda istenilenleri bulunuz.

1. Her iki test formundan elde edilen ölçümlere ait güvenirtiği hesapla-

Testi yarılama yöntemiyle, 30 öğrenciye uygulanan 40 soruluk bir testin iki ayrı formuna ait öğrenci puanları ve A formu için her soruyu doğru cevaplayan öğrenci sayısı(lj) aşağıda sunulmuştur .

yıp yorumlayınız .

2. Birinci soruda ekte ettiğiniz alt test ölçümlerinin güvenir1iğinden faydalanarak testin tümünden elde edilen ölçümlere ait güvenirtiği he-. saplayıp yorumlayınız.

Öğrenci Form APuanı

3. A formuna att ölçümlerin güvenirtiğini KR,o fornıülün ü kullanarak he-

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

saplayınız.

4. KR:,o g üvenirlik kestirnıe formülüyle elde edilen güvenirtik katsayıla­ rından faydalanarak A formuna ait ölçümlerin standart hatasını hesaplayıp yorumla yınız.

5. 26. Kişinin A formundan aldığı puan için .95 olasıl ıkla güven aralı­ ğını bulunuz.

146

15 16 17 12 9 11 12 7 5 5 7 7 17 12 8 14 7 10 15 11

5 6 7 4 5 6 10 12 13 15

Form B Puanı 13 13 14 14 8 9 14 10 6 7 9 8 16 14 8 10 9 11 16 10 6 6 5 5 7 7 8 13 13 11

Form A için lj değerleri Madde 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

ti

21 15

6 6 15 18 21 12 15 24 12 24 15 21 9 21 9 12 15 9

147

·-·> ·-

o.

Ölçiimlcriıı Gii~·enirliği ı·t St,ııultırl HitltlSJ 137

138

Öğrdim,le Ölçme ve Degerlcndirmt

SINIF-İÇİ UYGULAMA- FORM-4

Yukandaki verilerden faydalanarak aşağıda istenilenleri bulunuz.

1. Her iki test fonnuna ait güvenirl.ği hesaplayıp yorumlayınız.

Testi yarılama yöntemiyle, 30 öğrenciye uygulanan 40 soruluk bir testin iki ayrı formuna ait öğrenci puanları ve A formu için her soruyu doğru cevaplayan öğrenci sayısı(lj) aşağıda sunulmuştur.

2. Birinci soruda elde ettiğiniz alt testlerin güvenirliğinden faydalanarak testin tümüne ait güvenirliği hesaplayıp yorumlayınız . Testin tümüne ait güvenirliği hesaplayıp yorumlayınız.

Öğrenci Form A Puanı

3. A foımuna ait güvenirl iği KRıo güvenirlik kestiıme formülünü kullanarak hesaplayınız.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

4. KRıo güvenirlik kestiıme formülüyle elde edilen güvenirlik katsayılarından faydalanarak A formuna ait ölçümlerin standart hatasını hesaplayıp yorumlayı nız.

5. 26. Kişinin A foımundan aldığı puan için .95 olasılıkla güven aralığını bulunuz➔

148

15 14 16 11 8 10 11 6 4 4 6 6 16 11 7 13 6 9 14 10 4 5 6 3 4 5 9 11 12 14

Form B Puanı

Form A i~in lj değerleri

12 12 13 13 7

~ 1 2 3

8

5 6 7

13 9 5 6 8 7 15 13 7 9

8 10 15 9

5 5

4

8 9 10 11 12 13 14 15 16 17 18 19

20

!i 18 15 3 6 12

18 18 12 12

24 9

24 12 21 6 21 6 12 12 9

4 4 6 6 7 12 11 11

149

·-·> ·-

o.

Öiçümkri.n Giiı'tnirlıği ı"t Slandar1 Hal@ 139

Öğrdimıle Ölçme ve Degertcndirmt

140

Yukandaki verilerden faydalanarak aşağıda istenilenleri bulunuz.

SINIF-IÇI UYGULAMA- FORM 5

1. Her iki test formuna ait güvenirliği hesaplayıp yorumlayınız.

Aşağı da tam puan ı 5 olan 6 tane yazılı yoklama sorusundan 30 öğrencinin aldığ ı puanlar verilmektedir.

2. Birinci soruda elde ettiğiniz alt testlerin güvenirliğinden faydalanarak testin tümüne ait güvenirliği hesaplayıp yorumlayınız. Testin tümüne ait güvenirliği hesaplayıp yorumlayınız.

Soru Puanları Öğrenci Sorul Soru 2

1 2 3

3. A formuna ait güvenirliği KR,o güvenirlik kestinne formülünü kuOanarak hesaplayınız. 4.

4

KR,o güvenirlik kestinne formülüyle elde edilen güvenirlik katsayılarından faydalanarak A fonnuna ait ölçümlerin standart halasını he-

5 6 7

saplayıp yorumlayınız.

8

5. 26. Kişinin A formundan aldığı puan için .95 olasılıkla güven aralı-

9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

ğım bulunuz.

150

5 4 4 3 3 5 2 3

4 4 5 5

4

3 3

5 3 4

o 1 2 2 2 3 1 4

3 2 3 1 2 4

2 2 1 1

3 4 2 2

2 2

3 3 5 5 4

3 3 2 1 2

3 2 1 2 3 2 1 2

Soru 3 Soru 4 Soru 5 Soru 6 § 5 5 ~ 5 4 4 5 5 3 5 5 4 4 5 5 4 4 5 5 4 4 5 3 3 4 4 3 3 3 5 3 4 3 3 2 4 3 2 2 2 4 3 3 4 2 3 3 1 4 3 3 1 4 4 3 1 5 4 5 4 2 5 4 4 1 5 3 o 3 5 3 3 3 3 3 3 2 3 4 3 3 3 2 4 2 2 2 4 2 2 2 5 1 1 2 5 3 2 3 4 2 2 3 4 2 2 3 3 1 o 3 1 2 2 2 1 1 2

151

·-·> ·-

Ölçiimlcriıı Gii~·enirliği ı·e St,ııultırl HltttlSJ 141

Yukandaki verilerden faydalanarak aşağıda istenilenleri bulunuz. 1. Sınavdan elde edilen puanlara ait güvenirlik katsayısını hesapla• yı p yorumlayın ı z.

2. S ınav puanlarının standart ha tasını h esaplayı p yorumlayınız.

3. 28. öğrencinin aldığı puan için .95 olasılıkla güven aralığını bulunuz.

152

153

·-·> ·-

o.

Öğrotimdı: Ölçme ,·e Değerleıulinne

144

Bu ünitenin yeterli düzeyde anlaşılması için •Eği~mde ölçme ve değerlendirmenin temelleri, Temel istatistiksel teknikler ve Ölçümlerin güvenirliği ve standart hatası" ünitelerinin iyİ bir şekilde öğrenilmesi gerekmektedir.

ÖLÇÜMLERİ N GEÇERLİĞİ

ÖLÇÜMLERİN GEÇERLİĞİ Yapı lan

bir sınavla ilgili olarak çertiğine yöneliktir:

ÖLÇÜMLERiN GEÇERLiôl Geçerl iği Düşüren Durumlar Geçerlik Kanıtı Toplama Yöntemleri 1. Kapsam Geçerliği Kanıtı 2. Ölçül Geçerliği Kanıtı 3. Yapı Geçertiği Kanıtı Test Puanlarının Yorumlanmasına Yönelik Geçerlik Kanıtları 4. Görünüş Geçerliği Kanıtı

aşağ ıdaki

gibi yorumlar o

s ınavın

ge-



Sorular dersle ilgili bilgi ve becerileri ölçer niteliktedir. S ı nav. derste öğrenil mesi gereken her şeyi kapsamaktadır. ► Sınav en iyi üç öğrenciyi seçme amacı için uygundur. ► İzleme testi, ünitedeki öğrenme eksikliklerini belirlemede çok fayda►

lıd ı r. ►

Yabancı



ALES

Dil

Sınavı puan ları

puanlarını

akademisyen seçiminde fayda lı dır . akademisyen seçmede kullanmak çok uygundur.

Geçerliği Etkileyen Faktörler

1. Amaca Uygunluk a) Ölçme Yöntemi b) Sın av Kapsamı ve Soru Seçimi 2. istenmedik Değişkenlerin Ölçümlere Karışması ve Test

Yukarıdak i yorumlar, yapılan bir sınavın belli bir amaç için geçerti puanlar ve rd iği n i

belirten yorum la rd ır. Bu sorul arı s ın avla ilgisi olan birçok öğ renci sorar. ama bu so ruların doğru yoruml a nması için ölçümlerin geçe rtiğ i ve geçerlik kestirme yöntemleri kavranm ış olmalıd ır. Aksi halde bu scrulara doğ ru cevap verebilme ihtimali çok az olur.

ve

Yanlılı ğ ı

3. Normlar 4. Güvenirlik Ölçme Araçlarında Kullanışlılık

öğretmen

Eğitimde ölçme ve değerlendirme. okullarda birçok amaca hizmet etmektedir. Örneğin; öğrencilerin yetenekli veya zayıf olduğu konuların belirlenmesinde. öğrencilerin alacakları öğretim programının tayininde. öğ­ rencilerin gelişmeleriyle ilgili aileleri bilgilendirmede ölçme ve değerlendir­ meden faydalanılır. Bunlara ilaveten, öğrencinin belli bir programa seçilmesi ve bu programda başlayacağı kur veya düzeyin belirlenmesinde, öğ ­ rencilerin öğrenme-öğ retme süreci içerisindeki eksiklik ve yetersizliklerinin belirlenmesinde. kurs bitiminde öğrencilerin öğrenme düzeylerinin belir• lenmesinde yine ölçme ve değerlendirmeden faydalanılmaktad ır. Amacı• m ız. bir işle ilgili hı zı, performansı ölçmek veya kişilik. ilgi, tutum, yetenek, b aşarı gibi faktörleri ölçmek olabilir. Söz konusu bu ölçümlerimizin ölçme amacı için uygunluğunun veya ölçülmesi amaçla nan nitelikleri ölçebilme düzeyimizin açıklanması gerekmektedir. Anlaşıla cağı üzere. eğitimde öl· çülmek istenen özellikler genelde; başarı, ilgi, tutum gibi bazı soyut nitelik• lerdir. Bu değ işkenleri ölçerken elde edilecek ölçümlere, ölçülmesi amaçlanmayan değişkenlerin karışması ölçümlerin geçerliğini d üşürü r.

ÖZET ÜNiTE SORULARI SINIF-IÇI UYGULAMA

154

155

·-·> ·-

o.

Ölçümleri" G~erliği

146

145

Ölçme sonuçlarını; ölçmek istenilen değişkenden başka değişkenlerin etkilememesi sağlandıkça ölçme araç veya yöntemi daha geçerli puanlar verir. Ölçme aracı, hazır1anış amacına uygun ölçümler verdikçe ölçümlerin geçerlik düzeyi artar. Örneğin; bir ölçme aracı olarak · metre· uzunluk ölçme amacı için geçerli ölçümler verir deriz ama basketbol oynama be~ cerisini ölçmek için geçerli ölçümler verir diyemeyiz. Benzer şe kilde, bir derse ait gerekli bilgi ve beceriye sahip olmadan o dersin sınavında n başarılı o lunuyorsa. o sınav puanlarının geçerliği düşük demektir. örneklerden de anlaşılacağı gibi ölçümlerin geçerliği incelenirken verilecek karar, o ölçümlerin ölçme aracının kullanılış amacına uygunl uğuna yönelik yargıdır. Geçerlik aslında bu ya rgı ya ulaşmak için bir kanıt toplama işi­ dir. Ölçme literatüründe belirtildiği gibi, geçerlik (APA 1995. s:9): Uygunluk (appropriateness, ölçümlerin ölçme an lamlılık

Geçerliği Düşüren

Durumlar

1. istenmedik değişkenlerin ölçümlere karışması: Bir ölçme aracından elde edilen puanlara, aracın ölçmek istedijji niteliklerin dışındaki niteliklerin karışması (dili kullanma becerisi, öğ rencin in kişiliği, kültür, cinsiyet gibi) o ölçme aracında n elde edilecek ölçümlerin geçerli ğin i düş ürür . Çünkü ölçmeyi istemediğimiz, dili kullanma becerisi, öğrenci kişiliği, kültür ve cinsiyet gibi değişkenlerin puanları etkilemesi, ölçmek istediğimiz değişkenleri yansıtan ölçümler elde etme ihtimalimizi azalt ır. 2. Değişkenin eksik ölçülmesi: Ölçülecek bir değişkeni eksik bir şe­ kilde ölçen bir ölçme araç veya yöntemi de geçertiği düşük ölçümler verir. Bir başarı testi için, ölçmeye konu olan davranı şlar yetersizse (testteki SO• rulann o dersin hedef da vranışlarını temsil etmede yetersiz oluşu gibi), o test puanlarının güvenirtiğ iyle birlikte, geçerliği de az olur. Bu durumu daha da somutlaştırmak amacıyla fiziksel ölçümlerle ilgili bir örnek verirsek: Bir masa nın ölçüsü olarak bize sadece masanın boyunun uzunluk ölçüsü ve• rilirse, bu ölçümün geçerliğin i n düşük ol acağı gayet aç ıkt ır. Çünkü masanın sadece boy değil , genişl ik ve yükseklik boyutları da vardır. Masanın söz konusu üç boyutundan sadeoe birinin ölçül müş olmas ı , o ölçümün (kapsam) geçerliğinin düşük olduğunu gösterir.

amac ın a u ygunlu ğu) ,

(meaningfulness). test puanl arından yap ıl an belirli (usefulness) anl amında da k u llan ıl mak tadır.

Öğrotimdı: Ölçme ,·e Değerleıulinne

çıkarım­

ların faydalılığı

Bir amaç için geçerli olan ölçümlerin başka amaç için geçerli olmadığı veya bir grup için geçerli olan ölçümlerin başka bir gnıp için geçerli olmadığı gibi durumlar söz konusudur. Yani geçerli k test puanla rının kullanı­ lış amacına bağlıdır. Klasik örnek olarak, öğrencilerin bir dersteki matematik başarısını belirlemek için hazırl anan bir testten alınan puanl arın öğ ­ renci başarılarını yorumlamada uygun olmasına rağmen aynı test puanla• rının doktora bursu vermek için 3000 öğrenci arasından seçileoek en iyi 3 öğrencin in belirlenmesi amacı için uygun olmaz. Bu nedenle geçerliği n test puan l arın ın k u lla nılış ama cına göre yorumlanmasına odaklanan daha kapsam l ı bir tan ı mı AERA, APA. NCME tarafından aşağıdaki gibi yapıl ­

3. Ölçümlere tesadüfi hata karışması: Tesadüfi ölçme hatalarının çok olduğu anlamına gelen düşük güvenirlik katsayısı da geçerlik katsayısının düşük olmasına sebep olur. Haliyle bir ölçme aracının ölçmek islediği değişkeni uygun bir şekilde temsil eden puanlar vermesi, bu ölçme aracının tesadüfi hatalardan arınık puanlar vermesini de etkileyecektir. Yani ölçümlerin güvenirliği, geçerlik derecesini de etkiler.

mıştır :

"Geçerlik, testlerin kullanılış amacına bağlı olarak kanıt ve teorinin test puanlarının yorumlanmasını ne derece desteklediğini ifade eder." (AERA. APA. NCME. 2014: 11).

Geçerlik Kanıtı Toplama Yöntemleri

Geçerlik çalışmalarında özellikle yapı geçerliği bütünsel olarak ele alın­ makla ve di ğer geçerlik türlerinin yapı geçerliğine direkt veya dol aylı etkisi dikkate alınarak yapı geçerli ği tanı mlanmakladır: Bu bakış açısıyla , "Yapı geçer/iği, ölçümlerin yapı geçerllğinln bir parçası olarak sunulan kapsam ve ölçüUere bağlı kanıtlar da dahil olmak üzere test puanlarının yorumlanması veya anlamı ile ilgili kanıtların bütünleşmesine dayanır " (Messick 1995: 742).

Ölçme araç ve yöntemlerinin geçerliğini bulmada kullanılan yöntemlerden kapsam. ölçüt, yapı ve görünüş geçerliği bu kı sı mda açıklanmakladır. 1. Kapsam

Geçerliğ i Kanıtı

(Evidence of Content Validation)

Bir ölçme aracı. ölçmeyi amaçladığı bilgi ve becerileri yans ıtabil ecek puanlar verir nitelikte olma lı dır ki, o ölçme aracından elde edilecek puanl arın geçe rliğ i yüksek olsun. O halde. geçe rtiği yüksek puanlar veren bir ö lçme aracı hazırtayabi lmek için ölçülen değişkeni de ta ylı olarak net anlaşılır ve açık bir şeki ld e tanımlayabilmek gerekir. Daha somut ifadelerle, Lise il. matematik dersindeki başarıyı ölçmek amacı yl a hazırl anm ı ş bir

156

157

·-·> ·-

o.

Ölçümleri" G~erliği

148

147

Öğrotimdı: Ölçme ,·e Değerleıulinne

matematik dersinin içeriğ ini detaylı ve net bir şekilde bilemezler. Aynı za-

runun ilgili davranı şı ölçmek için. uygun bir şekilde nas ıl yazılacağı, bu kitabın " Sınav Türleri ve Soru Yazımı" ünitesinin ..soru sorma ve test hazır• lamada d ikkat edilecek genel hususlar" kısmında detaylı olarak anlatılmış­

manda Lise il. matematik programının içeriğini çok iyi bir şekilde bilmeyen

t ır.

testten elde edilecek ölçümlerin geçerliğ i hakk ında tarih hocal a rından oluşan bir komisyonun yargıda bulunmas ı uygun olmaz. Çünkü tarih hocaları , matematik öğre tmenlerinin de bu test hakkın da vereceği karartarın geçer•

Bir başarı testinde. evreni ol uşturan tüm davranışlar yoklan ıyorsa, davranış örneklemede yapılacak hala söz konusu değildir: Örneğin lngilizce dersinde 100 tane kelimenin öğrenilme düzeyini ölçmek amacıyla o l uşturul an bir testte tüm kelimeler soruluyorsa kelimelerin örneklenmesinden kaynaklanan bir hata söz konusu değ i ldir. Bu durumda davranışlar

liği büyük ihtimalle yeterli olmaz. Anlaşılacağı üzere, kapsam geçerliğini sağlayabilmek için öncelikle ölçülecek niteliklerin profesyonelce tanımlan­ ması

gerekir.

Bir ölçme aracın ı n kapsam geçerliği ; testi o l uşturan maddelerin ölçülen davranışlar evrenini temsil etme düzeyi hakkında b ir karara varma d ır. Başka bir ifadeyle, kapsam geçerliği ; bir ölçme aracının hem konu ve davran ış boyutuna bak ıl arak hem de test maddelerinin ölçülmek istenen davran ışları ö lçmede uygun olup ol madığ ın a bak ıl arak varı lan bir geçerlik yargısıdır. Öğrenci başarısını ölçmede kullanılan başarı testlerinin geçe rliğini bulmada ku llanı l an en uygun yöntem kapsam geçerliğ idir. Bir başa rı testinin kapsam geçerli ği çalışılırken. testi oluşturan maddelerin konu ve da vranış boyutu analizi i şini testi hazırl ayan kişi yapab ileceğ i gibi, ayn ı konuda uzman bir ekip de yapabilir.

ömekleminin, evreni temsil etme düzeyinin tespit edilmesi gerekmeyebilir

ama sorulan

sorul arı n

ölçmeyi

tasarl adığı da vranış ı

ölçmedeki

ye te rl iği

üzerinde durulmalıdır.

Bir test maddesinin geçerliği hakkında yargıda bulunmanın bir yolu da; bu maddeden aldıkları puanlarla, testin tümünden aldıkları puanlar arasında ne düzeyde bir ilişki old uğunun bulunmasıdır (madde ayı­ rıc ılık gücü). Bu il işkinin ölçüsü istatistiksel olarak çift serili veya nokta çift serili korelasyonla tespit edilebilir. Geçerlik katsayısı bir korelasyon katöğrencil erin

sayısı olduğu için teorik olarak "•1" ile "+1" arasında değer alabilir. Eğer bir madde için hesaplanan madde-test korelasyonu veya madde-

Kapsam geçerliği çalışmasında, öncelikle ölçmeye konu olan özelliklerin, yani davran ışlar evreninin belirtenmesi gerekmektedir. Sonra, testi

madde hariç test koreliisyonu (item-remindercorrelation) 0.20' den az ise

oluşturan davranışların (örneklemin), davranışlar evrenini yeterti bir düzeyde temsil edip etmediğine karar verilir. Bu karar verme aşamasında davranışların evreni temsil etmesiyle birlikte, davranışları ölçmek için yazı lan soruların geçerliği de yorumlanmalıdı r. Testlerin kapsam geçertiğinin belirlemesine yönelik olarak yapılacak bir çalışmanın aşama ­ ları aşağıdak i tabloda özetlenmiştir.

bu madde; testin tümünün ölçtüğü boyutu ölçmede geçersiz bir madde olarak yorumlanır. Bir testi oluşturan maddelerin tümü 0 .20'den bü· yük madde ay ırıcılık gücüne sahip ise, bu aynı zamanda testin homojen

maddelerden oluştuğunu ve testin iç-tuta rlılık (güvenirlik) katsayısın ın da yüksek ol acağı nı ifade eder. Ayrıca, test geliştirme çalışmalarında; davranı şlar ömekleminin, evreni temsil düzeyini zayıflatmamak kaydıyla, çiftse-

rili korel8syon katsay ısı 0.20'den düşük maddelerin teste alınmaması gü• venilir ve geçerli bir test elde etmek için önerilir.

Kaosam Gecerliainin Asama/arı

Eğer ölçtüğümüz değ i şken iki veya daha fazla boyutlu ise. öncelikle (faktör analizini kullanarak) homojen maddelerden ol uşa n all testler elde edilebilir. Daha sonra her alt test için madde güven irli ği ve geçerliğ i istatistiksel olarak hesaplanır . Bu suretle puanların geçerl iği de arttır ıl m ı ş olunur. Bu analizleri yapmada kullanı labil ecek özel bilgisayar programları gü-

1. Ölçülecek değişkenle ilgili davranışlar evreninin belirlenmesi. 2. Testi ol uşturan davranışları n (örneklemin) belirlenmesi. 3. Testi oluşturan davranışlar örnekleminin. evreni temsil düzeyinin tespit edilmesi.

nümüzde mevcuttur.

4. Testteki soruların ilgili olduğu davranışı ölçmeye uygun olup olmadı­ ğ ın ın

Bloom, Hasting ve Madaus (1971) davranı şların sınıflandırılmasına yönelik kapsamlı çalışma lar yapm ışlardır. Kapsam geçerliğin in tespit edil-

kontrol edilmesi.

mesinde; testi oluş turan davranı şl arın, davra nışlar evrenini temsil etme düzeyinin belirlenmesinde bir belirtke tablosunun hazırlan masını önemı iş­

Kapsam geçerl iği çalışmalarında, genelde gözden kaçırı l an son aşa­ man ın bir kez daha vurgul anmas ında fayda vardır. Bir testin kapsam geçerliği hakkında karar verirken, testte sorulan soruların ilgili davranışları ôlçmede uygun olup olmadığının da tespit edilmesi gerekmektedir. Bir so-

lerdir. Öğrencilere bir program veya kurs sonrasında kazandırılması arzulanan davranışların hem konu hem de hedef davranı ş düzeyi bazında basit

158

159

·-·> ·-

o.

Ölçümleri" G~erliği

149

150

o larak özetlendiği iki boyutlu tabloya belirtke tablosu (table of specifications) denir.

Tablo 5-2: Belirtke Tablosu: Gelişim ve Öğrenme Dersi Vize Sınavı için Kapsam Geçerliği Düşük Davranışlar örneklemi

B aşan

testlerinin geçe rtiğ i hakk ın da kanıt toplarken, yapıl acak en önemli i ş, kapsam geçertiğ i çalışması yapmaktır. Kapsam geçe rtiği ni n daha iyi bir şekilde anlaşılması için aşağıda "Gelişim ve Öğrenme" dersi vize sınavı evren davranışları için hazırlanan Tablo 5.1 sunulmuş ve bu tablodan vize sınavı için 4 farklı örnek belirtke tablosu oluşturulmu ştur. Bu tabloların ilk üçü (Tablo 5 -2, Tablo 5-3 ve Tablo 5-4) kapsam geçertiğ i aç ı ­ sından yetersiz ve sonuncu tablo ise (Tablo 5-5) kapsam geçert iği yüksek o lan bir tablodur. Tablo 5.1 'i dikkate alarak Tablo 5.2, 5.3, 5.4 ve 5.5'in kapsam geçerl i ğini yorumlay ın ı z.

Davranış Düzeyleri Konu /Üniteler\ 1. Giris, fiziksel aelisim 2. Bili•sel neti•im 3. Ahlaki aelisim 4. l'ı~renme ilkeleri 5. Bilni i•leme kuramı Toclam

Bilgi

Kavrama

Bilgi

Kavrama

Uygulama Toplam

4 4

4 4

9

9

4 4 25

4 4 25

00

00

Tablo 5-2 'd e sunulan örnekte; "kavrama· ve "uygulama" düzeylerinde hiç soru seçilmem işti r. Sınavda sorulacak soruların ta mamı ..bilgi• düzeyindedir. Bilgi düzeyinde; 2. , 4. ve 5. ünitelerdeki tüm davranışların sınava dahil edilmesine rağ men, 1. ünitedeki bilgi düzeyindeki davranışların yarısı, 3. ünitedekilerin ise ¾'ü sınavda yoklanmak amacıyla seçilmiştir. An• !aşılacağı üzere Tablo 5-2'de sunulan davranışlar ömeklemi, Tablo 51'deki belirtke tablosunda verilmiş olan evrendeki davranışları temsil için yetersizdir. Bu şekilde, davranış örneklemesiyle yapılacak bir s ınavın kapsam geçerliği o ldukça düşük olur.

Tablo 5-1: Belirtke Tablosu: Gelişim ve Öğrenme Dersi Vize Sınavı için Davranışlar Evreni Davranış Düzeyleri Konu ıünitelerl 1. Giri• . fiziksel nelisim 2. Silisse! aelisim 3. Ahlaki aelis im 4. n;ı;,renm e ilkeleri 5. Bilai isleme kuramı Toclam

Öğrotimdı: Ölçme ,·e Değerleıulinne

Uygulama Toplam

8 20 o 28 4 16 o 20 12 8 o 20 4 8 4 16 4 8 4 16 60 8 100 32 Tablo 5-1 'de su nuld uğu gibi vize sınavındaki davranışların çoğun l uğu (%60) "kavrama" düzeyindedir. D avranışların %32'si "bilgi" ve %8'i ise uygulama düzeyindedir. Ünite bazında bakıldığında ise 1. ünitede miktar olarak en çok davran ı ş ın kazand ı rılması amaçla nmaktadır. S ınav için öğret­ menin hazırlayacağı belirtke tablosu, öğretmenin ders içinde konuları işle­ yiş düzeyi ile tutarlı olmalıdır. örneğin derste kavrama düzeyindeki hedeflere daha çok ağırlık vermiş ise bu durum belirtke tablosuna da yans ı tıl ­

Tablo 5-3: Belirtke Tablosu: Gelişim ve Öğrenme Dersi Vize Sınavı icin Kaasam Gecerliai Dü ük Davranıslar ö meklemi Davranış Düzeyleri Bilgi Kavrama Uygulama Toplam Konu /Üniteler\ 1. Giris, fiziksel aelis im 2 2 2. Bilissel aelisim 1 1 3. Ahlaki aelisim 6 6 4. t\;ı;,ren me ilkeleri 8 8 5. Bilni isleme kuramı 8 8 Toolam 00 25 00 25

ma lıdır.

Tablo 5-3 'te sunulan örnekte; "bilgi" ve · uygulama· düzeylerinde hiç soru seçilmemiştir. Sınavda sorulacak sorulann tamamı "kavrama" düzeyindedir, Kavrama d üzeyinde; 4. ve 5. ünitelerdeki tüm davra n ı şların sı­ nava dahil edilmesine rağmen, 1. ünitedeki kavrama düzeyindeki davranışların 1/10'u, 2. ünitedeki davran ı şla rın 1 /16's ı ve 3. ünitedeki davra nış ­ ların ise ¾'ü sınavda yoklanmak amacıyla seçilmiştir. Anlaşılacağı üzere Tablo 5-3'te sunulan davranışlar örneklemi, Tablo 5 -1'deki belirtke tabi-

160

161

·-·> ·-

o.

Ölçümleri" G~erliği

Öğrotimdı: Ölçme ,·e Değerleıulinne

152

151

2. Ölçüt Geçerliği Kanıtı (Evidence of Criterion-related Validation)

sunda verilmi ş olan evrendeki davranışları temsil için yetersizdir. Ayn ı şe­ kilde, Tablo 5-3'teki gibi bir davranış örneklemesiyle yapılacak sın avın kapsam geçerliği düşük olur.

Ölçüt geçerliği, amatörce hazırlanmış veya yeni ve daha kullanışlı bir ölçme araç veya yönteminin, profesyonelce hazırl anmış veya güvenilir ve geçerli olan bir ölçme araç veya yöntemiyle benzer sonuçlar verip verme. diğinin belirlenmesiyle kestirilen bir geçerlik türüdür.

Tablo 5-4: Belirtke Tablosu: Gelişim ve ~renme Dersi Vize Sınavı icin Kaosam Gecerliai Düsük Davranıslar Omeklemi Davranış Düzeyleri Bilgi Kavrama Uygulama Toplam Konu (Üniteler) 1. Giris. fiziksel aelisim 4 10 14 o 2. Silisse! aelisim 3. Ahlaki aelisim 4. u cirenme ilkeleri 4 3 4 11 5. Biloi isleme kuramı Toolam 8 13 4 25

Hastaların ateşini ölçen özgün ve çok pratik (kullanımı daha kolay ve daha hijyenik) bir yöntem geliştirmiş olun. Bu yöntemin geçer-

liğini nasıl kanıtlarsınız?

Tablo 5-4'te sunulan örnekte; 2., 3. ve 5. ünitelerden hiç soru seçilmemiştir. Sınavda yoklanacak davranışlar 1. ve 4. üniteden seçilmiştir. Ünite

4 ile ilgili "bilgi ve uygulama· düzeylerindeki tüm davra nışlar s ınav kapsamına a lınırken , aynı üniteden •kavrama" düzeyindeki 8 davranıştan 3 tanesi sınav kapsam ına alınm ışt ır. Anlaşılacağı üzere Tablo 5-4'te sunulan davranışlar örneklemi , Tablo 5-1 'deki belirtke tablosunda veri l m i ş olan evrendeki davran ışları temsil için yetersizdir. Aynı şeki ld e, Tablo 5-4'teki gibi bir davranış ömeklemi de d üşük bir kapsam geçerl iğine sebep olur.

Cevabınızı yazınız ;

Tablo 5-5: Belirtke Tablosu: Gelişim ve Öğrenme Dersi Vize Sınavı icin Kaosam GP-1":erliCi Yüksek Davranıslar Örneklemi Davranış Düzeyleri Bilgi Kavrama Uygulama Toplam Konu /Üniteler\ 1. Giris, fiziksel aelisim 2 5 o 07 2. Bilissel aelisim 1 4 o 05 3. Ahlaki aelisim 3 2 o 05 4. ,nrenme ilkeleri 1 1 04 2 5. Bilai isleme ku ram ı 1 2 1 04 Toolam 8 15 2 25

Yukarıdaki

soruya

vereceği niz

cevaplar ölçüt

geçerliğine

yönelik ola-

caktır. Ölçüt geçerliği: geçerliği çalışılan bir ölçme aracıyla, geçeni olduğu

kabul edilen bir ölçme aracının (ölçüt) ayn ı d eneklere uygula n mas ı sonucu elde edilen ölçümler arası nd aki korelasyondur (uygunluk geçerl iği ). Aynı zamanda ölçüt geçe~iği : ölçülmek istenen değişken için (başarı gibi) yordayıcı olarak kabul edilebilecek başka bir değişkene (yetenek gibi) ait ölçümlerden faydalanarak. ç ıkarımda bulunma yöntemidir (yordama geçerliği). istatistiksel olarak ölçüt geçerliği anlamındaki geçerlik katsayısı; ölçüt kabul edilen bir testle, aynı değişkeni ölçmek için hazırlanmış (geçerliği çalışılan) başka bir testten alınan puanlar arasındaki korelasyon katsayısının hesap l anmasıyla elde edilir.

Tablo 5-1'de sınav kapsamıyla ilgili olarak verilen davranışlar evreni tüm davra nı ş ve ünite düzeylerinden %25'1ik bir ömeklem a l ın ­ mıştır. Sınavda sorulacak soru sayı sı olan 25, tüm davran ışların ¼'üne denk gelmektedir. Dolayısı yla, Tablo 5 -5'deki sınavda yoklanacak davranışlar örneklemi Tablo 5-1'de verilmiş olan davranışlar evrenini önceki ör• neklere kıyasl a çok daha yeterli bir şekilde temsil etmektedir. Tablo 5 -5 kapsam geçerliği açısından uygun bir örnektir. o l uşturan

Genelde iki tür ölçüt geçerlik katsayıs ı tanımlan maktadır: a. Uygunluk geçerliği (concurrent validity) b. Yordama geçerliği (predictive validity)

162

163

·-·> ·-

o.

Ölçümleri" G~erliği

Öğrotimdı: Ölçme ,·e Değerleıulinne

154

153

Ölçüt geçerliğinin hangi anlamda tanımlandığı, geçerliği çalışılan ölçümlerin kullanım amacı ve kriter(ölçüt) değişkene ait ölçümlerin elde edilme zamanına bağlıdır.

Yordama

Geç erl iğ i

Örnek 1: Öğrencilerin Üniversiteye Giriş Sınavındaki başarısından (yordayıcı)

Uygunluk Geçerliği: Geçerliği çalışılan veya yeni bir ölçme aracıyla elde edilen ölçümlerin ölçüt olarak kullanı l an ölçme aracıyl a elde edilen ö lçümlerle benzer veya uyumlu olma düzeyi ile ilgilidir. Uygunluk geçerliğinde hem geçerliği ça lışıla n ölçme aracıyla hem de ölçüt kabul edilen ö lçme ara cı yl a elde edilen ölçümler aynı anda veya çok k ısa bir zaman aralığıyl a elde edilir.

faydalanarak üniversite başarısının (ölçüt) yordan ması . örnek 2: Öğrencinin mezuniyet notundan (yordayıcı) faydalanarak iş hayatındaki başarısının (Kriter) yordanması .

Uygunluk Geçerliği Örnek 1:

Anlaşılacağı üzere yordama geçerliğinde , geçerl iği çalışıla n testle bir yordama yapılmaktadır ve bu yordamanın uygun l uğu hesaplan maktadır.

Geçerliği kanıtlanmış standart bir testle, geçerliği çalışılan öğretmen yapım ı bir testin k ı sa süreli a ra lıkl arla uygul a nmas ı sonucu ekte edilecek ölçümler aras ı ndaki korelasyon katsayı sı .

Özetle, uygunluk geçerliğinde değerlendirmeye konu olan değişken­ lere ait ölçümlerle kriter ölçümler aynı anda, yordama geçerliğind e ise kriter ölçümler ileriki bir tarihte elde edilmektedir. Ölçüt geçerliğinde önemli bir nokta da yordanan (ölçüt) değ i şkene ait ölçümlerle, yordayan değiş ­ kene ait ölçümlerin güveni rliğinin ve geçerli ğinin yüksek olm as ı gerektiği ­ dir.

örnek 2: Uygunluk geçerliğini n yaygın kullanım ı olarak geçe rliği ve güvenirl iği kanıtlanmış olan uzun testlerin kı sa versiyonla rını hazırl ayıp, bu iki versiyonun k ısa süreli aralıklarla uygulanması sonucu elde edilen puanlar arasında ki korel8syon katsayısı .

Olcüt Gecer/iğinin Asama/arı Anlaşılacağı üzere, uygunluk geçerl iğinde hem geçerliği çalışılan hem de ölçüt test puan ları aynı anda veya çok k ı sa bir zaman a ralığında elde edilebilir. Uygunluk geçerl iğinde geçerli ği çalı şılan testin ölçüt testle uyumlu (benzer) puanlar verme durumlarına göre, geçerliği çalışılan test puanl arı nın ne derece geçerli o lduğ una (ölçüt veya kriter teste göre) karar verilir.

1.

Geçerliği

önceden

kan ı tlanm ı ş

bir (kriter veya ölçüt) ölçme

aracının

uygul anmas ı

2. Geçerliği çalışılan (yeni veya yordayıcı) bir testin uygulanması 3. İki uygulamadan elde edilen ölçümler arasındaki korelasyon katsayısı­ n ın hesaplanm as ı.

Yordama Geçerliği: yordama geçerliğinde geçerli ği ça lı şıla n bir testle test) daha sonra elde edilecek olan kriter test pua nl arı n ın benzer puanlar verme durumuna göre yordayı cı test ölçümlerinin geçerl iği h akkında karar verilir. Yordayıcı testin amac ı, gelecekte belli olacak bir deği şkene {kritere) yönelik olarak tahminde bul unmaktır . Anlaşılacağ ı üzere yordama geçerl iği , yordayıc ı bir testin ku llan ı mıyla , ki şilerin ileriki bir tarihte elde edilecek olan kriter değişkendeki performanslarının geçerli bir şekilde tahmin ed ildiğiyl e ilgilidir. Kısacası, yordama geçerliğinde gelecekteki bir durum (başarı gibi) tahmin edilir. Aşağıda yordama geçerli ğine yönelik olarak iki örnek veri l m i ş ti r.

Ölçüt kabul edilen testle, geçerliği çalışılan (yeni veya yordayıcı) test korelSsyon yüksekse yeni veya yordayıcı test geçerli kabul edilir. Tabii ki, burada en ö nemli sorun uygun bir ölçüt test bulma

(yordayı cı

puanları a rasın daki zorluğudur.

Ölçüt geçerliğinin üst sınır değeri. geçerliği çalışılan ve ölçüt test puBu durum ölçme literatüründe aşağıdaki eşi tlikle gösterilir: anlarının gü venirl iği ne bağlıd ır.

164

165

·-·> ·-

o.

Ölçümleri" G~erliği

örnek: Yapı geçerliğinin mantıksal olarak belirlenmesi: İlköğretim kelime hazinesini ölçmek için hazı rtanan bir testin yapı geçerliği aşağıdaki gibi belirlenebilir.

Birden çok yordayıcı değişken ve test so nuçları ol duğunda, yordama geçe rtiğ inin tespitinde kullan ıl a n istatistiksel tekniklerden bili de çoklu regresyondur. Çoklu regresyonda; iş perfonna nsı gibi bir ölçüt test (bağımlı değişken olarak) belirlenir. Bu testten elde edilen ölçümler üzerinde etkisi olduğu düşünülen bağımsız değişken/erregresyon eşitliği ne sokularak, birden çok sayıda olan bağımsız değişkenleri n, ölçüt değişkeni yordamadaki yeterlik ve etkililikleri belirlenir. 3. Yapı Geçerliği Kanıt ı -Teorik Construct Validation) Yapı geçerliği

Yapıyı

bir testin veya ölçme

öğrencilerinin

TEORi: ilköğretim çağındaki öğrencilerin kelime hazineleri sınıf düzeyi arttıkça artar. ÖLÇÜMLER: ilköğretim üçüncü, beşinci ve yedinci sınıf öğrencilerine kelime hazinesi ölçen ve 100 üzerinden kelime hazinesi puanları veren bir test uygulanmış ve aritmetik ortalamalar aşağıdaki gibidir.

Destekleme (Evidence of

işl em inin

teorik bir

yapıyı

Öğrotimdı: Ölçme ,·e Değerleıulinne

156

155

üçüncü sınıf 30

(veya

Beş inci sınıf

50

Yedinci sınıf 80

özelliği) ölçüp ölçmediğinin belirlenmesidir. Başka bir ifadeyle, bir ölçme aracında n

elde edilen ölçümlerin teorik olarak ölçülmek istenen

yapıy ı

doğrulayıp doğrulamadığına dair kanıt toplama çalışmasıdır. Anlaşıla­

YAPI GEÇERLiĞi YORUMU: Aritmetik ortalamalar sınıf düzeyi arttıkça önemli bir miktarda artmaktad ır. Bu bulgu teorik yapıya ters düşmemektedir. Yani, ölçümler ölçülen değişkenle ilgili olarak var olan teorik yapıyı doğrulamaktad ır. Bu nedenle hazırla nan kelime hazinesi testinin yapı

cağı

üzere yapı geçertiğ i çalışması genel olarak hem teori oluşturmada hem de teori test etmede kullanılabili r. Bu teorik yapı ile kastedilen: başarı . yaratıcılı k, zeka, kişilik gibi bireyferin doğasında var olan özelliklerdir. Bu teorik yap ılar soyut değişken ol d ukları için dolaylı bir şek ild e ölçülmektedirler.

geçerliği vardır .

Mantıksal olarak ölçümlerimizin teoriyi destekleyip desteklemediği çalışılabilir. Mesela, belli yı llarda yaş arttıkça zekanın da arttı ğını teorik ola-

Çal ışılan

konu ile ilgili kabul edilen teorik yapıyı ölçecek şek ilde olu ş­ bir ölçme arac ından elde edilecek son uçların bu teorik yapıyı doğru l amas ı , o ölçme aracının yap ı geçerli ğini n yüksek ol d uğunu kanı tla r. Çünkü ölçme ara cı d izayn edi ld iğ i teorik yapıyı ölçmektedir.

rak biliyorsak, elimizde yaşlara göre düzenlenen bir zeki! testi varsa ve a yn ı test farklı yaşlardak i bireylere uyguland ı ğ ında , yaş arttıkça çocukl arın doğru cevapladıkları madde sayıs ı da artı yorsa bu durum, testin yapı geçerliğine bir kanıttır. Hazırlanan bir zeka testinin yapı geçerliği çalışılacak olunsun, zekanın ne old uğu ve nasıl gel iştiği ne dair ortaya konu lmuş baz ı teorik yap ılar va rdır. Yapı geçerliği ça lışmas ının temel mantığı : ölçülmesi planlanan teorik yapıya yüksek derecede sahip olan bir g rupla, düşük derecede sahip olan bir gruba (örneği n) hazırlana n bir zeka testini uygulay ıp, zeki! testinin bu grupları uygun olarak ay ı rıp ayırmad ı ğını kontrol etmektir. ilköğretim öğrencilerinin yaşları veya sınıf düzeyleri arttıkça zeka d üzeylerinin de arttığı teorik olarak bilinmektedir. Yapı geçerliği çal ışılan bir zeki! testinin, ilköğ retim 3., 4., ve 5. sın ıf öğrencil e rine uygulanması sonucu elde edilen a ritmetik orta lamal a rı n s ınıf düzeyi arttıkça (a nlamlı olabilecek miktarda) artması, bu zeka testinin yapı geçerliğini n ol d uğun u kanıtlar. Çünkü ölçümler teorik olarak kabul edilen yap ı yı desteklemektedir.

turu l muş

Günümüzde, istatistiksel olarak bir ölçme aracın ın yap ı geçerliğini çalı şmada; aç ıklay ıcı (explanatory) faktör analizi, doğrulayıcı (confirmatory) faktör analizi veya yapısal eşitleme modeli (structural equating) gibi teknikler kullanılmaktadır. Bu teknikler, maddelere verilen cevapların belirttiği teorik yapı yı ortaya koymakta veya savunulan teorik yapının uygunlu ğ unu

166

kontrol etmektedir.

167

·-·> ·-

o.

Ölçümleri" G~erliği

Test Puanl arının Yorumlanmasına Yönelik Geçerlik

Kanıtları

AERA, APA, NCME, (2014: 14-21) test puanlarından faydalanarak ortaya konulabilmesi için beş kanıt türünü sunmaktadır. Bunlar aşağıda kısaca sun ulmuştur: 1. Test i çeri ğine dayalı kanıl 2. Yanıt süreçlerine dayalı kanıt 3. iç yapıya dayalı kanıt 4. Diğer değişkenlerle olan ilişkilere dayanan kanı l 5. Testin sonuçl arı ve geçerlik için Kanıt

Geçerli!ji Etkileyen Faktörler

yap ıl an yorum l arının geçerliğin i n

4.

Görünüş Geçerliği Kanıtı

Öğrotimdı: Ölçme ,·e Değerleıulinne

158

157

Ölçmek islediğimiz değişken dışındaki özelliklerle ilgili faklörlerin ölçümlere karışması söz konusu ölçümlerin geçerliğini düşürür. Sislemalik ve sislematik olmayan halalar da geçerliği düşürür. Aşağıda geçerliği düşü ren etkenlerden bazıları k ısaca sunulmuştur.

1. Amaca Uygunluk Ölçümlerimize ait geçerliğin düşük olmasına neden olan eıkenlerden biri de, ölçme amacımıza uygun olmayan uygulamalardır. Ölçme amacı­ mıza uygun olmayan yönlem veya leknik kullanmak ölçümlerimizin geçer-

(Evidence of Face Validity)

l iğin i düşürür.

Bir ölçme aracının. ölçmek istediği değişkeni ne derecede ölçebilir göründüğüdür. Genelde ölçme aracının geçerliği, aynı konuda çalışıl an iş arkadaşlarından alınan görüşlerle belirlenir, bazen bu görüş öğrencilerden de alınabilir, nihayetinde uzman olmayan kişil erin de gö rüşleri ni içerir, Geçerlik bulma yöntemlerinde kullanılan kriterler aşağıdaki tabloda özetlenmektedir.

(a) Ölçme Yöntemi Sınavın amacına uygun olan ve olmayan veya daha uygun olan ölçme yöntemleri vardır. Ölçme yönteminin ölçme amacına uygunluk düzeyi arttıkça elde edilecek ölçümlerin geçerlik düzeyleri de artar. Örneğin, öğren­

cilerin lngilizce kelimeleri doğru telaffuz edebilme becerilerini ölçmek için Tablo

5-ıl:

Geçerlik Bulma Yöntemlerinde Kullanılan Kriterler

Gl:ÇERLİ_K YONTEMI

Kapsam

sözlü yoklama yazılı yoklamadan daha uygun (geçerli) bir s ınav türüdür. Yani öğrencilerin İngilizce kelimeleri telaffuz edebilme becerilerini ölçmede

BULMA KRİTERİ

Geçer/iği

sözlü

durumuna

bilme.si açısından daha uygun olur. Benzer şekilde öğrencilerin kompozis-

Ölçme aracının, ölçOlecek niteliğin konu ve davranış boyutunu yeterince temsil etmesi ve soruların

yon yazma becerilerinin ölçülmesinde yazılı yoklama, çoktan seçmeli testlerden daha uygun bir sınav türüdür.

uygunluğu.

Ölçüt geçerliği

yokla manın kullanılması yaı:ılı yoklamanın kullan ılm ası

göre daha geçerli sonuçlar verir. Yani ölçmek istenilen değişkenin ölçüle-

Kulla n ılan ölçme yöntemi bireyin alacağı puanı etkiler. Yazılı yoklama. çoktan seçmeli test, doğru-yanlı ş testi veya sözlü yoklama gibi ölçme yöntemlerinden birinin seçimi ve uygu lanış biçimi ölçülmesi amaçlanan değiş ­ kenin ölçülebilme derecesini etkiler. Ayrıca seçilen bir ölçme yönteminin. örneğin yazılı yokl amanın veya çoktan seçmeli testlerin, farklı öğretmen­ lerce farklı kull anım şekli de söz konusudur. Bu farklı kullan ı m l ar sonuc.ı elde edilebilecek geçerlik katsayıları da haliyle farklılık gösterebilmektedir.

Geçe rliği çalı ş ılan ve ölçüt testten elde edilen puanıar arasındaki benzMik (korelasyon).

Uygunluk geçerli ği : Her iki test anda elde ediliyor.

puanları aynı

Yordama geçerliği: Ölçüt test puanları ileriki bir tarihte elde ediliyor ve amaç yordamada bulun• mak. Yapı Geçerliği

Ölçümleıin, ölçülen değişkenle ilgili olarak mevcut olan teorik yapıyı doğrul aması.

Görünüş Geçerliği

Aracın görünüşte

(b)

Sınav Kapsamı

ve

Zorl uğu

Bir başarı testinden alınabilecek puanları etkileyen önemli faktörlerden biri de o testte kullanı lan maddelerdir. Çoğu durumda, bir sınav süresince tüm davranışlar evrenini yoklamak olanaksız bazen de gereksiz old uğun­ dan dolayı, sınavda yoklanacak davranışların öğretmen tarafından seçimi

ne derece yeterli okıuğuna yö• nelik istatistiklere dayalı Olmayan ve sObjektif kabul edilen yargı.

168

169

·-·> ·-

o.

Ölçümleri" G~erliği

Öğrotimdı: Ölçme ,·e Değerleıulinne

160

159

söz konusudur. Sınavda yoklanacak davranı şl arı ölçmek için test maddeleri yazmak ve yazılan maddeler arasından bazıla rını seçmek söz konusudur. Soruların kapsam geçertiğine uygun olarak seçilmemesi durumunda ölçümlerin geçerliği ve güvenirliği düşer. Seçilen test maddelerinin nitelikleri hem test puanlarının güvenirliğin i hem de kapsam geçerliğini ö nemli ölçüde etkilemektedir.

standart puanına göre puan verdiğimizde. öğrencinin almış olduğu sına va ait veya önceki yıllarda veya daha başka gruplardan elde edilmiş olan aritmetik ortalama ve standart sapmadan faydala nılması söz konusudur. Mesela öğrencinin T standart puanı cinsinden puanının 50 olması nonn olarak belirlenen aritmetik ortalamaya eşit puan alması durumunda gerçekle-

Soru seçiminin sınavın amacına uygun olma durumu da s ınav puanlarının geçerliğini etkiler. Örneğin çok az kişinin seçileceği bir sınava çok fazla aday müracaat etm işse. sınav soru ların çok kolay ol ması sınavın amacına hizmet e tmesine olanak sağlamaz. Bu durumda sınav sorularının zor ol ması gerekir. 1O kişini n seçilmesi için yapılan bir s ın avda 100 kiş i tam puan alırsa o s ınavın (en iyi 1O kişiyi seçme) amacına uygunluk düzeyi yani geçerli ği düşü k olur. A nla şıla cağı üzere, soru l arın zorl uğu veya kol aylığ ının s ınav amac ın a uyg unl uğ u da ölçümlerin geçerliği ni eU ·-

o.

&q·ıırı

Testi Geli.ştimı t! ,,e Uygulıuıuı

177

178

M.3.1.2.4. Zihinden toplama işlemi yapar.

M.3.1.5.2. Birler basamağı sıfır olan iki basamaklı bir doğal sayıyı 10'a kısa yoldan böler.

M.3.1.2.5. Bir toplama işleminde verilmeyen top/ananı bulur. M.3. 1.2.6.

Öğr't.tiııııle Ölçme ~·e /)eğerleııdirmt!

M.3.1.5.3. Bölme işleminde bôlünen, bölen, b ·-

o.

&q·ıırı

Testi Geli.ştimı t! ,,e Uygulıuıuı

183

184

6. Nihai Testin Oluşturulması

Beşinci aşama

olan ön uygulama ve madde analizi sonucunda, öncegerekli gözden geçirme ve düzeltmeler yap ıl malı, bir davranışla ilgili tüm sorular kötü çıkmı şsa bu davra nışlarl a ilgili sorular tekrar yazıl malı, sonra, testin tümüne ait iç tutarlılık katsayıs ı h esaplan malı­ dır. Eğer bu iç tutarlılık katsayısı (güvenirlik) düşükse tekrar en başa dönülmelidir. Ölçülecek değişkenin kaç boyutlu olduğuna yönelik veya teorik o larak neyin ölçüldüğün e yönelik çalışmaları gözden geçirmek gerekebilir. likle soru

Madde analizi sonu çlarında n faydalanarak, testte yoklanacak davraher bi ıi için, o davranışı ölçmek amacıyla h azırl anan sorulardan en iyisinin teste alınmasıy1a güven irli ği ve geçerliği yüksek olabilecek bir nihai test oluşturulur. nışlardan

Madde analizi: sadece bir nihai test geli ştirme amacıyla deği l, ayn ı za. manda kullanılan soruların güçlüğü, ayırt ediciliği ve güvenirliği gibi bazı istatistiksel özelliklerinin tespit edilmesi suretiyle soru bankası oluşturmak amacıyla da kullanıl abilir. Bir başa rı testi geliştirmede söz konusu olan bu aşamalar Şekil 6-1 de gösterilmektedir. 1

Öleme Amacının (Davran ıslar Evreni nin) Belirlenmesi

2

Oavranıslar Örnekleminin Belirlenmesi

3

Model Öleme Aracının Olusturulması

4

Ön Uygulama için Testin Oluşturulması ve Uzman Kanıl arı /2,3 veya S'e, ait)

5

Ön Uvnulama ve Madde Analizi 11 veva 6'va ait)

6

Nihai Testin Olusturu lması

Öğr'e.riııııle Ölçme ~·e /)eğerleııdirmt!

baz ında

Eğer yeterli bir iç tutarlılık katsayısı elde edilmiş ise son aşamada, madde analizi sonuçlarından faydalanarak nihai test geliştirilm iş olunur.

Testin Uygulanmasıyla İlgili Diğer Hususlar W u, Tam & Jen'in (2016) beli rttiği gibi test u ygulaması , ölçme sürecinin önemli bir adımıd ır. Test uygulaması, bir testteki soruların sıra anlamında düzenlenmesini, bir sınava katılacak öğrencilerin seçilmesini, sınav sürecinin izlenmesini ve test formları için veri dosyaların ın hazırlanması nı içe. rir. Kötü test uygulama i şlemleri toplanan verilerde sorunlara yol açar ve test sonuçlarının geçerliğini tehdit eder.

Şekil 6-1: Ölçme Aracı Geliştirmenin Temel Aşamaları

Testin uygulanmasıyla ilgili olarak çok titiz olunması gereken önemli hususlar vardır. Hazırlan an test, !esti n geli şti rildiği grubu temsil eden uygun örneklem grubuna hem testin güvenirlik ve geçerliği hem de test güvenliği ile ilgili hususlar dikkate alına rak uyg ul anmal ıdır.

geliştirmek

6-1'den anlaşılacağı üzere; Güvenilir ve geçerli bir ölçme aracı için ilk iki aşamada, testin amacının, davranışlar evreninin ve ömekleminin belirlenmesi çok net olarak hatta mükemmel bir şekilde ya-

Örneklem: Testin uygulanacağı ömeklemin evreni temsil gücünün yüksek olması önemlidir. ö rnekleme metotları bilimsel araştırma teknikleri dersi-

pıl malıd ır.

nin önemli bir konusudur. Burada örnekleme metotları aç ıkl anmayacağ ın ­ dan bu konuyla ilgili olarak bilimsel araştırma kaynaklarından faydalanmanız önem taşımaktadır. özellikle başarı testi geliştirme amacıy1a olasılığa dayalı olan (rastgele) ö rnekleme yöntemlerinden birinin kullanılması önerilir. Evrenin yapısın a göre iki veya üç kademeli örneklemenin kullanım ı da uygun olabilir. Özellikle ilk aşama da farklı okul türleri olduğu dikkate alı­ narak evrenin tabakalara uygun bir şekilde ayrılması çoğu durumda önemli bir örnekleme aşamas ıdır. Daha sonraki aşamalarda küme veya basit rastgele örnekleme g ibi uygun bir örnekleme yaklaşımı kullanılmalı­ dır. Anlaşılacağ ı üzere ömeklem seçmedeki kilit husus seçilen örnek/emin evreni temsil etmede yeterli olacağının kanıUanmasıdır.

Şek il

Üçüncü aşamada, seçilen davranışların uygunluğu, davranışları ölçmek için yazılan sorularla bir model ölçme ara cı oluşturulmaktadır. Oluş­ turulan bu model ölçme aracı denenip gel iştirilecek bir ön uygulama testidir. Dördüncü aşamada ön uygulama yapmak için uzma nların görüşleri içerik ve yazılan soruların uygunluğu çalışılmalıdır. Bu aşamada tespit edilen içerik yetersizli ği, kusurlu soru veya test düzeni ile ilgili hususların düzeltilmesi amacıyla tekrar üçüncü gerekirse ikinci aşamaya da dönülmelidir. alınarak

194

195

·-·> ·-

o.

&q·ıırı

Testi Geli.ştimı t! ,,e Uygulıuıuı

Öğr't.tiııııle Ölçme ~·e /)eğerleııdirmt!

186

185

Bu kitapta "Test ve madde puan l arının analizi" ünitesinde açıkl anan madde analizi yönteminin uygulanması için 100 kişilik bir örneklem büyükl üğü yeterlidir. Ama daha sağlıklı sonuçlar elde etmek için veya ü st grup alt grup gibi diğer analiz yöntemlerini uygulayabilmek için en az 200 kişilik bir gruba uygulamayı yapmak gerekmektedir. Bu konuda kullanılacak istatistiksel tekniklere göre de örnek.lem büyüklüğü önerileri mevcuttur. Örneğin açıklay ıcı faktör analizi uygulanacaksa en az 300 kişil ik bir ömeklem büyüklüğü ölçme literatüründe önerilmektedir. Testteki soru sayısının en az 10 katı gibi ömeklem büyüklüğü önerileri de mevcuttur. Örneğin ölçme aracınız 25 sorudan oluşuyorsa en az 250 kişiye uygu l anmalı gibi. Güvenirtik ünitesinde de vurgu l andığı gibi küçük örneklem genelde homojen bir grup olduğundan dolayı ranjda daralma (daha homojen veya uç bir gruba sınavın uygulanması) sorununa sebep olabilir. Bu durumda iç tutarlık anl am ı ndaki güvenirlik katsayısı ol duğundan çok daha düşük çıkar.

Test G üven l iği: Testin uygulanması , pua nlanması ve ilan edilmesi işlemi ­ nin tamamlanması na kadar dikkat edilmesi gereken diğer çok önemli bir husus da test güvenl iğid i r. Test güvenl iği derken aşağ ı daki gibi hususlar kastedilmektedir: ✓

Testin veya k ı smi olarak test sorularının çalınmaması.

✓ Uygulama sırasında sorulann yasal olmayan yollarla ele geçirilme-

mesi ve kopya çekilmemesi. Puanlama işlemi tamamlanana kadar sınav evraklarının güven liği­ nin sağl anması. ✓ Test sonuçlarının ilan edilmeden önce saklandı ğı elektronik ortam✓

ların güvenliğin in sağlanması.

Test güvenliği sağlanmadığında, diğer tüm analiz sonuçları ve ölçümlere olarak alınacak karartar hatalı olacaktır. Bu nedenle test güvenliğ i ölçme ve değerl end i nne açı s ından titizlikle üzerinde du rulmas ı ve sağlan­ ması gereken bir durumdur. Test güvenliği sağl anmadığında bazı ki şi veya gruplara test sonuçları HAKSIZ avantajlar sağlamakta veya önemli bir yanlılığa neden olmak tadır. dayalı

Güvenirlik ve Geçerlik: Ölçme aracının uygulanması koşullarına bağlı olarak ölçme aracından elde edilecek ölçümlerin güveni rliğini ve geçerli• ğini etkileyecek diğer önemli hususlar aşağıda sunulmuştur: ✓

Sınavı n uygu l anmasında

mudaka

farklı

test fonnlan

hazırlanmalı­

dır. ✓

Test soru ları test formu haline getirilmeden önce tüm sorular titizlikle kontrol edilmelidir. Bu kontrol ölçülen alan bilgisi , ölçme ve değertendinne ve dil bakımından yapılmalıdır. ✓ Farklı test formlarının s ınıf içinde öğrencilere nasıl dağ ıtı lacağına yönelik uygun bir s ı nav pl anı sınıfın fiziki koşulları da d ikkate alı­ narak yapılma lı dır. ✓ Sınavı n uygu lanmasıyla ilgili olarak önemli bir husus da tüm sınıf­ larda sınavların aynı koşu llarda uyg ulanmasının sağlanmasıdır . Sınav süresi ve uygulanan işl em ve aşamal arı tüm sınıflarda standart olmalıdır. ✓ S ı navı alan öğrencilerl e ilgili bazı demografik bilgiler alınmalıdır. Bu bilgiler madde analizi ve yanlılıkla ilgili analizlerde fayda sağla­ maktad ır.

196

197

·-·> ·-

o.

&q·ıırı

Testi Geli.ştimı t! ,,e Uygulıuıuı

Öğr't.tiııııle Ölçme ~·e /)eğerleııdirmt!

188

187

ÜNİTE SORULAR!

ÖZET Öğrencilerin bir öğretim programına başlamadan önce, öğrenci giriş

1.

davranışların ı tespit etme, programın işl erliğini ve öğrencile rin öğrenme güçlüğü yaşadığı hedefleri belirleme, öğrencilerin öğrenm e düzeylerini be-

Başarı testi gel iştirmeni n temel aşama ları nelerdir? Somut bir örnek üzerinde bu aşamal arı kı saca açıkl ayını z.

2.

Başarı testini geliştirmede örneklem seçiminde nelere dikkat edilmesi gerektiğ i ni somut bir ö rnek için açıklayın ız .

lirleme ve benzeri amaçlar için öğ renci l ere çeşitli s ın avların yapıl ması mümkündür. Eğiti m sisteminin süreç ve çıktı öğesinde öğrencil erin dersin hedef davran ı şla rını kazanma du rumlarını ölçmek amac ı yla: izleme testleri başarı testleri veya tutum ölçekleri ve anketler gibi bazı testler uygula-

3. Başarı testi geliştirmede alınması gereken güvenirlik ve geçerlik tedbirlerini açıklayınız. 4. Başarı testi geliştirmede a lın mas ı gereken güvenlik tedbirlerini

nır.

aç ı kl ay ını z . EğiUm

sistemimizde, öğrencilere genelde başarı testleri uygulanmaktadır . Bir dersteki başarıyı ölçmek amac ı yla bir başarı testi ge liştirmede yap ıl mas ı gereken bazı aşamal ar söz konusudur. Bu aşamalar 6 aşama halinde aşağıda beti m le nmiştir .

SINIF-İÇİ UYGULAMA

1. Ölçülecek Davranışlar Evreninin Tam Olarak Tanımlanması 2. Ölçülecek Davranışlar Örnekleminin Belirlenmesi 3. Model Ölçme Aracının Oluşturulması

1. Öğrenim gördüğünüz programla ilgili olarak ilkokul, ortaokul veya lise düzeyinde bir ders ve sı nıf düzeyi seçiniz. 2. Seçtiğ iniz bu dersin 2 veya 3 ünitesini belir1eyerek, bu üniteler1e ilgili olarak Milli Eğiti m Bakanlığı'nın http://mufredat.meb.gov.tr/ adresinden tüm kazanımları indiriniz. 3. Grup olarak bu kazanıml a rdan kritik ol anları davranışlar ömeklemi olarak belirleyiniz. 4. Hem davran ı şl ar evreni hem de ö rneklem için belirtke tablosu ha zırlayarak seçtiğiniz davran ışlar için geliştirilecek başarı testinin kapsam geçerli ğin e yönelik yorumlar ya pını z .

4. Ön Uygulama ve/ya Uzman Kanısı 5. Uygulama ve Madde Analizi 6. Nihai Testin Oluşturulması Test u ygul amas ı , bir testteki maddelerin sıra anlamında düzenlenmesini, bir s ınava katılacak öğren cileri n seçilmesini, sınav sürecinin izlenme-sini ve test forml arında veri dosyal arının hazırlanmasını içerir. Hazırlanan test, testin geliştiri ldiği grubu temsil eden uygun örneklem grubuna hem testin güvenirlik ve geçerliği hem de test güvenliği ile ilgili hususlar dikkate alınarak uygu lanmalıdır.

198

199

·-·> ·-

o.

190

- - - - - - - - - - - - ' / üNiTE 7

MADDE ANALİZİ

Bu ünitenin yeterli düzeyde anıaşı/ması için "Öf• çamıerin güvenirliği ve standart hatası • ve •rest sonuçlarının yorumlanması ve gen· bildirim" ünitelerinin ögrenilmesi gerekmektedir.

Bu bölümde sunulan madde analizi, maddeler 0-1 (iki kategorili) puanlama yöntemiyle puanlandığ ında başarı testlerinde kullanılan teknikleri içermektedir. Bu kısımda klasik test teorisine uygun olarak, çoktan seçmeli test maddeleri için madde analizi sunulmaktadır. Güvenilir ve geçerti test elde etmek için kaliteli test maddelerini kullanmak gerekmektedir. Madde analizi istendik bazı niteliklere sahip nihai bir test geliştirmek amacıyla kulla nılabileceği gibi, test geliştirmeyip bir testte kullanılan maddelerin kalitesiyle ilgili bazı teknik bilgilerin elde edilmesinde de kullanılabili r. Ayrıca madde analizi, öğrencilerin hangi konularda öğrenme güçl üğüne sahip olduklarını da gösterir ve öğrenme materyalinin gruba uyg unluğ u ha kkında da bilgi verir. Her ne amaçla olursa olsun: uygu l anmış bir test için madde analizi yapı lırken öncelikle öğrencil erin testi olu şturan maddelere verdikleri cevaplar aşağıd a görülen N satır (öğren ci sayısı) ve K sütundan (soru sayısı) oluşan "madde cevapları veya madde puanları" metrisine kaydedilir.

TEST VE MADDE PUANLARININ ANALİZİ MADDE ANALiZİ Madde Cevap ve Madde Puanları Matrisi Madde Cevaplarının Seçeneklere

Dağılım ını n

Öğrt.riımle Ölçme ~·e /)eğerleııdirme

Analizi

Bazı Madde ve Test istatistikleri

Tablo 7-1a: Örnek Madde Cevapları Matrisi

Madde Güçl üğü, Pi

MADDE CEVAP MATRiSi

Madde Varyansı, sı'

Test

Madde Standart Sapması , s;

Ôğr.

Madde Ayırt edicilik Gücü, rı, Madde Güvenirli ği, ~ TEST iSTATiSTİKLERi Madde istatistiklerinden Faydalanarak Test Puanların ın Güvenirliği­ nin Bulun ması Ölçmenin Standart Hatası, s.

1ıeı

2ıcı

1

B

C

A

2

B

A

C

3

D

A

C

4

B

C

B

5

B

B

E

N

C

E

A

Maddeleri Kıeı

ÖZET ÜNİTE SORULAR! SINtF-IÇI UYGULAMA PROJE

200

201

·-·> ·-

o.

Test •-e Matltle />uaıılıırımn Aııtıliz.i

Öğrt.riımle Ölçme ~·e /)eğerlendirme

192

191

Tablo 7-1b: Örnek Madde Puan ve Çeldiriciler Matrisi

Tablo 7-1c: Örnek Madde Puanlan Matrisi

MADDE PUAN VE ÇELDiRiCiLER MATRiSi Test

Oğr.

1ıoı

n

Tes t Kıoı

1

1

A

C

D

A

C

1

B

B

E

C

Maddele ri

2ıcı

1

1

MADDE PUANLAR! MATRiSi

X 1 coı

2ccı

.............

3(A)

Kısı

1

1

1

1

1

2

1

A

3

o

o o

C

4

1

1

1

5

1

o

o o o o

............. .............

C D

.............

o

n

o

............. .............

1

o o o o K

n



Tablo 7-1b'de görü ldüğü gibi madde puan ve çeldiriciler matrisinde, eğer öğrenci maddeyi doğru cevaplamışsa, o maddeden aldığı puan (1 puan) matrise yazılır. Eğer öğrenci o maddeyi yanlı ş cevapl am ı şsa i şaret­ l edi ği çeldirici (yanlış seçenek) matristeki hücreye yazı l ır. Madde puan ve çeldiriciler matrisinin hazırl anmasında n sonra, her madde için öğren ci cevaplarının seçeneklere göre dağıl ı m ın ın tespiti de kolayl aş ır. Tablo ol uş­

o

.............

............. .............

Madde cevap matrisi Tablo 7-1a·da görüldüğü gibi sadece öğrencinin cevap o larak seçti ği seçeneğ i n yazıl mas ı yla elde edilir. Bazı madde analizi paket prog ramla rında Tablo 7-1a'daki gibi madde cevap matrisi kullanılır.

(Öğrenci puanı = Doğru cevap sayısı)

Öğrenciler

E

E

Maddeleri

Ix =I 1ı 1

(Madde

l= I

Puanı)

J= l

Madde puanları matrisinde saıı rtarın toplamıyla öğrenci puanları (Xı) bulunur. Yani, testte 30 soru varsa her soru 1 puan old uğundan 30 üzerinden öğren cileri n aJdıkları puanlar bulunur. Matriste sütunl arın to pla mıyla da madde puanla rı (maddeyi doğru cevaplayan öğren ci sayıs ı ) bulunur. Madde puanları matrisinde öğrenci puanlarının toplamla rı yla madde pu-

turulurken öğrencileri testten en yüksek puan alandan en düşük puan alana doğru sıralamak sonraki analizlerde bize kolaylık sağlar. Maddece-

·o·

vap tablosunda doğru cevaplar · 1·, doğ ru olmayan cevaplar olacak şe­ kilde olu şturulduğu nda elde edilen matrise "madde puanlan matrisi' de-

anlarının toplamları

birbirine eşit olur. n

K

i:rl

j: I

Ixı = Iıı

nilir.

(öğrenci puanlarının toplamı

202

= madde puanlarının toplamı)

203

·-·> ·-

o.

Test •-e Matltle />uaıılıırımn Aııtıliz.i

193

194

Öğrt.riımle Ölçme ~·e /)eğerlendirme

Seçenek Analizi

Tablo 7-2: Örnek Madde Cevapları Dağılımı Tablosu

Farklı Başarı Grupların ı n O l uşturulması: Seçenek analizi yapmadan ö nce testi alan grup içinde başa rılı olan (üst grup) ve başarısız olan (alt grup) grupların belirlenmesi gerekir. üst veya alt grupta yer almayanlar orta düzeyde başarı grubu olarak nitelendirilir. Orta düzey başarı grubu seçenek analizinde dikkate alınır ama üst ve alt gruplara dayalı olarak he• saplanan madde güçlüğü ve madde ayırt ediciliği h esaplamalarında dikkate alınmaz. Bu kısımda madde istatistiklerinden ziyade cevapların seçeneklerdeki dağılımının uygunluğunun yorumlanması temel amaç ol duğun­ dan orta düzeyde başarı gösteren grup da seçenek analizi tablosunda kul-

Madde No: 1

A

B

c· o

E

Boş

n

Ust grup

2

2

60

6

10

-

80

Orta grup

8

10

40

12

10

Alt grup

16

24

20

2

18

80

C,,

.50

.50

80

Bu şekilde düzenlenen bir tabloyla bir maddenin başarı açısından iyi, o rta ve zayıf kabul edilebilecek öğrenci grupları için hem doğru cevap hem de seçeneklerin dağılım frekansl arı betimlenir. Bu tablodan faydalanarak; bir çoktan seçmeli test maddesinin iyi işleye n ve iyi işl emeyen seçenekleri bir istatistiksel hesaplamaya gitmeden, kabaca, tespit edilerek (varsa) maddenin kusuru hakkı nda bazı ç ıkarımlarda bulunulabilir.

l anılacaktır.

Kelley"in (1939) çalışmas ında gösterildi ği gibi, başarı açısından üst ve hem ü st ve alt grup arasındak i başarı farklılığını maksimum yapma hem de grupl arın aritmetik ortalama l arı ­ nın evren değerl erini temsil etme için uygun ömeklem büyüklüğü ö lçütlerini birlikte dikkate a l ınır. Bu iki ölçütün sağl a n masında, toplam test puanlarına göre en yüksek puan alan %27'Iik grubun üst grup (başarı lı grup) olarak ve en düşük puan alan %27'Iik grubun alt grup (başarıs ız grup) olarak ve kalan grubun da orta grup olarak alınması en uygun durumdur. alt

-

P;

grupl arın oluşturul mas ında ,

Bu tablodaki cevap dağılı mları yorumlanırken ; başarı açıs ın dan üst gruptakilerin, orta gruptan; orta gruptakilerin de, alt gruptakilerden daha üstün oldukları dolayısıyla, daha fazla doğru cevap sayısın a ulaşmaları beklenmektedir ki bu durum örneğimizde sağlanmaktadır. Yani örneği• mizde üst grupta maddeyi 80 ki şiden 60' ı doğru cevaplarken, orta ve alt grupta 80 kişiden sırasıyla 40 ve 20 kişi doğru cevaplam ışt ır. Anlaşılacağı üzere maddenin doğru cevaplanma oranı üst gruptan alt gruba doğru azal maktadır. Eğer bu koşu l sağl anmıyorsa veya tam tersi sağl anıyorsa (üst gruptan alt gruba doğru gittikçe doğru cevaplama frekansı artıyorsa) o maddenin bilenle bilmeyeni ayırma gücü düşük demektir.

üst ve alt grupların belirlenmesi için 200 civarı bir örneklem genişliği gerekir. ômeklem genişliğine göre üst ve alt gruplar %25-%33 arasında bir kriterle de belirlenebilir. Büyük örneklemlerde üst ve alt grup için %25 ve küçük örneklemlerde %33 ölçüt olarak a lınabilir. Maddelere verilen doğru cevap ve çeldiricilerin alt, orta ve üst gruplara göre dağılım ı aşağıd aki gibi bir tabloda betimlenir. Tablo 7-2'de 5 seçenekli maddelerden ol uşa n bir çoktan seçmeli testin doğru cevab ı C seçeneği olan 1. maddesine verilen cevaplar alt. orta ve üst gruplara göre tasnif edilmi ştir. Test 240 kişiye uygulanmıştır. Testteki en yüksek puanları alan 80 ki şi üst grubu, en düşük puanlan alan 80 kişi alt grubu ve diğer 80 kişi ise orta grubu oluşturmaktadır.

Madde cevapl arın ın gruplara göre dağ ılı mını gösteren tablolarda , ayırt edici veya iyi bir madde için çeldiricilere ait frekans dağılı mı, doğru cevab ın frekans dağılı mının tam tersi olması beklenir. Yukarıdaki tablodaki madde güçlükleri ve madde ay ı rt edicilik güçlerini basit yöntem olarak bilinen aşağ ıd aki formülleri kullanarak kestirebilirsiniz:

204

205

·-·> ·-

o.

Test •-e Matltle />uaıılıırımn Aııtıliz.i



=

195

196

Tablo 7-4: Örnek Madde Cevapları Dağılımı Tablosu

O0+ Da nü+ na

Yukarıdaki formüllerdeki,

Da= Üst gruptan soruyu doğru cevaplayanların sayısı, D. = Alt gruptan soruyu doğru

cevaplayan l arın sayıs ı ,

n,= üst gruptaki öğrenci sayısı,

P0 = Üst gruptakiler için madde güçlüğü ve P0 = Alt gruptakiler için madde güçlüğünü belirtmektedir. Yukarıdaki

tabloda verilen birinci madde için madde

güçl üğü

ve

aşağ ı da hesapl a nmışt ır:

- ~ -50 80+80 - •

ve

Pı -

r,.

Madde No: 3

A'

B

C

D

E

Boş

Ust grup

40 32

8

Orta grup

32 24

Alt grup

24

o o o

o o o

. . .

16

24 40



r;,

.40

.20

n

80 80 80

Üçüncü maddeyi doğru cevaplayanların sayısı üst gruptan alt gruba g ittikçe azalmaktadır. üst gruptakilerin doğru cevap sayısının alt gruptakilerden fazla old uğu için maddenin ayı rt edicilik gücü pozitif ol acaktır, ama düşük bir ayırt edicilik gücünün elde edilme ihtimali yüksektir. Çünkü çeldiriciler zayıftır. "'B" çeldiricisi üst gruptan en çok alt gruptan ise en az kişiyi çekmiştir. "B" çeldiricisi bilenleri daha çok yanılttığı için iyi bir çeldirici değildir. "B" çeldiricisi sanki doğru cevap gibi çalışmıştır. Bu madde

n_.= Alt gruptaki öğrenci sayısı,

madde ayırı c ılığ ı

Öğrt.riımle Ölçme ~·e /)eğerlendirme

= .75 - .25 = .50

Aşağıda

madde cevapl arı dağ ılı m ı tablosunun yorumlanmasına yönelik başka ö rnekler de sun ul muştur :



çift cevaplı olabilir veya



bazı ö{ırencilerde yanlış ö{ırenme

olabilir.

·c· ve "E" çeldiricileri ise üst, orta ve alt gruplardan hiç kimseyi çekememi ştir, dol ay ı sıyl a

çeld irici olarak hiçbir i şl evleri yoktur. Hiçbir öğren ci taraseçilmeyen çeld iriciler yeniden yaz ılmal ıdır. Sadece "D" iyi bir çeld iricidir. Çünkü üst g ruptan alt gruba doğ ru gidildikçe bu çeldiriciyi seçenlerin sayıs ı artmaktad ır. fından

Tablo 7-3: Örnek Madde Cevapları Dağılımı Tablosu Madde No: 2 A Ust grup

o

o E Boş o o o .

B" C

n

80

80

Orta g rup

10 40 8

12 10

.

Alt grup

10 32 8

24 6

.

80 80

P;

r;, Tablo 7-5: Örnek Madde Cevapları Dağılımı Tablosu

.70

.60

Madde No: 4

A

B C

D"

E

Boş

n

Ust grup

o o o o o o o o o

80

o o o

.

80

.

80

.

80

Orta grup

ikinci maddeyi doğru cevaplayanların sayısı üst gruptan alt gruba gittikçe azalmaktadır. Üst gruptan 80 kişi alt gruptan ise 32 kişi doğru cevabı seçmiştir. üst gruptakilerin doğru cevap sayısının alt gruptakilerden fazla olması maddenin pozM bir ayırt edicilik katsayısına sahip olduğunu gösterir. Alt gruptaki öğrenciler tarafından tüm çeldiriciler seçil miştir, bu durum çeldiricilerin etkili old uğunu gösterir. En iyi çalışan çeldirici D çeldiricisidir.

Alt grup

80 80

P;

rı,

1.00

.00

Dördüncü madde tüm öğrenciler tarafından doğru cevaplanmıştır. Anlaşılacağı üzere, herkes tarafından doğru cevaplanmış bir test maddesi o grup için bilenle bilmeyeni ayırmada i şe ya ram ı yor demektir. Seçme veya sıral ama amaçlı testlerde bu tür çok kolay test maddeleri biraz zorl aştırı l­ ma lı dır.

206

207

·-·> ·-

o.

Test •-e Matltle />uaıılıırımn Aııtıliz.i

198

197

Kehoe (1995) iyi bir testte maddelerin çoğunl uğu , sınavı a l anl arın %3080'i ta rafından doğru olarak cevapl andırılmas ı (yani madde güçlüklerinin .30 ile .80 a rası nda olması) gerektiğin i beli rtmi ştir.

Madde istatistikleri Tek bir maddeye ait istatistiğe (madde güçlüğü, madde varyansı, madde güveni rtiği gibi) madde istatisti ği denir. Aynı şekilde testin tümüne ait istatisti ğe (testin orta laması , testin varya n sı gibi) test i statisti ğ i denir. Aşağıda bazı madde istatistikleri sunulmu ştur. 1) Madde

Testçilikte kullanılan diğer bir istatistik de, bir testi oluşturan madde güçlüklerinin top lamıdır. Bir testi ol u ş turan maddelerin güçlüklerinin to plam ı o testin aritmetik o rtal a masın ı verir: K

Gü çl üğü ( Pı )

X=

Madde güçlüğü (0-1 puanlama uygula ndığından dolayı) bir maddeyi doğru cevaplayan öğrenci sayısının veya madde puanının (1 1) testi alan tüm öğrenci sayısına (N) bölümüyle bulunur. Anlaşılacağı üzere, bir mad• denin güçlüğü , o maddeyi doğru cevaplayan öğrencil erin oranı nı verir: Pı (Madde

Öğrt.riımle Ölçme ~·e /)eğerlendirme

Güçlüğü

1=1 (Aritmetik Ortalama

= Madde güçlüklerinin toplamı)

Bu suretle, eğer elimizde madde analizi yapılarak, madde güçlükleri kestirilmiş olan maddelerden çok sayı da varsa, istediğimiz güçlükte bir test



oluşturma veya testin güçlüğünü önceden ayarlayabilme şansımı z olur. Böylece, amacımıza uygun yani geçerl iği yüksek test hazırlamada bize fayda sağlar.

=N

= maddeyi doğru cevaplayan öğrenci sayısı/ toplam öğrenci sayısı)

"0• 1" puanlama yönteminin kullanılmayıp, dereceleme yöntemiyle maddelerin puanlandığı yazılı yoklama, sözlü yoklama, kısa cevaplı testlerde. bir sorunun güçlüğü; o soru puanlarının aritmetik ortalamasının , so. runun tam puanına bölünmesiyle hesaplanabilir. Örneğin, 8 puanlık bir sorudan, öğrencilerin aldıkları puanların aritmetik ortalaması 4 puan ise. bu sorunun gü çlüğü 4/8 yani .50 olur.

Örnek Soru : 80 kişilik bir gruba (N=80) uygulanan bir çoktan seçmeli testin 1. maddesini 40 ki şi doğru cevapl am ı ştır (1,=40). Bu maddenin gü çlüğü kaçtır?



LPı

40

= 80 = .50

0-1 puanlama yönteminde, madde güçlüğü , ilgili maddeyi doğru cevaplayan ki ş i sayı sının tüm öğrencil ere oranı olduğundan, bir madde güı,­ lüğü n ün alabi leceği değe r "0.00 - 1.00" arasın da olur. Eğe r madde güçlüğü 0.00 ise, o maddenin doğru cevaplanma oran ının sı fır olduğu , yani, o maddeyi kimsenin doğ ru cevaplamad ığı dolayısıyla o grup için çok zor bir madde olduğu anlamına gelir. Eğer bir maddenin güçlüğü 1.00 bulun mu ş ise o maddeyi grubu oluşturan tüm öğrencilerin doğru cevapladıkları dola• yısıyla o grup için çok kolay bir madde olduğu anlamına gelir. Diğer durumlarda madde güçl üğü 0.00'a yaklaştıkça o madde zor ve 1.00'a yaklaştıkça o madde kolay olarak yoru mla nır.

2) Madde Varyansı (sf)

maddenin ve test puanlarının güven i ~iğ i nin hesapbir madde istati stiğid ir. 0-1 puanlama yöntemiyle puanlanan bir çoktan seçmeli test maddesinin varya n sı : o maddeyi doğru cevaplayanların oranıyla (Pıl, doğru cevaplayamayanlann oranının (qi = 1 - P;) çarpımıyla elde edilir: Madde

varya n sı ,

l anmasında kullanı lan

sf = PJql (Madde

Testçilikte bir maddenin bilen le bilmeyeni ayırt edicilik gücünü n yüksek o l ma sı ve madde güven i rliğin in yüksek ol ması açıs ın dan, güçlüğ ü .50 civarında olan maddeler tercih edi lir (ş ans ba ş arı s ını giderme içi n düzeltme yapı l dığı durumlarda). Bir maddenin güçl üğü o maddenin ayırt edicilik gücü gibi diğer teknik özelliklerini de etkilemektedir.

Vaıyansı

= Madde g0çlüğ0 • madde güç/0ğün0n t'den farkı)

Örnek Soru: Bir maddenin güçlüğü (P;) .50 ise varyansı kaç olur?

Çözüm:

208

Q;

= 1- P; = 1- .50 = .50,

sf = P;q; = .50(. 50) = .25

209

·-·> ·-

o.

Test •-e Matltle />uaıılıırımn Aııtıliz.i

200

199

Öğrt.riımle Ölçme ~·e /)eğerlendirme

puanının

test puan ı ndan çıkartıl arak elde edilecek madde-hariç test puahesaplanan korelasyon ka tsayıs ın a madde-hariç madde-test puanı kore/§syonu (item-reminder correlation) denir. Madde-hariç madde-test puanı korelasyonu, madde ayı rt edicilik gücü için daha uygun bir istatistik olur. Bir başarı testi tek boyutlu bir değişkeni ölçüyorsa; genellikle 0.40'dan düşük bir ayırt edicilik gücü olan maddeler için madde ve seçenek analizi sonucu baz ı düzeltmeler yapıl d ı ktan sonra tekrar denenmesi önerilir. Ayırt edicilik gücü 0.40' ın üzerinde olan maddeler ise bilen ve bilmeyenleri ay ı rt etmede çok iyi test maddeleri olarak nitelendirilir. n ı yl a

Küçük bir madde varyans ı , verilen cevaplar arasında değ i şimin çok az olduğunu ifade eder. Örneğin hemen hemen tüm öğrencilerin o maddeyi doğru cevaplamas ı veya yanlış cevaplaması durumunda madde varyansı sıfıra yaklaşır. Eğer

tüm

öğrenci l er

madde

o maddeyi

doğru cevaplamış

veya otur. Testçilikte, madde güvenirl iği ve geçerliğinin dolayısı yla test puanlarının güvenirliğinin ve ge-çer1iğinin yüksek olması açıs ında n madde varyansının maksimum değeri olan 0.25 civarında olması arzulanır. Madde varyansının maksimum değeri o lan 0.25 ancak madde güçlüğünün 0.50 olduğunda sağlanabil­ mektedir. Madde varyansı maksimum olan maddeler öğrenciler arasın­ daki farklılığı ortaya koymada yani ölçtüğümüz değişken bakı mından öğ­ renciler arasındaki farklılıkları (varyansı) ortaya çı karmada veya daha teknik bir ifadeyle maddenin sağladığı bilgi bakımından bize en çok katkı sağ­ layan maddelerdir. doğru cevaplayamamışsa

varya n s ı s ı fır

Tan (1998) çok fazla sayı da madde olmamak kaydı ile ay ırt edicilik gücü çok düşük (0.20'den küçük) olan maddelerin testten atılmas ını n, güvenirlik katsayı sı nı önemli ölçüde artt ırd ı ğ ın ı göstermişti r. Dol ayı sıyla, kapsam geçerl iğini önemli ölçüde azaltmamak kayd ı ile ay ırt edicilik gücü düşük bazı maddelerin testin puanl anmasına dahil edilmemesi öğrencilerin gerçek puanlarını temsil gücü daha yüksek puanlar elde edilmesini sağ l ar. -o-1 " puanlama yöntemiyle bir maddenin alabil eceği değer sadece O veya 1 ol abileceğinden dolayı, madde puanı kesikli (yapay süreksiz) bir deği şkendir. Test puanı ise sürekli bir değişkendir. Bu durumda madde p uanı ile test pua nı aras ı ndaki il işkiyi hesaplamada kullan ıl ab il ecek korelasyon katsayıs ı ; çift serili korelasyon katsayı sıdır. Madde puan ı nın gerçek süreksiz bir değ i şken yapıs ın da olacağı durumlarda; nokta çift serili korelasyon katsayısı kullan ılabil ir. Ayr ı ca . test puan larının normal dağılım özelliği göstermemesi durumunda veya maddelerin güçl üğünün O.SO'den ö nemli ölçüde farklılaştığı durumlarda çift serili korelasyon yerine nokta çift serili korelasyonun kullanılması (süreksiz deği şkenin gerçek süreksiz ol• mam asın a rağmen) daha doğru bir tercih olur.

3) Madde standart Sapması (sI) Madde varyans ın da ifade ed i ldi ğ i gibi, madde standart sapmas ı da maddenin ve test puanl a rı n ın güven i rliğinin hesaplan ması nda kullanılan bir madde is ta tistiğ idir. Bir maddenin standart sapmas ı ; o maddenin varyans ını n kareköküdür. 5 1=

J P1Q1

ö rnek Soru: Bir maddenin varyansı (sf) .25 ise standart sapması kaç o lur?

s; = JP;Q; =

.r8 =

.50

4) Madde Ayırt edicilik Gücü (rı,)

Madde puanlarıyla testin tümünden alınan puanlar arasındaki korel8syon bize o maddenin testin ölçtüğü değişkenle ilişkisini vermektedir. Testçilikte madde-test korelasyonu , o maddenin iç tutarlık ölçütüne göre geçerlik katsayı sı olarak yorumlansa da , gerçekte bu korelasyon ka tsayı­ sının madde geçerli ğini ifade ettiğini söylemek yanıltı cı olabilir. Çünkü hesaplanan korelasyon katsayıs ı bir iç tu tarlılık ölçüsüdür. Bu sebeple bu katsayıya maddenin ayırt edicilik gücü demek daha uygun olur. Madde test korelasyonu hesaplanırken; test pu anla rın dan ilgili madde için madde

210

211

·-·> ·-

o.

Test •-e Matltle />uaıılıırımn Aııtıliz.i

a) Nokta çift-serili korelasyon

katsayısı

201

202

(rpbf) Nokta çift serili korelasyon katsayısını hesaplayabilmek için öncelikle;

Değişkenlerde n

biri iki çı ktısı olan {gerçek\ süreksiz, d iğeri ise süve/ya eşit oran lı ölçek türünde) olduğu d urumlarda kullanılan bir basit doğrusal korelasyon tekniğidir. Süreksiz değişkenin çıktı­ larından biri "O", diğeri ise "1" ile kodlanır. Genellikle "f" ile kodlanan

rekli,

Öğrt.riımle Ölçme ~·e /)eğerlendirme

(eşit aralıklı

1110, 11, pj ve Sx değerterinin hesaplanması gerekmektedir. J110'nin hesabında birinci madde puanı 1 olanların · test puanlarına" ait

değişken ilgilendiğimiz özelliği taşıyandır.

aıitmetik ortalaması hesaplanacaktır. örneğimizde 1O öğrenciden sadece

4 'O birinci maddeden 1 puan almıştır. Bu 4 öğrencinin test puanları aşa• ğıda sun ulmuştur.

Öğrenci

x10= Testteki j maddesinde 1 ile kodlananların (çoktan seçmeli test maddesi ise maddeyi doğru cevaplayanların) sürekli değişkene ait aritmetik o rtalaması

1. Madde Puanı

1 2

1

3 8

1 1

Test Puanı

68 65 64 38

1

X = Test puanlarının aritmetik ortalaması Sx = Testin standart sapması

1. maddeden 1 puan

Pı =j maddesinde 1 ile kodl a nanların ora n ı, çoktan seçmeli test maddesi ise maddeyi doğru cevaplayanların oran ı yani madde güçlüğü.

_

Xıo

alanların

=

68 + 65

Tüm öğ ren ci lerin testten

Örnek Soru: 70 maddeden oluşan bir testte, testi alan 1O öğrencinin testteki birinci maddeden ve testten ald ıkl arı puanlar aşağıda verilmiştir. Bu testteki birinci madde ve test puanları a rasındaki korelasyonu hesap-

X = 68 + 65

test

puanlarının

+ 64 + 38 4

aritmetik

ortalaması:

= 58.75

aldık ları p uanl a rı nın

aritmetik ortalaması :

+ 64 + 50 + 42 + 40 + 40 + 38 + 38 + 32 10

_ 47 70

layınız. Oğren ci

1. Madde Puan ı

Test Pua n ı

1

1 1

68 65

1

64

o o o o

50 42 40 40 38 38 32

2 3 4 5 6 7

8

1

9

o o

10

1. Maddenin Güçlüğü: P; = 4/1O = .40 olur.

Nokta çift serili korelasyonu hesaplayabilmek için test puanlarının standart sapmas ı hesaplan ır:

(68 - 47.7) 2

+ ... + (32 - 47.7) 2 10

= 12.52

Şimdi nokta çift senli korelasyon katsayısı hesaplanabilir.

212

213

·-·> ·-

o.

Test •-e Matltle />uaıılıırımn Aııtıliz.i

_

Xıo -

r pbj -

Sx

X

§_ _58.75 .J qi -

203

204

Öğrt.riımle Ölçme ~·e /)eğerleııdirme

r,;ö _

47.70 12.52 .JTo- •72

Denek 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

1. madde ile test puanları aras ındaki korelasyon katsayısı .72 bulunmuştur. Test puan ları ölçüt alındığında, 1. madde bilenle bilmeyeni çok iyi bir şekilde ayırt edebilmektedir.

Nokta çift serili korel§syonda (çift serili korel§syonda oldu{ju gibi) sürekli de{iişken için normal da{jılım sayıt/ısının sa{jlanmasına yönelik bir sınırlılık yoktur. b) Çift-serili kore!Asyon katsayısı, rbf D eğ i ş kenlerden

biri sürekli, diğe ri iki çıktı lı yapay süreksiz ol duğu nda

kullanılan bir korelasyon tekniğidir. örneğin; testteki bir soruyu bilip bilme-

mekle testin tümünden alınan puan arasındaki korel8syonun hesaplanması gibi. Başka bir ifadeyle, çift-serili korelasyon gerçekte sürekli olan iki değişken arasındaki ilişkiyi bulmada kullanılır, ama bu iki değ işkenden biri bazı nedenlerden dolayı iki çıktısı olan süreksiz bir değişkene dönü ştürü l­ müştür.

22 23 24 25 26 27 28 29 30

y 1= Normal dağ ılım eğrisinde Pi değerine karşılık gelen ordinat yüksek(Eklerde Tablo-2'ye bakın ı z).

l iği dir

Örnek soru: 30 öğrenciye uygulanan 25 maddelik bir çoktan seçmeli testten öğrencilerin aldıkları puanlarla, testteki 7. maddeden öğrencilerin aldıkları puanlar aşağ ıda verilmiştir. Bu puanlar arasındaki korelasyonu h esaplayını z .

214

7. Madde Puanı 1 1 1

1 1 1

o 1

1

o 1 1 1

1

o o o 1 1 1

o

o o o o

o o o 1 1

Test

Puanı

19 18 18 18 18 18 18 18 17 17 17 17 17 17 17 17 16 16 16 16 16 15 15 14 14 14 14 14 14 13

215

·-·> ·-

o.

T~ n- Madik Puanlannın A.ııalki

Çözüm:

Test

7. Maddeyi

Doğru

Cevaplayanlann Test

Puanlann ı n

Aritmetik Ortala-

yı=

Exeef de. E ERORTALAMA(aralık; ölçüt; siyonu~a da X;o değeri elde edilebilir:

[aralı k_ortalamas ı))

-

,_..... F

1.

1

1

2

1

3

1 1 1 1

••• 7

••

o 1 1

10

o

11 12 13

1 1 1 1

15

o o o

..,. 17 11

1

19

1

"'

1

21

22

,. 23

.

25

27

a

29 30

x.,

o o o o o o o o 1

t

Standart

.3925

H

J

Sx = 1.61

(Ekler-Tablo 2'den bakılan değer)

7. Madde için Çift Serili Korelasyon

rbj =x,Sx-x(~) = YJ 0

G

Sapması:

fonk-

=EĞERORTAl.AMA(SFS2:SFS31 ;•1 ";SGS2:SGS31)

E

Puanlarının

7. Maddenin Güçlüğü için Normal Dağılım Eğrisindeki y Değeri:

ması: Xıo= 16.88

)

Öğrt.riımle Ölçme ~·e /)eğerlendirme

206

205

K

T.st

Katsayısı :

16.88- 16.21( o.s1) 1.61 0.3925

= . SS

Öğrencilerin testteki 7. maddeden aldıkları puanla, testten aldıkları puanlar

-M

19 18 18 18 18 18 18 18 17 17 17 17 17 17 17 17 10 10 10 10 10 15 15 14 14 14 14

aras ındaki

korelasyon .55'dir. Testteki 7. maddenin ayı rt edicilik gücü yük-

sektir. Eğer sürekli değişken normal dağılım özelliği göstermiyorsa çift serili korelasyon yerine nokta çift serili korelSsyonun kullanımı daha uygun olur. /TEMAN, TAP, SPSS gibi paket programlar madde ayırt ediciliğinde test puanlarının normal dağılımını gerektirmeyen nokta çift serili korelasyon formülünü kullanmaktadırlar.

5) Madde

Güvenirliği(~)

Bir test maddesinin güve nirliği ne kadar yüksek ise, o madde o kadar kaliteli demektir. Matematiksel olarak: bir maddenin güvenirlik katsayı sı. o maddenin ay ırt edicilik gücüyle standart sapmasının çarpım ın a eşittir: •·ı

(Madde

Güvenirliği

= rıx J 5

= madde ayırt ediciliği • madde standart sapması)

Testin standart sapmasını madde güvenirliklerinden faydalanarak bulmak da mümkündür. Testin standart sapması testi oluşturan maddelerin güvenirlik katsayılarının toplamına eşittir.

..

K

14 13

S, =

1,.. .

Lrı )=!

(Testin Standart Sapması

= Madde güvenirliklerinin toplamı)

Test Puanlannın Aritmetik Ortalaması: X= 16.27 7. Maddenin Güçlüğü: Pı= 17/30 = .57

216

217

> ··-

o.

Test •-e Matltle />uaıılıırımn Aııtıliz.i

208

207

TEST İSTATİSTİKLERi

Öğrt.riımle Ölçme ~·e /)eğerlendirme

UYGULAMA: MADDE ANALİZİ ve TEST İSTATİSTİKLERİ Aşağ ı da 10 öğrencinin 5 maddeden a ldıkları puanlar su nul mu ştur . Bu uygulamada seçenek analizi yap ıl mayacağ ı için matriste yanlı ş cevaplar için cevap seçenekleri yazılmayıp sadece madde puanı olan •o• yazılm ış­ tır. Yine örnek olması açısından hem testteki madde sayısı hem de testi alan öğrenci sayısı azdır.

Önceki ünitelerde açıklanan test puanlarının aritmetik ortalaması ve standart sapmasına ilave olarak madde istatistiklerinden faydalanarak test puanlarının iç-tutarlılık anlamında güvenirl iği ve ölçümlerin standart hatasının hesaplanması aşağ ıda sunulmuştur.

1) Madde istatistiklerinden Faydalanarak Test Puanlarının Güvenirli-

MADDE PUANLAR! MATRiSi Test Maddeleri

ğinin Bul unması

Bir testin KR20 güvenirlik katsayıs ın ın madde istatistiklerinden faydalanarak aşağıdaki eşitlikl e bulun mas ı da mümkündür:

L.j-1 't"K Sj2

Öğrenciler

1

l

2 3 4 5 6

o o

7 8

2) Test Puanları için Ölçmenin Standart Hatasının Hesaplanması Puanlara karışa n hata miklarını puan cinsinden belirlemek ve öğren ­ cinin gerçek başarı durumunu yansı tan "gerçek puanının" hangi değerleri a labi leceğ i ni kestirmek için ('ölçümlerin güven i rl iğ i ve standart hatas ı" ünitesinde detaylı olarak açıklanan) ölçümlere ait standart hata aşağıdaki formülün kulla nımıyla hesaplanabilir.

ı 1 1 1 1

1

o o o

9 10

ı

~ 1 1 1

~ 1 1

l!

1

1

o o o o

o o

o

1

o

1

1

o o

o o o

o

1

o

1 1

Yukarıdaki madde puan ları matrisinden faydalanarak aşağ ı­ daki sorul arı cevapl ay ını z . a) Madde güçlükleri b) Testin aritmetik ortalaması . standart sapması ve ortalama madde güçlüğ ü c) Madde varyansları d) Madde standart sapmal arı e) Madde ayırt edicilik güçleri f) Madde güvenirlikleri g) Testin standart sapması (madde istatistiklerinden faydalanarak) h) Test puanlarının güven i rliği, KR20ve i) T esi pua n larının standart hata sını hesapl ayıp yorum-

s. = s. Jcı - rx) Bu eşitlikteki r,. kestirilen güvenirlik katsayısını (KR,o, alfa, r,, gibi kestirilen güvenirlikleri) simgelemektedir.

layınız.

218

219

·-·> ·-

o.

Test •-e Matltle />uaıılıırımn Aııtıliz.i

209

Öğrt.riımle Ölçme ~·e /)eğerlendirme

210

Çözüm: Öncelikle her satırdaki madde puanları toplanarak öğrencilerin testten aldıkları puanlar bulunur. ikinci olarak ise, her madde için veıilen doğru cevap sayıları bulunur, yani sütun toplamları bulunur (madde puanı yani, lı), Bu iki işlemin hatalı bir şekilde yapılıp yapılmadığını kontrol etme açısından, öğrenci puanlarının topl am ı yl a madde puanlarının toplamının birbirine eşit olması gerek tiğine dikkat edilmelidir.

Öğrenci Puanlarının Toplamı= 5+5+4+4+3+3+2+2+1+1 = 30 ve

Madde

Puanla rı Topl amı=

5+7+7+3+8= 30 dur.

Yukarıdaki

anları

madde pua nl arı matrisinde de görüld üğü gibi öğrenci pu ile madde puanlarının toplamı birbirine eşittir. "

Anlaşılacağı üzere matrisin satır toplamlarının (öğrenci pua nlarının) ve sütün toplamlarının (madde puanlarının) toplamları , birbirine eşit Lf,. 1 Xı = !l',. ı I; olmalıdır. Eğer. öğrenci puanlarının toplamıyla madde puanlarının toplamı birbiıine eşit deği lse, madde analizi i şlemle rine geçilmez ve yapı­ lan hatanın düzeltilmesi için satır ve sütün toplamları tekrar gözden geçirilir.

K

Ix,=

Iıı=30

i=l

j=I

Bu eşitli ği sağ l ayamadıysak , buraya kadar yapılan var demektir.

iş leml erde hatamız

a. Madde güçlüklerinin hesaplanması (Pı) Bilind iği

MADDE PUANLAR! MATRİSi

üzere, bir maddenin

güçlüğü

o maddeyi doğru cevaplayanla-

rın sayısının , yani madde puanının (lı) testi alan tüm öğrenci sayısına (N) bölümüyle elde edilmektedir. Tesıte kullanılan 5 maddenin güçlükleri sıra­

!

sıyla aşağıda hesaplanmıştır.

5 1

2

3

4

4

4 1

5

Pa = 7ı'

7

= 'iö =

.70

1 = -' = .30 P+ = .! n ıo

3

3

6

o o

7

8

10 5

o o

o o

o

o

o

7

7

3

9

lı=

ı,

5

o

2

1

2

o

1

Testteki en kolay soru hangisidir? Neden? Testteki en zor soru hangisidir? Neden?

Testteki en kolay soru 5. sorudur. Çünkü testi alan grup tarafından en fazla olan sorudur. Diğer bir ifadeyfe. 5. soruyu grubun %80'i doğru cevaplamıştır. Testi alan grup için testteki en zor soru ise 4. sorudur. Çünkü 4. soru grubun %30'u tarafından doğru cevaplanmış­ tır. Diğer bir ifadeyle grupta doğru cevaplanma oranı en düşük olan soru 4. sorudur.

1

doğru cevaplanma oranı

8 30

220

221

·-·> ·-

o.

Test •-e Matltle />uaıılıırımn Aııtıliz.i

b. Tes tin aritmetik ortalaması, standart madde güçlüğünün hesaplanması Testin Aritmetik

sapması

211

212

ve ortalama

c. Madde varyanslarının bulunması (sf

X

1J. 1 Xı

=7

5+5+4+4+3+3+2+2+1 +1 10

ları sıras ıyl a aşağı da hesaplanmıştır.

si= Pı Qı = .5(.5) = .25 s~= p2 q2 = .7(.3) = .21 s~= p3 q3 =.7(.3) =.21 sl = p.q. = .3(. 7) =.21 s~= p5 q5 = .8(. 2) =.16

30

=

Ayrı ca testin aritmetik ortalaması, bir testi lüklerinin topla mıyl a da elde edilebilir:

= p1q1)

Madde varyansı, maddenin güçlüğü (Pı) ile madde güçlüğünün 1.00'den farkının çarpımına eşittir. Testte kullanılan 5 maddenin varyans•

Ortalaması:

Testin aritmetik ortalamasını iki yolla bulmak mümkündür. İlk olarak, test puanl arından faydalanarak. öğrenci pua nl arın ın toplamının öğrenci sayıs ına bölümüyle bulunabilir:

-

Öğrt.riımle Ölçme ~·e /)eğerlendirme

=10 =3.00

ol uşturan

maddelerin güç-

K

X=LPi =.50 + .70 + .70 + .30 + .80 =3.00 j=I

Aynca, madde varyanslarının gerekecektir:

topl amı

KR20 güveni~ik

katsayısının

h esapl anmasında

l1 = rr~x, = 1:l'- , p1 eşiUiği sağlanmıyorsa, buraya kadar yapılan işlem­

K

I

lerde h atamız var demektir. Hesaplamalarımızda bu eşitlik sağla nmak• tadır. Madde analiziyle ilgili diğer işlemlere devam edebiliriz.

sr=-25 + .21 + .21 + .21 + .16 = 1. 04

j= I

d. Madde standart sapmalarının bulunması (sı = JPıQı)

Testin Standart Sapmas ı:

Maddenin standart sapmasını bulmak için o maddenin varyans ını n karekökünü almak gerekmektedir. Testte k ullanılan S maddenin standart sapmas ı s ı ras ı yl a hesaplanacak olursa:

Testin standart sapması aşağıdaki eşitlikten laydalanarak hesaplanabilir. (5-3)2 +(5-3)2 +( 4-3) 2+ (4- 3)2 + (3- 3)2 + (3-3)2 +(2-3)2 +(2-3)2 +( 1- 3)2 +( 1-3) 2 10

=J. 5(.5) =f:is =.50 s, =✓r,q, = J.7(.3) =ffi =.46 s, =J r,q, = J. 1(.3> =m =.46 s., =Jp.q, = J. 3(.7> =m =.46

= 1.41

s, = Jp,q ,

Testin Güçlüğü: Testin güçlüğü (yani ortalama madde güçlüğü) ise madde güçlüklerinin toplam ının madde say ısına bölümüyle elde edilir ki bu da, aritmetik ortal amanın madde sayısına bölümüne eşittir. Her iki fonnüle göre de or• talama madde güçl üğü, yani testin güçlüğü (ii) aşağıda hesapl anm ı ştır.

S5

= J psqs = j.8(.2) = ili= .40

Testin uygulandığı grup için güçlük düzeyi .60'd ır.

222

223

·-·> ·-

o.

Test •-e Matltle />uaıılıırımn Aııtıliz.i

213

e. Madde ayırt edicilik güçlerinin hesaplanması {rpı}

Testteki 1. maddeyi doğru cevaplayan öğrenci sayısı 5'dir. Bu 5 öğ­ rencinin testin tümünden aldıkl arı puanlar koyu olarak yazıl m ıştır. Şimdi , bu 5 test puan ı n ın aritmetik ortalamasını al ırsak. 1. maddeyi doğru cevaplaya nl arın orta l amas ını bu l muş oluruz:

Madde ayırt edicilik gücünün hesapla nmasında , (veri sayısı az olduçift serili korelasyonun "sürekli değişkene ait puanların normal dağılım özelliği göstermesi" sayıltısı sağlanamayacağından dolayı) nokta çift serili korelasyon tekniği kullanılmıştır. Hatırtanacağı üzere, nokta çift serili korelAsyonun hesaplanmasında kullanılan formül: ğu ndan

r b. -_ P ı

.,

xi 0 - xfiıi Sx

1. madde

puanı

Test

qJ

1

5

2

1

5

3

1

4

4

1

4

5

3

6

o o

7

1

2

8

o o o

2

10

4.00

Aynı şekilde 2 .. 3. , 4., ve 5. maddeler içinde lı:10 değerteri hesaplanırsa. aşağ ıdaki sonuçlar bulunur.

~

_ S +S +4+ 4 +3 t-3 + ı

2D -

7

S+H-4+4+3+3+2 7

3. 57

-X

puanı

1

9

_ 5+ 5+4+4 + 2 S

AıD -

Madde ayırt edicilik gücünün hesapla nmas ında. ilk aşama her bir madde için maddeyi doğru cevaplayanları n testten a ld ıkları puanların aritmetik ortalamasını bulmaktır. ômek olarak: 1. maddeyi doğru cevaplayanlara ait test puan l arın ın aritmetik ortalamasını hesaplaya lı m.

Öğrenciler

Öğrt.riımle Ölçme ~·e /)eğerlendirme

214

_

5D -

= J. ?l

S +S ♦-4 +4 ♦ 3 +3 +2+ 1

8

3 .38

Nokta çift serili korelasyonun hesabında kullanılan formülde bilinmesi gereken diğer değişkenler (testin aritmetik ortalaması , testin standart sapması ve madde güçlükleri), önceden hesaplanmıştı. Şimdi, 1. maddenin ayırt edicilik gücünü hesaplayalım.

rıx

3

_ 4.00- 3.00

ı.,ıı

-

/:so _ 71

✓ 50

-.

Aynı şekilde 2., 3., 4., ve 5. maddeler içi nde ~' (burada r pb) değerteri hesaplanırsa, aşağıdaki sonuçlar bulunur.

rıx = r

3.S7- 3.00 1.41

µo

✓ iö

= •62

µo _ 46

_ •.oo - 3.oo 4X 1.41 ✓ JO -



= 3.71- 3.oo

r JX

,.

1.4 1

_ 3.38- 3.oo

SX -

L·U

µo = _77

✓~

fso _ 54

✓To

- •

Test puanlarının ayırt ed iciliği hesaplanan madde puanlarını da içermesinin elde edilen bu madde-test korelasyonunu şişirdiği, bunun yerine

224

225

·-·> ·-

o.

Test •-e Matltle />uaıılıırımn Aııtıliz.i

215

madde ile madde-hariç test puan ı (item-reminder) korelasyonunun kullanılmasının daha doğru ol acağı bilgisi ölçme literatüründe yer almaktadır.

Madde ve madde-hariç test

puanı

korelasyonunun

Öğrt.riımle Ölçme ~·e /)eğerlendirme

216

f. Madde güvenirlik/erinin Maddenin güvenirlik

katsayı sının hesaplanmas ı aşağıdaki eşitlikle

sağlan maktaydı.

hesaplanması

''ı

Uygulama Sorusu: Madde ayırt edicilik

k atsayıl arı nı ,

toplam test pua nınd an ayırt edicilik katmadde pu an ını ç ıkartarak elde edilen test puanların ı kullanarak (item-reminder) hesaplayınız. Elde ettiğ iniz sonu çları (test puanlarına ilgili madde pu anın ın da dahil olduğu önceki sonuçlarta) karşı­ laştırınız. Aşağıda birinci madde için madde ve madde hariç test puanları

=rıxs, = .71(. 50) = .35 r 2 = 1·2 ,s2 = .62(. 46) =.28 r3 = r 3 ,s3 = .77(. 46) =.35 '• =,,,s. = .46(. 46) = .21 rs = r5 ,s5 = .54(. 40) =.22

'i

veril m i şti r:

Öğrenciler 1. madde

euan ı

1. madde hariSi: test

1

1

4

2

1

4

3

1

3

4

1

3

5

3

6

o o

7

1

1

8

o o o

2

10

= ,·,,sı

Testteki 5 madde için de, madde güvenirliğin i hesaplan ırsa. aşağıdaki sonuçlar bulunur.

sayısını hesapl adığ ını z

9

hesaplanması (rı)

euanı

g. Testin standart sapmasının madde istatistiklerinden faydalanarak bulunması: Madde güvenirliklerinin bilir.

toplamıyla

testin standart

sapmasın ı

kestirile-

K

3

Sx =

L

ri

= .35 + .28 + .35 + .21 + .22 =

1. 41

j• I

Madde güvenirliklerinin

toplamı

testin standart

sapmasına eşit

bu-

lundu. Böylelikle bu kontrol eşitliğini de başarıyla sağlamış durumda yız. Yuvarlamadan dolayı, madde güvenirlikleri topl amı testin standart sapmasından biraz farklı çıkabili r ama bu ciddi bir fari ·-

o.

Test •-e Matltle />uaıılıırımn Aııtıliz.i

KR20

=

K [ K- 1 1-

l

ı:J;, 1 sf 2 K

.

( Lj=l I ı)

=

217

Tablo 7-6. Başarı Testine ait Madde istatistikleri 5 [ 1.04 ] 5 - 1 1 - (1.4] ) 2

= .60

Bu KR,o formülü. madde istatistiklerine dayalı olara.k elde edilmiştir. Bu nedenle madde istatistikleri önceden kestirilen bir testin. uygulanmadan önce elde edilecek ölçümlerin güvenirliğini kestinne olanağı sağlar. Yani bizlere ölçümlerin güveni rl iğ i yeterli veya yüksek olacak test hazırlama olanağı da sağlar.

ı.

Öğrt.riımle Ölçme ~·e /)eğerlendirme

218

Test Puanlarının Standart Hatası

Standart hata fonnülünden faydalanarak hata puanları için ölçümlerin standart hatası aşağıdaki gibi hesaplan ır.

~

~

~

~

~

m

1

1

1

11

1

21

2

2

2

12

2

22

3

3

D

K

~

~ fil

~ Std.Sap.

Y degeri

Madde !Y;ıncılığı

~ güvenir~ !iği

yansı

s0 = sx J (t - rx) = 1.41J(ı- .60) = 0 . 89 puan Bulunan bu değer, normal dağılım eğ risi nde , hata puanların ın rastgele (random) dağılımına ait birime yönelik bir ke stirimdir. Hesaplanan 0.89 puan 5 maddeden ol uşan bir test için geçerlidir. Yani maksimum puan ın 5 olduğu bir ölçeğe ait ve bu ölçekle aynı birimde kestirilen bir hata ölçüsüdür.

Toplam

Madde analiziyle ilgili madde ve test istatistiklerinin tablo halinde suve yorumlanmas ı analiz sonuçların rapor edilmesinde daha etkili olur. Başarı testindeki maddelere ait istatistikler aşağıdaki gibi bir tabloda özetlenebilir. nulmas ı

Pj

Sj'

rj

Başarı testine ait bazı istatistikler de aşağıdaki gibi bir tabloda sunulup, daha sonra sözel olarak yorumlanabilir.

Tablo 7-7. Başarı Testine ait Bazı Test istatistikleri Soru: Aşağ ıda 1. kazanımı ölçen 1.. 11. ve 21 . maddelere ait bazı madde istatistikler verilm iştir. Bu maddelerden hangisini teste alırs ı nız? Neden? Kaz.anım

Madde

Madde

Madde

Madde gü-

No

güçl üğü

varyantı

Madde Std.Sap.

Madde

No

!Y;lnCllığı

venirliği

1

0,4 0,5 0,6

0,24 0,25 0,24

0,49 0,50 0,49

0,7 0,6 0,5

0,3429 0,3000 0,2449

1

11 21

Testin; Aritmetik orta lamas ı Standart saı:2ması Güvenirlıği Standart hatası

228

229

> ··-

o.

T~ n- Madik Puanlannın A.ııalki

220

219

Öğrt.riımle Ölçm e ~·e /)eğerlendirme

ÜNİTE SORULAR!

ÖZET

1. Madde analizi ne demektir? Ne tür bilgiler sağl ar?

Güvenilir ve geçerli test ekle elmek için kaliteli test maddelerini kullanmak gerekmektedir. Madde analizi istendik bazı niteliklere sahip nihai bir test geliştirmek amacıyla kullanılabileceği gibi, bir testte kullanılan maddelerin kalitesiyle ilgili bazı teknik bilgaerin ekle edilmesinde de kullanılabilir. Ayrıca madde analizi. öğrencilerin hangi konularda öğrenme güçlüğüne sahip olduklannı da gösterir.

2. Madde güçlüğü ve m adde ayırt edicilik gücü kavram la rı neyi ifade eder? 3. Klasik test teorisine göre , elde edilen madde istatistikleri gruba göre değişir mi? Neden?

4. Bir dersle ilgili soru faydalanabilirsiniz?

Tesi maddeleriyle ilgili olarak seçenek analizi yapılarak; maddenin iyi işleyen ve iyi işlemeyen seçenekleri bir istatistiksel hesaplamaya gitmeden, kabaca, tesp~ edilerek (varsa) maddenin kusuru hakkında bazı yargılarda bulunulabilir.

bankası oluştunn ada

madde analizinden

nas ıl

5. "0-1 " puanlama yönteminin uygulandı ğı , 5 maddeden oluşan bir testin 10 öğrenciye uygulanması sonucu elde edilen madde puanları matrisi aşağı da sunulmuştur. MADDE PUANLAR! MATRiSi

Testçilikte bir maddenin bilenle bilmeyeni ayırt etme gücünün yüksek olması ve madde güvenirliğinin yüksek olması açısından . güçlüğü .50 civarında olan maddeler tercih edilir (şans başarısını gidenne için düzeltme yapıldığı durumlarda). Bir testi oluşturan maddelerin güçlüklerinin toplamı o testin aritmetik ortalamasını verir. Testin standart sapması testi oluştu­ ran maddelerin güvenirlik katsayılarının toplamına eşittir.

Ö!ırenciler

1

1

1

2

1 1 1

o

o o

1 1

1

o o

3 4

5 6 7

8 9 10

o o o

~ 1 1 1

1

o

;! 1

o 1 1 1

o o 1

o o

~ 1 1

~ 1 1

o o o o

1

1

o

o o o

o

1

Yukarıdaki madde puanları matrisinden faydalanarak aşağı dakile ri hesap layınız.

a) b) c) d) e) r) g) h)

Madde güç!Okleri Testin aritmetik ortala mas ı Ortalama madde güçl üğü Madde varya nsıarı Madde standart sa pm al arı Madde a yı rt edicilik güçleri Madde güvenirlikleri Testin standart sa pması (madde istatistiklerinden faydalanarak) ı) Test pua nl arını n güven i rl iği ve j) Test puanl arının standart hatası

230

231

·-·> ·-

o.

Test •-e Matltle />uaıılıırımn Aııtıliz.i

222

221

Öğrt.riımle Ölçm e ~·e /)eğerlendirme

SINIF-IÇİ UYGULAMA-- FORM 1

SINIF-İÇ İ UYGULAMA-- FORM 2

MADDE PUANLAR! MATRiSi Öğrenciler

1

1 2 3

ı 1

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

4

5 6 7 8

9 10 11 12 13 14 15 16 17

1 1 1 1

1 1 1 1 1 1 1 1 1 1 1 1 1

o o 1

~

18

1

1 1 1

o

1 1

1

o

o o

puanları

1

o o o 1 o

o o o madde

~

1 1 1 1 1 1 1

o o o o o o o

19 20 Yukarıdaki

1

o o o o o o

§ 1 1 1 1 1 1 1

z

1

i

10

X

Öğrenci ler

1

1 1

1 1 1

1

10 9 9 8 8

1 2 3

1 1

4

1 1 1 1 1 1

o 1

o o 1 o o 1 1 o o o o 1 o o 1

o o 1

o o o o

o

MADDE PUANLAR! MATRiSi

~

o

o o o 1 o o 1 o o o o o o o o o

TOPLAM

o

o

o 1 o o o o o 1 o o o o o o o o 1 o o 1 o o o

1 1

o 1 1

o o o o o 1

o o

7

5 6 7

7

8

6 6 6 5 5

9 10 11 12 13 14 15 16 17 18 19 20

7

4 4

3 2

2 2 2

matrisinden faydalanarak aşağ ıdakılerı

Yuka rıdaki

hesaplayınız.

o

1 1 1

o 1 1 1

o o 1 1

madde

ı 1 1 1 1

1 !

o

1 1 1

1 1 1 1 1 1 1 1 1 1

o 1

o 1

o

1 1

1 1

o

1

o o o o o o o

puanları

1 1

~ 1 1 1 1 1 1 1 1

1 1 1

o

1

1

o o o o 1 o 1

1

1

o o o o o o

1

o o o

o

§

z

TOPLAM

~

i

10 1

1

1 1

o

1

1 1 1 1 1 1

1 1

1

o o o o 1 o o 1 o o 1 o o o o 1 o o o o o o o o o o

o 1

1

o o

o o 1 o o o 1 o o o o 1 o 1 1 o o o o o 1 o 1 1 o o o o o o o o o o o o 1 o o o 1 1 o o o 1 o o

matrisinden faydalanarak

X

10 9 8 8 7 7 7

6 6 6 5 5 4 4 4

2 2 2

2 2

aşağıdakileri

h esap layın ı z .

a) Madde güçlükleri b) Testin aritmetik o.-talaması c) Ortalama madde güçlüğü d) Madde vaıyans l a rı e) Madde standart sapmaları f) Madde ayı rt edicilik güçleri

a) b) c) d) e) f)

g) Madde güvenirlikleri h) Testin standart sapması (madde istatistiklerinden faydalanarak) ı) Test puanlarının güvenirliği ve j) Test puanların ın standart halası

g) Madde güvenirlikleri h) Testin standart sapması (madde istatistiklerinden faydalanarak) ı) Test puanlarının güvenirli ği ve j) Test puanl arının standart hatası.

232

Madde güçlükleri Testin aritmetik ortalaması Ortalama madde güçlüğü Madde vaıyansları Madde standart sapma ları Madde ayırt edicilik güçleri

233

·-·> ·-

Test •-e Afatltle />uaıılıırımn Aııtıliz.i

223

224

SINIF-IÇİ UYGULAMA-- FORM 3

Öğrt.riımle Ölçme ~·e /)eğerlendirme

Yukarıdaki

dakileri MADDE PUANLAR! MATRİSİ

TOPLAM

~

~

~

§

z

1

1

o

1

1

1

2

1

1

1

1

1

1

o

1

1

1

1

1

o

1

1

1

1

1

1

6

1

1

1

1

1

7

1

1

o

8

o

1

1

1

9

1

1

o

o

o o o

10

1

1

1

1

o

11

1 1

o o

1

1

o o o

1

12

o o

o o o o o o o

1

1

1

o o o o o o

o o o o o o o

Öğr.

1

3

~

o

4

o

5

13

o

14 15 16

o

17

o o o

18 19 20

o

1

o o o o

1

o o o 1

o o o o o

!!

o o o o o o o o o o o o

o o

l!

1Q

!

1

1

9

o

o

7

1

1

7

o o o o o

o

7

6

1

6

puanları

matrisinden faydalanarak

aşağı-

hesap layı nız.

a) Madde güçlükleri b) Testin aritmetik ortalaması c) Ortalama madde güçlüğü d) Madde varyansları e) Madde standart sapmaları f) Madde ayırt edicilik güçleri g) Madde güvenirlikleri h) Testin standart sapması (madde istatistiklerinden faydalanarak) ı) Testin güvenirliği ve j) Testin standart hatası.

7

o o

madde

7

6

1

o o

o

6

1

5

1

1

5

o o o o

4

1

o o o o o

1

1

2

o o

o o

2

4 4 3 3

2

234

235

> ··-

Test •-e Afatltle />uaıılıırımn Aııtıliz.i

225

226

SINIF-IÇİ UYGULAMA-- FORM 4

Öğrt.riımle Ölçme ~·e /)eğerlendirme

Yukarıdaki

madde

puanları

matrisinden faydalanarak

aşağıdakileri

hesap layın ı z.

MADDE PUANLARI MATRİSİ

~

~

~

§

z

1

o

o

1

1

1

2

1

1

1

1

1

1

o

1

1

1

o

1

o

1

1

1

1

1

1

1

Öğr.

1

3

~

o

4

o

6

1

o o

7

1

1

o

o o

o o o o

o

1

1

1

1

1

o

o

o o o

o o o

1

1

1

1

o

1

o o

1

1

o o o

1

1

o o

o o o o o o o

1

1

1

o o o o o o

o o o o o o o

5

8

9 10 11 12 13 14 15

o o o

16

o

17

o o o

18 19 20

o o

1

o o o o

1

a) Madde güçlükleri b) Testin aritmetik ortalaması

TOPLAM

o o o 1

o o o o o

!!

o o o o o o o o o o o o

o o

l!

1Q

!

1

o o

7

1

6

o

6

o o o o o o o

c) Ortalama madde güçlüğü d) Madde varyansları e) Madde standart sapmaları f) Madde ayırt edicilik güçleri g) Madde güvenirlikleri h) Testin standart sapması (madde istatistiklerinden faydalanarak) ı) Testin güvenirliği ve j) Testin standart hatası.

7

6

o o

5

1

4

1

5

4

o o

o

4

1

4

1

4

o o o o o

o o o o o o

1

1

2

o o

o o

2

4 3 3 3 2

236

237

> ··-

Tt'SI n- Madık Puanlarının Analizi

227

Öğrt.riımle Ölçm e ~·e /)eğerlendirme

228

SINIF-İÇİ UYGULAMA- FORM 5 MADDE PUANLARI MATRiSi

PROJE

Öğrenciler

1

ı

ı

~

~

X

1 2 3

1 1 1 1

1 1 1

1

1

1

1

1 1

5

4

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

o o 1 1

1

o o 1 1

o o o o o o o o

o o o o 1

o o o 1

1

o o o

Yukarıdaki madde puanları

1

1

1

1

1

o o

1

o o o o o o o o o o o o o o

1

1 1 1

o o 1

o o 1 1 1 1

o o

o

1 1 1

1 1 1

1

o

o o o o

Alanınızla

ilgili olarak belli bir s ınıf dOzey;ncıe belirledi{ıiniı: 3-5 Oniteyi içeren testi (çoktan seçmeli test) geliştirin iz. Bu baş,m testini geli ştirirken yapaca· {ı ı nın işler aşa{ı ıda maddeler halinde sun ul muştur. 1. Başarı testi geliştire~iniz dersi, s ı n ıf dOzeyini ve test kapsamına alaca{ıınız üniteleri belirleyiniz.

TOPLAM

bir

5 4

başarı

3 3 3 3 3

2.

Bu sı nav kapsamı ndaki Oniteler için kaıanımlal'ı veya davranı }la rı lisle'8yini2.

3,

Sınav kapsam ını

2

4.

S ınavda yoklanacak davranışlatın

5.

Test formunu ofu.ştu run uz:.

6.

Testi en az 200 kişilik bir öQrenci grubıxıa uygulayı nız. Uygulaman ı n deki bir şekilde yapılması iç:in gerekli tedbirleri alını z.

7.

Testi yarılama yönıemi y1e h ı ve rıı güvenirlik kaısayılarını hesaplayıp yorum•

belirten davranışlardan az 10 tane).

örıemU ola nları (sınavda

yoklaya--

caklarımzı} seç:iniz(En

h.er biri için 2 veya 3 soru yazın ız.

2 2

2 2 2

2 2 2

ıayınız.

1 1 1

8.

Bu ünitenin madde analizi kı smı nda yer alan tüm analizleri yap ıp. bu Onite 7-'S ve Tablo 7•7'deki gibi sonuçlan özeUeyen tabloları ol uşlu• rup yoru mlayın ız.

9.

Teste hangi maddeleri dahil ettlölnlzi belirtiniz (Hor dawanı ş için denedlı}lnlz 2 veya 3 sorudan en iyi olan ı seçiniz).

matrisinden faydalanarak aşağıdakileri

hesaplayınız.

a) b) c) d) e)

Madde güçlükleri Testin aritmetik ortalaması Ortalama madde güçlüğü Madde varyansları Madde standart sapmaları f) Madde ayırt edicilik güçleri

10. Nihai testi Oluştura n maddelere ait madde istalistikleriooen faydatanarak g&llştitdlı}lnlz nihai ıest puanları n ın govenlrli~nl keıstlrip yorumlayı nız. NOT: P,ojeler dönemin sonunda sizlere önceden belirtilen tarihlerde mc»akatla teslim alınacaktır. Hazırl adrğınız dosyanı n içenOinden size sorulan sorulara ver~iniz ce· vapla.rdan pro;e puanı al acaksın ız.

g) Madde güvenir1ikleri h) Testin standart sapması (madde istatistiklerinden faydalanarak) ı) Testin güvenirliği ve j) Testin standart hatası.

238

239

·-·> ·-

o.

230

Öğretimde Ölçme ,·e D ·-

o.

I'-.)

(.l'I

O> o.

ır ~

(()

(t)' (J)

C:



o

'< -,• ::,

~

g:

§:(Q•

a

=> m =?::

r.n 5

aı =. ~.~ ~Q)

Q;)

3 m(I)

::!..

5.~'

(il

-· a. m ~ m9: ::::ı S. a. ::> a.::,aım §-C>

::, ô,ro

c --.

0~,Ql

:,

=- c3@~

Q. - :, a.

'P 1P ~ ~. 1P

;-

c;

cp ı

~

3 -

~-

r, " ~

,Ş;

ss.

a>

2. : ,

v

T standart

puanına dönüştürülmesi:

50 + 10(-1.71 ) > 32,90

r,. =so + 10(2.40) =74

258

259

> ··-

o.

Öğrenci &şansım /)ti;erlemlirmc

249

250

(c) Puanların aritmetik ortalamas ı 80 ve standart sapması 5 olan puan

Mutlak ve

ölçeğine dönüştürülmesi: Aı

= 80 + 5(-1 .71) = 71 .45

A ,s

= 80 + 5(2.40) = 92

25 Öğrencinin Ham Puanları Üzerinden Yapılan Bazı Dönüştürmeler Zi

Ti

Ai180·5l

15 17 20 28 30 30 32 32 35 35 35 37 37 40 40 41 42 44 45 47 53 58 62 70 75

-1 .71 -1.58 -1.37 -0.82 -0.69 -0.69 -0.55 -0.55 -0.34 -0.34 -0.34 -0.21 -0.21 0.00 0.00 0.07 0.1 4 0.27 0.34 0.48 0.89 1.23 1.51 2.06 2.40

32.90 34.20 36.30 41 .80 43.10 43.10 44.50 44.50 46.60 46.60 46.60 47.90 47.90 50 50 50.70 51 .40 52.70 53.40 54.80 58.90 62.30 65.10 70.06 74

71 .45 72.10 73.15 75.90 76.55 76.55 77.25 77.25 78.30 78.30 78.30 78.95 78.95 80 80 80.35 80.70 81 .35 81.70 82.40 84.45 86.15 87.55 90.30 92

Bağıl Değerlendirmeni n Ku llanımı

Mutlak veya bağıl değerlend irmeden hangisinin kullanılmasının daha uygun olacağı değerlendirme amacına, öğretmen ve öğrenci grubunun bazı özelliklerine göre deği şmektedi r. Hem mutlak hem de bağıl değer­ lendirmenin birlikte kullanıldığı uygulamalar da mevcuttur. Bağıl değertend irmeyi uygulamadan önce öğ re ncile rin 100 üzerinden en az 50 puan almak gibi belli bir mutlak başarı ölçütünü geçmeleri istenebilir. Genel olarak düşün ürsek . yeterlik sınavla rında mutlak değerlendirme­ nin, seçme sınavl arınd a ise bağ ıl d eğerl endirm e nin kullan ıl ması daha uygun bir yaklaşım olur. Örneğin öğrenci seçme sınavlarında, sınava giren öğrencil erin az veya belirli bir kısm ı seçilecekse. bir mutlak başarı ölçütü ko ymak yerine öğren cil erin başa rı sırasına da yalı olarak yapı lacak bağı l

Tüm sonuçlar Tablo 11-1 de sunulmuştur.

Xi

Öğretimde Ölçme ,·e D ·-

Öğrenci &şansım Dti;erlemlirmc

Mutlak Değerlendirmenin Olumlu ve Olumsuz Yönlerini

Olumlu Yönleri

Olumsuz Yönleri

1.

1.

2.

2.

251

Öğretimde Ölçme ,·e D ·-

o.

Öğrenci &şansım Dti;trlemlirme

257

Yukandaki verilerden faydalanarak aşağıdaki soruları cevaplayını z 1) Yu k arıdaki puan ları Z ve T puanlarına çeviriniz. 2) Z ve T

pua nlann ın

aritmetik ortalama ve standart

sapma la rın ı

he-

saplayıp buld uğunuz sonuçların uygunluğunu yoruml ayınız.

3) Aşağıdaki mutlak başarı ölçütlerine göre öğrencilere not veriniz.

MBY

Not

Anlamı

85-100

5

70-84 55-69

4

Pekiyi iyi

45-54

2

00-44

1

3

Orta Geçer Kalır

4) Öğrenci puanlarını aritmetik ortalaması 70 ve standart sapması 10

olan puan türüne dönüştürünüz. 5) Aşağıdaki ölçütleri kullanarak, öğren cilerin yüzdelik sıralarına göre

not veriniz. Yüzdeli~i ilk o/o 20'e girenlere %21-40 a ras ında olanlara %41-60 a ras ı nda olanlara %61-80 a rası olanlara %81-100 aras ı olanlara

Notu

An l amı

A

Pekiyi iyi Orta Geçer

B C

o F

Basarısız

268

269

·-·> ·-

o.

Ô{.'l'diımle Ölçme ~·e ~crlc,,dirme

260

SINAV TÜRLERİ VE SORU YAZIMI

_ _ _ _ _ _ _ _ _ _ ____,/ ÜNiTE 9 Sınav

Türleri

Öğrencilerin başarılarını değerlendirmek, öğretmenlerin önemli sorumlu-

luklarından biıidir. Öğrenci başarılarının değerlendiıilmesinde öğretmenler bazı gözlem ve ölçümleıinden laydalanmaktadırlar. Öğrencilerin bir dersteki

SINAV TÜRLERİ VE SORU YAZIMI S ınav

veya bir kurstaki başarılarını değerlendi rmede s ı navlardan, d iğer sını r içi etkinliklerden, ödev veya proje gibi etkinliklerden elde edilen ölçümlerden laydalanılmaktadır. Önceki bölümlerde vurgulandığı gibi, öğrenci başarısını değerlendirebi lmek için elimizde bazı ölçme sonuçlan ve ölçüt(ler) ol malı dır. Değerlendirme için gerekli ölçütler önceden tespit edilip öğretmen lere bildirilmektedir. Örneğin; dönem sonu başarı puanı 50 ve üzeri o lan ve %30'dan lazla devams ı zlı ğ ı olmayan başarıl ı sayılır gibi.

Türleri

Öğrenci başarısını değerlendirebilmek için öğretmenlere düşen asıl görev; öğrencilere sınavl ar yapıp, o dersteki öğrenci başarısını yansıtan ölçümleri elde etmektir. Öğrenci başarılarını yansıtan güvenilir ve geçerli ölçümler elde etmek için öğ retmen ler öncelikle s ın avla , nelerin ölçülmesi gerektiğini bilmelidirler. Bilindiği gibi bu aynı zamanda ölçme işleminin ilk aşamas ı olan niteliklerin tanım lanması aşamasıdır. Sonraki aşamada, öğ• retmenlerin bazı ölçme araç ve metotlarını etkin bir şekilde nasıl kullanabileceklerini bilmeleri gerekir. Ancak bu suretle, öğrencilerin başarıları hakkında daha güvenilir ve geçerli ölçümler elde edilebilir. Zaten; s ınav yapmanın temel amac ı da öğrencilerin başarıları hakkında güvenilir ve geçerli ölçümler elde etmektir. Sınavların öğretime başlamadan, öğretim süresi içerisinde ve öğretim süreci bittikten sonra da yapıl ması söz konusudur. Öğretime başlamadan önce yapılan sınavlara tanıma sınavı veya genel bir ifadeyle ön-test denir. Ön-test sınavlarının temel amacı; öğrenci­ lerin gerekli olan ön öğrenmel ere sahip olup ol madıklarını, daha doğrusu öğretime hazır olma düzeylerini belirlemektir. Tüı1 ·-

o.

Sııım· Türler;

re Sonı Yavııu

Bu sınavlarda özellikle başarı testlerinde. tüm davranışların yokla nmas ın­ dan ziyade öğrencilerin dersle ilgili önemli davranışları kazanma düzeyleri ölçülür. Bu aşamada yapılan sınavla rda hem öğrenciler hem de öğretmen için dönüt sağlaması yan ında temel amaç, öğrencileri n başarı düzeylerinin tespitidir. Seçme sınavları ise belli bir sayıdaki öğrenciyi seçmek için yapılan üniversiteye giriş sınav1arı, KPSS gibi sın avlard ır.

!

Ô{.'l'düıule Ölçme ~·e ~crlcr,dirıııe

262

261

Yukarıda belirtilen sınavlara ek olarak bu kitabın alternatif değerlen­ dirme ünitesinde yer alan aşağıdaki yöntemler de öğrenci başarısını ölç. mede kulla nıl maktad ır:

Performans testten Öğrenci gelişim dosyası (portfolyo)

öz değerlendirme Akran değerl endi rme

SINAVLAR

Görü şme

ı

/

ve

Gözlem

İzleme Testleri öğretime başlama­

dan önce navlar

ya p ıl an sı ­

Temel amacı: Hazırbulunu şluk dü-

zeylerinin belirlenmesi Ta nılayıc ı test veya Ön test

Oğretim

süresince

ya pıl a n sınavl ar

Temel amacı: Öğ­ renme eksiklik veya yetersizliklerinin ve öğren me düzeyinin belirlenmesi - izleme (biçimlendirici, formatif) testleri (Alı şt ı rmalar, Quizler ve Ünite testleri gibi) - Başarı testleri

Oğretim bittikten

sonra lar

izleme teslleri; her ünite sonunda yapılan ve üniteyle ilgili tüm davranışların yoklandığı test türüdür. izleme testlerini kullanmaktaki amaç; öğ­

yapılan s ınav­

rencilerin belli bir ünitedeki öğrenme eksikliklerini ve güçlüklerini tespit etmektir. izleme testleri genelde not verme amacıyla kullanılmaz. Öğrencilerin dersin istendik davranı şl arını kazan mal arında. öğrencilerin öğre nme güçlükleri tespit edildikten sonra. öğretimi n verimliliğini artt ırma k için kullanılır. izleme testleri genelde her ünite sonunda yapılır. Üniteler aşamalılık ilkesine göre sıralandığından, bir sonraki ünite için ön-koşul olan bir ünitenin hedef ve davranışları nın yeterli bir düzeyde öğrencilere kazandırılması amaçlanır. Gerektiğinde , tüm davranı şl arın kazanılmasında öğrenme eksikliğ i çok fazla olan öğrencilere, bazı ek kurs, proje ya da ödevler gibi bireysel aktivitelerte, bu öğrencil erin ön-koşu l davranı şlarını kazanmaları

Temel amacı: Başarı ve yeterlik düzeyinin belirlenmesi - Program sonu düzey belirleyici testler (Başarı testleri, Yeterlik s ınavl a rı gibi) - Yeterlik ve seçme

sağlanmalıd ır.

sınavları

izleme testlerinde, üniteyle ilgili tüm davranışlar yoklanmal ıdır. Her bir için e ri şi düzeyi hesap lan mal ı ve erişi düzeyi belli bir yüzdeden (%70 gibi) dü şük olan davra nı şl arın öğren ci lere kazandırılmas ı için gerekli düzeltme aktiviteleri yapılmalıdır. Örnek olarak, dersin davranışları çoktan seçmeli test maddeleriyle yokla n m ı ş ve her davra nı şı ölçen soruları öğ­ rencilerin doğru cevaplama yüzdeleri aşağ ı dak i gibi bir tablöda sunul muş o lsun.

Öğrencilerin öğrenme sürecindeki gelişimlerini izleme ve başarı düzeyle-

rini tespit etme amacıyla bazı

s ın av

türleri

davranış

aşağıda sunul muştur.

1. Yazı lı yoklamalar

2. Sözlü sınavl ar 3. K ısa cevaplı testler 4. Doğru-Yanlış testleri 5. Çoktan seçmeli testler 6. Eşleştirmeli tesller Yukarıda belirtilen sınav türlerinden son dördünün objektiftlkleri, özellikle puanlama o bjektiflikleri çok yüksek olduğu için bu sınav türleri literatürde objektif sınavlar olarak da adlandı rılmaktad ırfar.

272

273

·-·> ·-

o.

Sııım· Türler;

re Sonı Yavııu

263

Ô{.'l'düıule Ölçme ~·e ~crlcr,dirıııe

264

Soru Yazımı izleme Testi

So nuçları

Unite 1

Oavranı§:ı

Sınıfın

ôl--n sorular

erisi düzevi {% \

2

80 70

1

3

20

4 5 6

90

7

85

8

60

K

75

Soru Sorma ve Test Hazırlamada Dikkat Edilecek Genel Hususlar iyi sınav sorusu yazabilmek veya iyi bir sınav hazırfayabilmek için hem konu alanını çok iyi bilmek hem de öğ rencil eri çok iyi tanımak gerekir. Bun• lara ilave olarak ölçme ve değerlendirme ve test geliştirme alanında yeterli bilgi ve becerilere sahip olmak gerekir. Zamanla , yıllar geçtikçe, soru yazma ve sınav hazırlamadaki deneyimler arttıkça daha kaliteli soru yazabilmek kolaylaşacaktır. Kaliteli soru yazmada ö nemli bir husus da yaratıcı olabilmektir. istenileni daha özgün bir şekilde, öğrenciyi ezberden çıkarıp düşünmeye itebilecek sorular sorabilmek için yaratıcılık çok önem taşı­ maktadır. O halde iyi soru yazabilmek için aşağıdaki nitelikler gerekir: ✓ Konu alanını çok iyi bilmek

30 40



Sınavı

alacak öğrencileri çok iyi tanımak

✓ Ölçme ve değerlendirme alanında yeterli bilgi ve beceriye sa-

hip olmak

Tablodan da anlaşılacağı gibi 3., 4. ve 6 . davranışlara ait erişi düzeyleri çok düşüktür. Bu davranışlara ilave olarak 8. davranışta da ölçüt alınan eriş i düzeyine ulaşılamamıştı r. S ını fı n büyük bir çoğ unluğu bu davra n ı şları kazanmamıştır. Bu durumun gerekçeleri düşünüldükten sonra bu davranışla rta ilgili telafi edici etkinlikler planlan ıp uygu l a nmalı d ır .



Yaratıcı olmak ve



Deneyimli olmak.

Güvenilir ve geçerli bir s ın av sorusu sorma için uyul ması gereken kural veya ilkeler s ınav türlerine göre kısm en fa rklı lı k göstersede baz ı genel ilkeler mevcuttur. Bu kısımda ö ncelikte, s ınav türleri için uyu l ması gereken genel ilkelere, sonraki ünitelerde de s ın av türlerine göre soru yaz ı m ında dikkat edilecek hususlara değinilecektir .

izleme testleriyle ilgili bilinmesi gereken diğer bir husus da: ünitedeki bir ön -koşul ili şkisini n olup ol madığı nın belirlenmesidir. örneğin 3. soru 4. sorunun ön-koşulu olduğundan ve iyi öğrenilmedi­ ğinden dolayı öğrenciler 4. soruyu doğru cevaplayamamış olabilirler. Ünitede öğ rencil ere kazandırılması planlanan davranışl a r arasında bir ön-koşu l ili şki si olup olmadığı , dersin sorumlusu veya uzman kanısı alı narak ortaya konabi leceğ i g ibi istatistiksel olarak ıeırachori c" korelasyon katsayı­ sıyla da belirlenebilir. izleme testleri Bloom·un tam öğrenme modelinde bireyler arasındak i öğrenme farkl ılıkların ı gidermede ve tam öğrenmeyi sağ­ lamada çok önemlidir. davranışlar arasında

Bir sınav sorusu sorarken dikkat edilecek hususların bazıları aşağıda açıkla n m ı şt ır:

1) Yazılan sorular eleştirel bir yaklaşımla kontrol edilip iyi leştiril­ meli Bir davran ı ş ı ölçmeye yönelik ilk kez

yazılan

bir soru için, hiç unutul-

maması gereken bir nokta, o sorunun daha iyi bir şekilde yazılabileceğidir. Yazılan soruların hata içerip içermediğ i, öğrencilerce sorudan istenilenin a çı k

ve net olarak

anlaş ıl ıp a nlaş ılamayacağına

yönelik kontrol

yap ı l ma ­

lı dır. Sorunun çok net bir şekilde anl aşıl masını sağlamak için gerekirse

soruya bazı görsel unsurlar (çizim, grafik gibi) eklenebilir. Öğrenci soruyu okurken kendinden hangi cevabın istend iğini çok net olarak anlamalıdır. Öğretmen, sorudan ne istendiğinin (normal koşullarda) öğrenciler tarafın­ dan fa rl ·-

o.

Sııım· Türler; re Sonı Yavııu

çeı1iğini önemli ölçüde azalt ır. Ders kitabından cümlelerin alınıp sorulmasının doğuracağı başka bir sakınca da; kitaptaki cümlelerin bir sınav sorusu için aşırı genel ve karıştırılabilir ifadelerden oluşmas ıdır. Genelde, kitaptaki bir cümle önceki cümlelerle bağıntılıdır, tek başlarına aynı içeriği

kullanılan dil basit ve dolaygramer ve noktalama hataları olmamalı ve gereksiz kelimelerin kullanılmamalıdır. Bazen soruda bir virgülün un utulması bile sorudan istenilenin yanlış anl aşıl masına neden olabilmektedir. Sorunun açık ve net olarak sorulmamasından dolayı öğrencinin soruyu doğ ru cevaplayama• ması durumunda elde edilecek puanlar öğrencil erin gerçek başa rı düzeyini yansıtmada yetersiz kalır. Bu durum sınavın kalitesini (güvenirtiği ve açık

Ô{.'l'düıule Ölçme ~·e ~crlcr,dirıııe

266

26S

ve net olarak yazılabi lmesi için; soruda

sız olmalı,

ve anlamı net olarak vermezler. Özellikle boşluk doldurma şeklinde uygulanan k ısa cevaplı testlerde bu konuya daha çok d ikkat etmek gerekir.

geçerliğini) düşürür.

4) Soruda ipucu bulunmamalı Soruda gereğinden fazla bilgiler verip sorunun cevabına yönelik ipucu vermemek gerekir. Bir sorunun geçerliğini arttırmak için sorunun, o soruyla ö lçülmek istenen bilgi ve becerilere sahip öğrencil erin tereddütsüz doğru cevaplandırabileceği, sahip olmayan öğrencilerin doğru cevaplandırama­ yacağı nitelikte olması gerekir. Çoktan seçmeli testteki bir maddede bir gramer kura lı sorulup testin başka bir maddesindeki okuma parçasın da bu gramer kuralı kullanılmış olabilir. Bu durum gramer kuralının sorul duğu maddenin doğru cevaplanması için ipucu sağla r. Dikkat edilmediği taktirde, bir test maddesinin başka bir test maddesinin cevabı hakkında bilgi sağlaması mümkün olabilir. özellikle objektifliği yüksek olan testlerde, gerek madde kökünde, gerekse diğer maddelerde, o maddenin cevabının bulunmasına katkı sağlayacak ipuçlarının bulunması, o maddeyi hiç bilmeyen kişilerin de cevaplamasını sağlayabileceğinden, soruyu kusurtu yapar. Bazen çoktan seçmeli testlerde soru kökünde temel bilgileri verip, bu bilginin yorumlanması istenmektedir. Bu tür soru yazımında bilgi verip, yine bilgi sorulduğunda sorunun cevabı madde kökünde yer aldığında n dolayı soru doğru cevaba ipucu veriyor demektir. Konuyu hiç bilmeyenlerde bu ipucundan faydalanarak soruyu doğru cevaplayabilir.

2) Sorular testin kapsam geçerliğin i sağlama açısından yeterli olmalı

Soru hazırlamadan önce s ınavın kapsamına uygun olarak bir belirtke tablosu hazırlanmalıdır. Bunun için öncelikle dersin konularını ve davranış düzeylerini belirleyen, yani hangi konularda hangi düzeyde kaç davranış ın kazandırılmas ı gerektiğin i belirten belirtke tablosunun hazırtanması gerekir. Bu suretle hangi konularda hangi düzeyde soruların sorulması ge• rektiği daha net olarak ortaya konularak testin kapsam geçerliği de artt ırı­ labilir. Her hedef davranışı ölçme amac ıyl a, birden çok madde yazılarak bir soru bankası oluşturma çalışması da yapılmalıdır. Ayrıca, sorulan bir soru yazıldığı amaca uygun olmalıdır. Örneğin; ölçülmek istenen davranış kavrama düzeyinde iken, soru kavrama düzeyinde bir zihinsel etkinliği ölç. meyip, bilgi düzeyinde kalıyorsa, bu sınavın istendik niteliklerini, özellikle kapsam geçerliğini d üşürü r. Ortak köklü soru yaz ı mında bir konuyla ilgili olarak gereğinden fazla soru sormak da testin kapsam geçerliğini olumsuz etkiler. Aslında ortak köklü soru yazımında 2 temel sorunla karşılaşmak mümkün, birincisi ortak kökten dolayı aynı konudan gereğinden fazla soru sorup, testin kapsam geçerliğini düşürmektir. ikincisi ise soruların cevaplandırılmasının birbirinden bağımsız olmamas ı sorunudur. Yani 1. soru yanl ışsa . zincirleme olarak d iğerlerinin de yanlış olma durumu söz konusudur. Soruların birbirinden bağımsız olarak cevapl andı rılamamaları test pua nlarının güvenirliğ ini de geçerliğini de düşürür.

3) Soru bir kaynaktan aynen

yıla

5) Sorular sürekli olarak gözden geçirilmeli ve hiç değ iş t iri lmeksi zin kullanılmamalı

aynı

sorular yılda n

Öğrencilerin sınav sorularını önceden bilmeleri (her yıl aynı sorular soru lduğundan dolayı veya öğretmen in bazı soruları kendisinin öğrencilere sınavdan önce vermesi durumunda), konuyu bilmeyen, dersi öğrenmemiş öğrenci l erin soru ve cevapl arı ezberleyerek yüksek puan almalarına neden olur. Bu durum istenmedik değişkenler puanlara karışacağından, geçerliği; hata puanını arttıracağından dol ayı da güvenirliği düşürür. Yazıla n bir sorunun belli bir süre sonra revizyona tabi tutularak iyileştirilebileceği de unutulmamalıdır. Sorunun tekrar incelenmesiyle önceden görülemeyen bazı basit hata l arın giderilmesiyle (o sorudan faydalanarak) ayn ı davranışı ölçmeye yönelik daha kaliteli bir soru yazma şansı da doğar.

alınmamalı

özellikle objektifliği yüksek olan kısa cevaplı testler, çoktan seçmeli testler veya doğru -yanlış testlerinde, bir soruyu oluşturan cümlenin bir kaynaktan, özellikle öğrencilerin elinde bulunan ders kitabından aynen alın ­ ması. o sorunun cevaplanması için çok düşük bir zihinsel etkinlik gerektirmesi veya iyi bilinmese bile tanınarak cevaplanabildiğinden , o sorunun ge-

276

277

·-·> ·-

o.

Sııım· Türler; re Sonı Yavııu

6) Sorunun cevap anahtarı soru yazılırken

Ô{.'l'düıule Ölçme ~·e ~crlcr,dirıııe

268

261

hazırlanmalı.

Uygulama: ö rnek bir sınav yönergesi yazınız.

Özellikle ödev ve projeler, yazılı ve sözlü yoklama olmak üzere, puan• lama sübjektifliğinin yüksek olduğu sınav türlerinde mutlaka puanlama güvenirli ğini arttırıcı tedbirler alınmalıdır. Bu tedbirlerin en önemlisi, detaylı bir cevap a nahtarının hazırla nması dır. Sorudaki bazı hataları başlangıçta görüp düzeltmek için cevap anahtarı soru yazılırken hazırlanmalıdı ~. önce soruyu yazıp, sınavdan sonra cevap anahtarı hazırlama yoluna gı• dilmemelidir. Hazırlanan bu cevap anahtarı gerekirse öğrencil er tarafından verilen orijinal cevaplara göre revizyona tabi tutulmalıdır. 7) Sorunun ölçülmesi amaçlanan becerileri ölçmede kontrol edilmeli

uygunluğu

Bir sorunun hangi d üzeyde bir zihinsel beceriyi ölçtüğü sorunun sorubiçimiyle birlikte, soruyu cevaplayacak olan öğrencileri n öğrenme düzeylerine de bağlıdır. Öğrenciler için uygulama düzeyınde bır zıhınsel el• kinliğ i ölçtüğün ü düş ündüğümüz bir soru testi alan grup için aslında h_?ıı_'.· lama veya kavrama düzeyinde olabilir. Kapsam geçe rlığ ı aç ı s ından duşu ­ nürsek, örneğ in, yorumlama düzeyinde olduğu nu düşündüğünüz bir soru grup için bilgi düzeyinde ise bu durum sınavın kapsam geçeı1iğ i ni düş ürür. luş

8)

Soruların

9) Diğer hususlar Yukarıdaki hususlara ek olarak soru yaz ı m ında; soru sayısının ve Si• nav süresinin yeterli olması, öğrenciler arasındaki faı1dılıkları daha iyi belirleme amac ı yl a sın avda sorula n soru ları n grup için genelde orta g üçlükte olması. ölçme i şlemin in her aşamasında ciddi ve titiz ol unması. vb. hususlara da dikkat edilmelid ir. Sınav yapmanın temel amaçlarında n biri, öğrenci lerin öğrenme düzeylerini tespit etmek olsa da. ölçme ve değerlendirme açısından _sı~avıarı n temel amaçlarından biri de öğ rencilerin öğrenme düzeylerinı gelıştırmektır. Günümüzde, bazı öğrencilerimizin öğrenm e g üdüsünün sadece geçmek için yeterli puanı alma olmas ı veya öğrenmed en. bazı destekle_rıe o_~e rsten başarılı olmak için güdülenmesi, yapılacak sınavların kalıtesının ogren• cilerin öğrenme düzeylerine etkisini daha da arttırmaktadır. Yapılan sına­ vın kalitesini, sorulan sorul arın kalitesi önemli derecede etkılemektedır . Bununla birlikte, sınavın kapsam geçerl iği, uygulama ve puanlamadan kaynaklanan güven irtiği de sı nav kalitesini etkileyen önemli faktörterdendir.

test formu haline getirilmesinde titiz olunmalı

Sorula rın bir lesi fonnu haline getirilmesinde aşağı daki hususlara dik-

kat edilmelidir. Tüm sınav tüı1erinde , sorulara geçilmeden önce sınavın amac ı . süresi, puanl ama nın nas ıl yapı l acağı, s ınav süresince öğren ci lerin uyacağı kurallar, vb. g ibi hususlar öğrencil ere bir sınav yönergesiyle kısa o larak açık­ la nmalıdır. Testte maddeler k ull a n ışlı bir sayfa d üzeninde verilmelidir. özellikle objektifliği yüksek olan testlerde, okuma ve algılama kolaylığı sağ lamak amacıyl a , maddeler; hem a lg ıl a nmas ı hem de okunması aç ı s ın ­ dan en uygun fonnatta yazı l malı ve test en uygun formaıta düzenlenmelidir.

278

279

·-·> ·-

o.

Sııım· Türler;

re Sonı Yavııu

269

Ô{.'l'düıule Ölçme ~·e ~crlcr,dirıııe

270

Hedef davranışa uygun soru yazma

Uygulama:

Öğrencilere ne tür hedef ve davranışların kazandırılması planlandığı­ nın net olarak ortaya konul ması iyi bir öğre ti m etkin l iğ i için ilk aşamadır. Bu aşama aynı zamanda öğrencilerin başanlannı değerlendirmede de temeldir. Soru yazmadan önce ölçülmesi amaçlanan hedefin, bu hedefi oluşturan davranışlarının bilinmesi, uygun soru yazımını kolaylaştırmakta­

Alan ınızla

b. bu hedefle ilgili davranış(lar)ı ve c. bu davranış(lar)ı ölçen madde(ler) yazınız.

d ır. An l aşılacağı

üzere soru

ilgili; a. bir hedef,

yazımında;

Hedeften -+ davranışlara doğru bir ilerleyiş söz konusudur.

-+ test maddelerine

Davranışları:

Hazırtanan sınavın kapsam geçerl iğin in kontrolü açısından her konu için hangi davranış düzeylerinde kaçar adet davranışın mevcut olduğunu

belirten bir belirtke tablosunun hazırla nması uygun olur. Örnek: Hedef: "Ölçme ve değerlendirme dersinde, standart hatayı hesaplayabilme" Davranışları:

Test Maddeleri:

a) Ölçümlere ait standart sapmayı hesaplamak

b) Ölçümlere ait güvenirlik katsayısını hesaplamak c) Ölçümlerin standart hatasını hesaplamak Soru yazma (her bir davranış ın

gözle nebileceği

test maddeleri yazıl ­

mal ı dır)

40 öğrencinin 30 tane çoktan seçmeli test maddesinden oluşan bir testten aldıkları puanlar(Xı) ve test maddelerinin güçlükl eri(Pı) aşağıdaki gibidir.

! Xi: ! 12, 27, 13, 09. 05. 16, .......... .. .. ...... ,....... . Soru sorarken dikkat edilecek genel hususlarda, 2. madde de belirtilMadde : 1

Pj:

1 1 2 1 3 1 0,30 0,40 0,6~

diği gibi yazılan bir soru, tasarlanan davranışı ölçmeye uygun olmalıdır.

30 0,90

Bu konunun biraz daha deta yl ı olarak tartışıl ması faydalı olacaktır. Bu sebeple, aşağıda davranış düzeylerinin s ı nıflandırılması ve her düzey için soru yazmada bazı öneriler sunulmuştur. Öğrenci davranışlarının sınıflan­ dırmal arından biri : bu davranışların bilişsel, duyuşsal ve psiko-motor olmak üzere 3 gruba ayrı l ması şeklindedi r. Bu sınıflandırmadan kitab ın içeriğ i gereği sadece bil işsel alan aşağıda k ısaca sunul muştur.

Bu test puan larına ait; 1. Standart sapmayı hesaplayınız. 2. Güvenirlik katsayı sını hesaplayınız . 3. Standart hatayı

h esapl ayını z .

Görü ldüğü gibi hedeflere ait davranışların ayrıntılı yazılması soru hazırlamayı kolayl aştırmaktad ır.

280

281

·-·> ·-

o.

Sııım·

Türler; re Sonı

Yavııu

BİLİŞSEL ALAN

Farklı Zihinsel Becerilerin Ölçülmesine Uygun Soru Yazımı

Biliş.se l alanla ilgili öğrenci davranı şları. tamamen bilgi ve beceriyle ilgili olan zihinsel davranışlardır. Bilişsel a lanın aşağ ıda verilen sınıflandırı l­ ması Bloom (1956:62-195) tarafından yapılmıştır. Bloom bili şsel davranış­ l arı a şa malı olarak alt ı basamakta ele al m ış tı r.

Bu kısımda bilişsel alanın alt b asamaklarına uygun soru yazmada dikkat edilecek bazı hususlar sunulmaktadır. Sınıf ortamında sorulan soruların bil i şsel alan ın "bilgi, kavrama, uygulama ve analiz• düzeyinde olmas ı söz konusudur. Zihinsel sürecin bir üretimi olarak orijinal bir ürünün ortaya konmas ını ifade eden "sentez düzeyi" ve yine orijinal bir ürünün değerlen­ dirilmesi gibi çok yüksek düzeydeki zihinsel etkinliklerin s ınır ortamında s ı­ nırlı bir sürede uygulanan sın avda sorulacak sorularla ölçülmesi pek müm• kün olmamakla beraber bu uygun bir ölçme yaklaşımı olmaz.

Bilişseı Alanla İlgili Davranışların Sınıflandırılması 1.00. Bilgi: Hatırlama düzeyinde

1) Hatırlama Düzeyindeki Zihinsel Becerilerin Ölçülmesi

1.10: Bir alana özgü bilgiler (Kavramlar, Olgular bilgisi) 1.20: Bir alana özgü bilgilerle uğ raşma nın araç ve yolları (Alı şı lar , Yönelim, sıra ve aşamalı diziler, Sınıflamalar, Ölçütler, Yöntemler bilgisi)

Bilgi düzeyindeki hedefleri kazanm ış öğrencilerin göstereceği davraveya da vra nı ş lar . kaza nd ırı lmas ı hedeflenen bilginin ha tırtan masına dayalıd ır. Ki şinin h atırl amaya yönelik göstereceğ i davran ı şl a r kapalı uçlu maddelerde "görünce tanıma· ve açık uçlu maddelerde "sorunca yazma veya söylemedir." Her eği ti m düzeyinde. bilgi düzeyinde hedeflerimiz mutlaka va rd ır. Bunlar; nı ş

1.30: Bir alandaki evrensel öğe l erin ve soyutlama l arı n bilgisi (İlke ve genellemeler. Kuram ve yapılar bilgisi)

2.00: Kavrama: Bilginin

ba ş ka

Ô{.'l'düıule Ölçme ~·e ~crlcr,dirıııe

272

271

bir b içimde ifade edilip yoru m la nması

2.1 0: Çevirme Kavramlar ve olgular bilgisi: Bilgi düzeyindeki sorular çoktan seçmeli ve D oğru-Yan lı ş testlerinde "tanıma davra nı ş ı" olur. Yazı lı ve sözlü yoklamada "yazma veya sôyleme• davran ış ı olur.

2.20: Yorumlama 2.30: öteleme 3.00: Uygulama: Bilgilerin yeni durumlara uygulanabilmesi

Örnek Sorular:

4.00: Analiz: Bir bütünün öğeleri ve öğeleri arasındaki ilişkileri ortaya ç ıkanma

Kısa cevaplı :

4.10: Öğelere dönük analiz

1. Nitelikleri n icelleştirme işine ne denir? 2. Madeni parayı tarihte ilk kez hangi devlet ku llan m ı ştı r?

4.20: ilişkilere dönük analiz 4.30: Örgütleme ilkelerine dönük analiz

Çoktan seçmeli: 1. Nitelikleri n icell eşti rme A) Ölçüm 8) Ölçme

5.00: Sentez: Yeni bir bilişsel ürün ortaya koymak 5.10: Özdeşsiz bir iletişim muhtevası meydana getirme 5.20: Bir plan veya 5.30: Bir soyut

i şleml er ta k ı m ı

i lişkil er takım ı

6.00: D eğerlendi rme: Yeni b ir le~e deljer yarg ı sına varma

önerisi meydana getirme

ürün

hakkında

iç veya

dış

ötçüt-

Dış

E) Değerlendirme

Doğru yanlış :

(D) (Y) 1. Nitelikleri nicelleştirme işi n e ölçme denir (D) (Y) 2. Madeni parayı tarihte ilk kez L idya lıla r kullanm ı ştır

6.10: iç ölçütlerle değer yargısına varma 6.20:

ne denir? C) Ölçüt O) Ölçek

2. Madeni pa rayı tarihte ilk kez hangi devlet ku llan m ı şt ır? A) Asurlular 8) Fenikeliler C) Lidyalıla r D) M ı s ı~ılar E) Hititler

meydana getirme

bi lişse l

işine

ölçütlerle değer ya rgısına varma

282

283

·-·> ·-

o.

Sııım· Türler;

re Sonı Yavııu

273

Ô{.'l'dı'ııule Ölçme ~·e ~crlcr,dirıııe

274

Al ı şılar bilgisi: Her bilim alanın da kull an ıla n baz ı simge veya semboller vardır. Bu simge ve sembollerin iyi anlaşılması daha sonraki konuların daha iyi anlaşılması için önemlklir. Bu simge ve sembollere alı şılar denmektedir. Öğrencinin alışılar bilgisini ölçmek için ölçmenin standart hatasının veya kimyasal bir elementin simgesi sorulabilir (C, CO, Se vb).

Ölçütler bilgisi: Yine bazı bilim dallarında yorum yapma. değerlen­ dirme. s ın ıfl a ma amacı yl a ku lla n ıl a n bazı ölçütler vardır. Bu ölçütlerle ilgili sorular sorulabilir. Örneğin, bir güvenirlik katsayısının tutarlılık anlamında yorumlan masın ın nelere bağlı oldu ğ u sorulabilir veya bir maddenin ayırt edicilik gücünün yoru m la nmas ına yönelik aşağ ı daki gibi bir soru sorulabilir:

Örnek Sorular: Kısa cevaplı:

Örnek Sorular:

1. Test pua nla rına ait standart sapmanın simgesini yazınız

Kısa cevaplı:

Çoktan seçmeli: 1. Aşağıdakilerden hangisi test puanlarına ait standart sapmanın simgesidir? A) r-,, 8 ) r, C) S; D) S, E) S0

1. Bir test sorusunun ayırt edicilik gücünün yeterli kabul edilmesi için madde test kore!Ssyonu en az kaç olmalıdır?

Doğru yanlış:

Çoktan seçmeli:

(D) (Y) 1. S, test pu anlarına ait standart sapmanın simgesidir?

1. Bir test sorusunun ayırt edicilik gücünün yeterli kabul edilmesi için madde test korelasyonu en az kaç ol malıd ır?

Sınıflama lar bilgisi: Birçok bilim dall ında bazı s ınıfl ama lar söz konusudur: Canlıların sınıflandırıl ması, elementlerin sın ıflandırı lması ve davranışların sınıflandırılmas ı gibi. Bu sını flamaları öğrencilerin bilip bilmediklerini ölçmek amacı yl a bilgi düzeyinde sorular sorulabilir.

A) 0.20

D) 0.80

E) 0.90

(D) (Y) 1. Bir test sorusunun ayı rt edicilik gücünün yeterli kabul edilmesi için madde test korel8syonu en az 0.80 olmalıdı r.

Kısa cevaplı : Bil işsel

C) 0.60

Doğru yanlış:

Örnek Soru:

1.

8) 0.40

alanla ilgili

davran ı ş

doğru s ıral andığ ında başta n

düzeyleri en basitten en üçüncü olan ı yaz ı n ı z .

karmaş ığa

Benzer şekilde öğrencil ere, ✓ bir yerl eşim yerinin ilçe olabilmesi için nüfusun en az kaç olması gerektiği veya ✓ 50 sorudan oluşan bir çoktan seçmeli testin güvenirlik düzeyinin en az kaç ol ması ge rek tiği gibi bilgilerin yokla nması ölçütler bilgilerinin ölçülmesine örnek olur.

Çoktan seçmeli:

1. Bilişsel atanla ilgili davra nış düzeyleri en basitten doğru s ıral andığında baştan üçüncü olan hangisidir?

A) Bilgi 8) Değerlendirme

C) Sentez

D) Analiz

en karmaşığa E) Uygulama

Doğru yanlış :

(D) (Y) 1.

B ili şsel

alanla ilgili davra n ı ş düzeyleri en basitten en karmaüçüncü olan ı uygulama-

ş ığa doğ ru s ıra l and ığında başta n d ır .

284

285

·-·> ·-

o.

Sııım·

Türler; re Sonı

Yavııu

275

Yöntemler bilgisi: Bilim dallanna özgün olarak kull anılan bazı yöntemler vardır. Bu yöntemlerin kullanımı veya uygulanmasının hangi durumlarda mümkün olduğu sorulabilir. Örneğin; çoktan seçmeli testlerin güvenirli ğinin hangi yöntemle bulunabileceğ i sorulabilir veya yazılı yoklamaların güvenirliğinin bulunmasına yönelik olarak aşağıdaki gibi bir soru sorulabilir.

2) Kavrama Düzeyindeki Zihinsel Becerilerin Ölçülmesi Bilgi düzeyinden fazla olarak, çevirme (bilinenlerin başka bir şekilde veya dille ifadesi), yorumlama ve öteleme davranışların ı içermektedir. Gerek dersin işlenişi nde, gerekse yapılan s ınavlarda mutlaka kavrama düzeyine ulaşılmalıdır. Aksi durumda yeterli öğrenmenin sağlandığın dan söz etmek yanılt ı cı olur.

a) Çevirme: Çevirme düzeyinde soru sorarken; öğrenci den "bir bilgiyi kendilerine özgü bir şeki lde ifade etmeleri" ya da "farklı bir dille ifade edilmiş bilgiyi tanımaları " davranı şl arını gözleme amaçlanır.

örnek Soru: Kısa cevaplı:

örneğin;

1. Bir kez uygulanan bir yazılı yoklamanın güvenirliğini hesaplamada hangi formülün kullanı mı en doğru olur?

-ilköğretim 6. sınıf, matematik dersinde, bir cebir problemini okuyup onun çözümü için denklem yazma. -istatistik I dersinde. sözel olarak verilen bilgileri grafikle gösterme. -Lise 2. sınıf, lngilizce dersinde, yabancı dilden bir metni okuyup anlaTürkçe olarak yazma.

Çoktan seçmeli:

mını

1. Bir kez uygulanan bir yazı lı yoklaman ın güvenirliğini hesaplamada aşağıdaki güvenirlik kestirme yöntemlerinden hangisinin kullanımı en doğru olur?

-Bir kavramı (ezberletilenden olarak açıklama .

A) Test tekrar test B) Testi

Ô{.'l'düıule Ölçme ~·e ~crlcr,dirıııe

276

farklı

olarak) kendi kelimeleriyle

doğru

Ornek Sorular: 1. 2x-1 =21 denkleminin çözümüyle bulunabilecek bir problem yazı­

yarı l ama

nız.

C) Alfa

2. "Damlaya damlaya göl otur" aıasözünü bir cümle ite

O) KR,o E) Paralellesller

açıklayınız.

3, Bu kitabın birinci ünitesinde verilen bilgileri bir şiir veya öykü tormatınd a anl atınız.

Doğru yanlış:

4. ½ kesrini şeki l üzerinde gösteriniz.

(O) (Y) 1. Bir kez uygulanan bir yazılı yokl amanın güvenirli ğini hesaplamada testi yarılama yönteminin kullan ım ı en doğru yak-

5. Aşağıdaki bilgileri Venn Şemasıyla (küme şekilleriyle) gösteriniz. "Bir sınıfta , 10 tane voleybol oynayan, 15 tane basketbol oynayan, 12 tane futbol oynayan, 9 tane hem futbol hem de basketbol oynayan ve 3 tane de hiçbir sporla uğraşmayan öğrenci vardır."

laşımdır.

Bilgi düzeyinde soru sorarken açık uçlu madde formatını kullanmak davran ı şının gösterilmesini sağl asa da cevap yazımı zaman alır. Bu sebeple çok soru sorulamaz. Eğer bilgi düzeyinde sorulması gereken çok soru varsa, çoktan seçmeli test gibi cevabı yazmayı değil seçmeyi gerektiren testlerin kullanımı daha uygun olur.

"'yazma·

Bir sınavda çevirme i şl emi yaptırı l acaksa, anlamı kavramadan çevirme yapman ın imkansız olduğu sorular sorulmalıdır. Yani öğrenci. anlamı kavramadan sadece hatırl amayla çevirme gerektiren soru l arı cevapl ayamamalı dır.

286

287

·-·> ·-

o.

Sııım·

Türler; re Sonı

Yavııu

277

b) Yorumlama: Yorumlama düzeyinde çevirmeden fazla olarak; verilen bilgilerde, bazı bağlan tılar bulma ve onları açık lama davranışları vardır. Bunun klasik örneklerinden biri; özetleme davranışıdır. Örneğin. öğ­ rencinin uzun bir paragrafı anlamını bozmadan özetleme davranışını göstermesi. Yorumlama davranışı için diğer bir örnek, verilen bilgilerden bir genellemeye gitme davran ı şıdır.

3. Uygulama Düzeyindeki Zihinsel Becerilerin Ölçülmesi Bu aşamada öğrencilerin , bildiği ve kavradığı niteliklerden faydalanarak, bu nitelikleri ilk kez karşılaştığı bir sorunu çözmede kullanabilmeleri söz konusudur. Uygulama düzeyinde, bazı ilke ve genellemelerin yeni durumlara ve problemlere uygulanabilmesi söz konusudur. Yani, öğrenci ge. netleme ve ilkeleri ilk kez karşılaştığı problemlerin çözümünde kullanabilmelidir. Anlaşılacağı üzere, bir sorunun öğrenci için uygulama düze. yinde olması için öğrencinin karşılaştı ğı problem durumu yeni olmalıdır. Öğrenci burada yeni durumu yorumlayıp problemin ne olduğunu görebilmelidir. Kı sacası , uygulama düzeyinde soru yazarken; bir problemin öğ­ renci için 'yeni" hale getirebilme yolları aranır. Unutmamak gerekir ki, "bir problemin sınıftaki tüm öğren ciler için yeni hale getirildiğini savunmak güçtür". Turgut'un (1984, s:140-141 ) da belirttiği gibi, bir problemin öğrenci için yeni hale getirilmesi için aşağıdaki tedbirler a lınabil ir:

örnek Soru: 1. Hazırl anan bir testin öğrenciler için çok kolay veya çok zor olması öğrencilerin test puanlannın birbirine çok yakın olmasını sağlar. Test çok zor ise öğrencilerin çoğunun test puanı düşük olur. Eğer test çok kolay ise öğrencilerin çoğunun test puanı yüksek olur. Her iki durumda da testin (ölçülen değişken bakı­ mından) öğrenciler arasındaki farklılıkları ortaya koyabilme düzeyi düşer. Bu durumdan dolayı test pu anlarının güvenirliği ve testin ayırt edi ciliği düşük olur. Yukarıd aki paragrafta anlatılmak isteneni (ana fikri) bir cümle ile belirtiniz.

a) Derste veya pratikte karşılaşılması mümkün olmayan bir durumun ortaya konup, bu durumla ilgili problem düzenlenebilir. b) Derste öğrenilmi ş veya pratikte karşılaşıl mı ş bir durumun önemli yeni bir problem haline getirilebilir.

c) Öteleme: Öteleme yapmak demek: gözlenmiş olaylara bakarak, gözlenmem i şter hakkında yargıya varmak demektir. Bu düzeyde soru sorarken: genelde, zamanla değişen bir bilgi bütünü verilir. Bu verilerdeki yönelimin, zaman aral ı ğının d ış ı na ötelenmesi istenir. 1.

·2

3

8

63

öğel eri deği ştiril erek ,

. __c) Öğrencinin öğrendiği bilgileri kullanarak henüz öğrenmediği konuyla ı lgı lı problemler düzenlenebilir.

r

örnek Sorular:

Yukarıdaki sayı dizisinde soru işareti yerine

kaç gelmelidir? (ileriye dönük öteleme)

·2

2.

5

1. Eğer insanlar gördüklerini ve duydu klarını 5 saniye sonra algılasalardı ne olurdu? Örneklerle açıklayınız.

? 23

4r Yukarıdaki sayı dizisinde soru işareti yerine kaç gelmelidir? (geriye dönük öteleme)

2. Sayısal yeteneği ölçmek amacıyla, çoktan seçmeli test maddesinden olu şan ve güveni rliği 0.20 olan alt testlerden elimizde çok sayıda varsa, güven irli ği 0.90 olan bir test elde etmek için bu alt testlerden kaç tanesini teste almalıyız?

3. Choose the best answer for the missing part. Ali: Hi, Eda! Where were you !ast night? Eda: 1was at the party Ali: How was the party? Eda:·-····-- - - - · A) B) C) O) E)

Ô{.'l'dı'ııule Ölçme ~·e ~crlcr,dirıııe

278

3. Testi yarılama yöntemiyle ekie edilen testin tümüne ait güvenirlik sayısı 0.89 ise alt testlere ait güvenirlik katsayısı kaç olur?

1went to Paris 1had a headache 1talk on the phone with my friend it was funny, 1enjoyed very much it was one week ago

A) 0.80

B) 0.75

C) 0.70

O) 0.65

kat-

E) 0.63

4. Klasik test teorisi sayıltıl arın ı kullanarak paralel testler arası ndaki korelasyonun gözlenen puanlarta gerçek puanlar arasındaki korel§syonun karesine eşit olduğunu (Pxx' = pif,) gösteriniz.

288

289

·-·> ·-

o.

Sııım· Türler; re Sonı Yavııu

Yukarıdaki

2. sorunun çözümü aşaaıda kr 11

sunulmuştur:

Yukarıdaki

rX = -----,--

4. sorunun çözümü

aşaaıda sunulmuştur:

axx' a (r+e)(r'+&') Pxx• = -~-- = -'--, J = ==-"' 2 2 ✓ vxvx, ·-

o.

Kısa Cempl,

~·c Df.>Kru )'aıılış Testleri

315

ögreıiııulc Ölçme •~ De.ğcrleıulirmc

316

Örnek: Kusurlu D-Y Test Maddesi

"Sı k sık",

"Çofjunlukla", "Önemli bir derecede" ve "Birçok durumda"

(D) (Y) 1. Ya zılı yok lamal arın hazırlanması li ği genelde yüksektir.

Öğrencilerin zihninde farklı derece veya miktarı oluşturan terimlerin kulla-

Maddenin iyileştirilmiş Hali:

nımında

(D) (Y) 1. Yazılı

dikkaUi olunmalıdır. Bu tür ifadeler heıl ·-

o.

Çokımı

Stymcli ve ~·lcştimıtli Tc.ı;1lcr

325

Çoktan Seçmeli Testlerin Temel Özellikleri

örnek çoktan seçmeli test maddesi 1. Nitelikleri nice leşti rme işlemi ne ne denir? A) Ölçüm B) Ölçek C) Ölçme D) Değerlendirme E) Niceleme

1) Sorunun cevabı verilen seçeneklerden seçilir. Sorunun doğru cevabı kendi içinde verilmiştir Öğrenci cevabı kendi el yazısı ve kelimeleriyle yazmamaktadır. Öğrencinin cevaplama işini; verilen

Madde Kökü (ltem Stem)

seçenekler arasından madde kökünde sorulan sorunun d oğru cevabını seçerek yapmas ı , puanlama yanlılığın ı ve diğer puanlama h a taların ı büyük ölçüde gidermektedir. Sorunun cevabının öğrenciye (yazdırılmayıp) seçtirilmesinden d ol ay ı çoktan seçmeli testlerin puanlama obj ek tifliği yüksektir. Öğrencinin cevap vermede sunulan seçeneklere bağımlı olmasının olumsuz bir ya nı , öğrencil e ri n özgün cevap verme ihtimalinin söz konusu olmamasıd ır. Öğrencinin cevabı verilenlerden seçmesi, şans başarısı değişke­ nini karşımıza çıkarır. Öğrencilerin çoktan seçmeli test tekniğine uygun çalı şma ve geli ş im düzeyleri sınav peıiorman s ları n ı etkiler.

Sorunun soruld uğu kısımdır. Daha açık bir ifadeyle; bir çoktan seçmeli test maddesinde n_eyin sorulduğu ve sorunun çözümü için gerekli bilgilerin verildi ği kıs ı md ır. O meğ i m i zde madde kökü. maddenin "nitelikleri n i celeş­ tirme işlemine ne denirr kısmıdı r. Seçenekler (Options) Madde kökünde sorulan soruya, muhtemel

Ôğrdimdtı Ölr;ıııc 1·e Dq.".t!rltıulirmcı

326

doğru

cevap olarak verilen

yanıtlardır. Ömeğimizde madde kökünden sonra verilen; "A, B, C, D ve E"

2) Okuma

ler seçenekler olarak adlandır ıl ır. Doğru

Çoktan seçmeli testlerde, test süresinin çoğu maddeleri okumaya ve bulmaya h arcanır. Çoktan seçmeli testlerde, öğ rencil erin bir soruyu cevaplama için ihtiyaç duydukl arı süre k ısadır. Bu sebeple, sorulabilecek soru say ı sı yazılı yoklama ve kısa cevaplı testlere göre daha fazla olur. Çoktan seçmeli testter, okuma ve okud u ğunu anlama ye ten eği gerektirir. Okuma hı zı ve okudu ğunu anlama yeten eği , dikkat gibi unsurtar da çoktan seçmeli testlerde öğrencile rin sınav peıforman slarını etkileyebilecek unsurlardır. Öğrencilerin dili kullanma becerilerini ölçmek amaçlanmadığın­ dan, çoktan seçmeli testler dil açısından uygulandığı grubun düzeyine uygun ol malı, hatta grubun dili kullanma becerisinin biraz altında olmalıdı r. Çoktan seçmeli testlerde çok sayıda soru sorulabilmesi, kapsam geçerliği yüksek bir sınav hazırtama olanağı sağlamaktadır. Sınavın uygulandı ğı öğ ­ rencilerin okuma hızı ve okuduğunu anlama yetenekleri, akıcı ve güzel yazma becerileri kadar farkl ılık göstermemektedir. Bu sebeple, çoktan seçmeli testlerdeki dili kullanma becerisinin s ınavın geçerftğini düşürmeye etkisi yazılı yoklamalardan daha azdır.

Verilen seçenekler içinde, doğru veya en doğru olanıdır. Örneğimizde;

Çeldiriciler (Distractors) Madde kökünde sorulan sorunun olası cevabı için verilen seçeneklerden, doğru cevap olmayanlarıdır. Örneğimizde; "A, B, D ve E" seçenekleri çeldiricilerdir. Formalı

ve okuduğunu anlama becerisi gerektirir

doğru cevabı

Cevap (Keyed Answer)

·c· seçeneği doğru cevaptır.

Madde

hızı

(ltem Format)

Bu kitapta madde formal ı ifadesi ile kastedilen. bir test maddesinin yazaman aldığ ı şekil yani maddenin ta sarımı ve düzenidir. Ostertind (2002) madde forma t ını iki türe ayırı r; yan ı tı seçilen (çoktan seçmeli ve doğru-yanlış test maddesi gibi) ve yanıtı oluşturulan (kısa cevaplı test maddesi gibi) madde formalı . Örneğimizde (madde kökü ve seçenekler olmak üzere) maddenin tümüdür. zıldı ğı

3)

Şans başarıs ı vardır

Şans ba şarısı madde gü çlüğünü yükseltir (maddeyi kolaylaştırır) ve ölçümlere şans değişkeni gibi ölçülmek istenmeyen bir değ işken karıştığından maddenin ay ı rt edicilik gücünü düşü rü r. Çoktan seçmeli testlerde, sorulan bir sorunun doğru cevabını konuyu hiç bilmeyen öğrencilerin sadece şan sla bulma olasılığı vard ır. Tek bir madde için bu olasılık; (a= seçenek sayısı olmak kaydıyla) " 1/a" dır. Örneğin; test 5 seçenekli maddelerden oluşu-

Test Formalı (Test Format)

Bir testin yazım i şleml eri bittikten sonra ald ığı şekildi r. Başka bir ifadeyle, testi olu ştu ran maddelerin, açıklamalar k ısmı dahil olmak üzere, yazıldı ğı zaman ald ığı şekildi r.

336

337

·-·> ·-

o.

Çokımı

Stymcli ve ~·lcştimıtli Tc.ı;1lcr

32 7

yorsa (a=S olur) bir sorunun sadece şans yoluyla doğru cevaplanma olas ı­ lığı 1/5 yani 0,20 olur. Bilindiği üzere, şans faktörü gibi istenmeyen değiş­ kenlerin ölçümlere karışmas ı, o testin güvenirl iğini ve geçerliğini düşürür. 4) Madde istatistikleri

hesaplanmış

dırır. Çünkü bir kere soru bankası oluştuğunda. soru yazımının zaman al• ması söz konusu olmaz. Aynı zamanda, cevap k8ğıtlar ının okunmasının çok az zaman alması avantajı da vardır. Çoktan seçmeli testler çok kalabalık gruplara u ygulandığında, cevap kağ ıtlarının optik okuyucularta okunup, ce-

bankası oluşturu l abilir

bir soru

vapların

elektronik ortamda bilgisayar

h a fı zas ın a

kaydedilip

sakla n mas ı

sağlanır. Bu suretle hem madde analizi için veri girişi kolayca yapılmış olur

Bir ders için konu bazında, öğretim hedeflerine göre, farklı madde ve güçlerinde birçok kaliteli soru bilgisayar ortam ında sakl an ıp, organize edilerek, o derse ait bir soru bankası oluşturulabilir. Bu soru bankası elektronik bir ortamda saklanabilir. Soru bankas ının olu şturulup, k ull anım ı ­ nın sağ l ayacağı zaman ve enerji kazancın ın ya nı s ıra, diğer önemli bir faydası da, test geli şti rme ola nağının sunul masıd ır. Uygulanan sorulara madde analizi yap ı larak :

hem de TAP (Test Analysis Program) ve SPSS (Statistical Package for Social Sciences) gibi paket programların kullanı mı sayesinde tüm analizler çok kolay bir şekilde yapılabilir.

ayırıc ılık

(a) çok kötü sorular soru

Ôğrdimdtı Ölr;ıııc 1·e Dq.".t!rltıulirmcı

328

Uygulama 1: Bu dersin içeriğiyle ilgili olarak kavrama düzeyinde 5 seçenekli bir çoktan seçmeli test maddesini aşağıya yazınız.

bankasından çıkarılara k,

(b) bazı kusurtu sorularda gerekli teknik düzeltmeler yapılarak ileriki yıl­ larda tekrar denenebilir ve (c) çok iyi istatistiksel özellikler taşıyan, güven irti ği ve geçerliği yüksek o lan maddeler tespit edilerek kaliteli sorulardan olu şa n bir soru ba nkas ı o l uşturul ab ili r.

Madde analizi sonucu soru ban kasındaki soruların kaliteleri yıld an yıla arttırılarak, daha güvenilir ve geçerti ölçme araçları da geliştirilebilir. Uygun bir madde havuzu oluşturulması elektronik ortamda sınav yapma ve ölçme amacına uygun sın av yapma kolaylığı sağlar.

Yazdığınız test maddesini sınıfl a paytaşıp el eştirileri a lınız .

5) Yazımı uzmanlık ve tecrübe gerektirir

kadaşla rı nızla tartı şın ız .

Çoktan seçmeli test maddesi

yazı m ı :

konu

Bu test maddesini yazmada sizi zorlayan alanın a

hakim ol manın

çok,

puan l anması

az zaman

ol duğun u

ar-

Çoktan Seçmeli Test Maddesi Yazımında Dikkat Edilecek Hususlar

ma yı ve tecrübeyi gerektirir. Bu sebeple. sadece konu a lanı na iyi hakim olmak, güvenilir ve geçerli bir çoktan seçmeli test hazırl amak için yeterli olmaz. Genelde. birçok öğretmenin çoktan seçmeli testleri tercih etmemelerinin temel sebeplerinden biri, bu testlerin uygun olarak hazırtanmasının ayrı bir uzmanlık gerektirmesidir. Ölçme ve değertendirmeyle ilgili teknik bilgi ve tecrübeye sahip olmayan öğ re tmen lerin , çoktan seçmeli testleri kullanmal arı a kıllı ca bir tercih olmaz. Hazırlanması

neler

yan ı

sıra, ölçme değ ertendirmeyle ilg ili bazı teknik bilgi ve becerilere sahip ol-

6)

hususl arı n

1)

Genelde bilgi düzeyinin üstünde, kavrama ve uygulama düzeyinde sorular sorulmalı

Yazıla cak soruların hangi bilişsel düzeyde olacağı her şeyden önce der• sin belirtke tablosuyla ilgilidir. Yani yapıla cak bir sınavda yoklanacak davranı şların düzeyi kapsam geçertiğine uygun olacak şekilde düzenlenmelidir. Bazen kavrama düzeyinde sorulan bir soru birden çok bilgi düzeyindeki davra~ nı şı gerektirebilir. Testi aşırı zorla ştırmamak ve kapsam geçertiğini düşürme­ mek kaydı ile bilgi düzeyinin üstünde, özellikle kavrama düzeyinde daha çok soru sorma yoluna gidilmelidir. Bu suretle, çoktan seçmeli testlerde olası cevaplann öğ renciye su nul masının doğuracağ ı çok basit zihinsel aktivitelerle, soruların yeterince bilinmeden cevaplanma şansı azaltılmış olunur.

alır

Çoktan seçmeli bir testi (eğer olu ş tu rulmu ş bir soru ba nkas ı yoksa) bir gecede hazırla mak doğru olmaz. Soruların ya zımı veya bir soru bankasının o l uşturul ması çok zaman alır. Bilgisayardan fayd alan ıldı ğınd a, sorular elektronik bir ortamda soru bankasında sakland ı ğ ı taktirde. çoktan seçmeli testlerin kull anım ı (yazılı yoklamalara k ıyasla) öğretmen lere çok zaman kazan-

338

339

·-·> ·-

o.

Çokımı

Stymcli ve ~·lcştimıtli Tc.ı;1lcr

329

Ôğrdimdtı Ölr;ıııc 1·e Dq.".t!rltıulirmcı

330

2) Cevabı en doğru olan madde formalı kullanımı Bazı sorula rda seçenekler belli düzeyde doğru olup, öğrenciden en doğru cevap istenir. Bu tür test maddelerine oevabı en doğru formatında o lan maddeler denir. Cevabı en doğru olan maddelerin güvenirlikleri ve bilenle bilmeyeni ayırt etme güçleri daha yüksek o lur.

1

Uygulama 2: Bu dersin içeriğiyle ilgili olarak, cevabı en doğru olan form atta bir çoktan seçmeli test maddesi yaz ını z.

örnek: Cevabı en do6ru olan madde formalı 1. Aşağıdaki sınav türterinden hangisinin puanlama objektifliği en düşü k­ tür?

A) Yazılı yoklama B) K ı sa ceva p lı testler C) Sözlü Yoklama D) Doldurmalı testler Eİ C':oktan secmeli testler

Yazdığınız

test maddesini s ınıfl a

paylaşıp el eştirileri alın ız .

Bu test m addesini yazmada sizi zorlayan hususların neler olduğun u arkadaşla rı nızl a tartı şın ız .

Cevabı en doğru olan formatta bir çoktan seçmeli test m addesi yazar-

ken; (a)

Ayn ı

derecede doğru iki seçenek (ister çeldirici ister olsun) kullanılmamalı dır.

doğru

3)

cevap

kullanılmal ı

Kusurlu Madde Orneği

Bilgi düzeyinde sorduğunuz bir soruyu, aslında sorunun cevabını hatır­

1. Aşağ ı daki s ı nav türlerinden hangisinin puanlama sektir? A) Yazılı yoklama B) K ı sa cevaplı testler C) D oğru-Yanlı ş testleri D) D o ldurma lı testler E) Çoktan seçmeli tesUer Bu soruda C ve E seçen eği

Test maddeleri nin, ö lçmeyi amaçladığı davranış düzeyine uygun olmas ı için gerekiyorsa " doğru cevabı gizli olan madde formatı "

aynı

obj ek tifliği

lamayan bir öğ rencin in, cevabı seçeneklerden

en yük-

tanıyarak bul mas ı

söz konu-

sudur. Doğru cevabın. seçenekler arasında verilenlerin tanınarak. madde

köküyle çağrışım ya pıp bulunabilmesi eleştirilerini gidermek için doğru cevab ı gizli olan madde formalı geliştiril m i ş tir. Aşağ ı da bu madde formatına uygun bir örnek verilmişti r. Tanıma gibi çok alt düzeyde zihinsel etkinlik gerektiren sorular genelde dü şük ayır ıcılık gücüne sahip olurlar. Bu sebeple baz ı durumlarda aşağ ıd aki örnekte görül düğü gibi seçeneklerde doğru cevabı aynen vermeme yoluna gidilebilir.

derecede doğrudur. Bu iki seçeneklen

sadece biri ku llanı lmalı d ır.

Örnek: Doğru cevabı gizli formatta yazılmış test maddesi

(b) En doğru cevap istendiğinde, "yukarıdakilerden hiçbiri", ve "yukarı­ dakilerin hepsi" seçenekleri ku llan ılmama lı d ır. Çünkü en doğ ru cevap istendiğinde , seçeneklerden birinde e n doğru cevap verilmelidir. En doğru cevap seçeneklerde verilmeyip öğrenciden hiçbiri seçeneğini doğru cevap olarak işarettemelerini beklemek yanlı ş bir yaklaşımdır.

1. Zekanın "G" ve "$" faktörlerinden olu ştuğunu savunan bilim adamının isminin ilk harfi nedir? A) B

340

B) H

C) P

Ql S

E) Y

341

·-·> ·-

o.

Çokımı

Stymcli ve ~·lcştimıtli Tc.ı;1lcr

331

Ôğrdimdtı Ölr;ıııc re Dq.".t!rltıulirmcı

332

Yukarıdaki ömek soruda görüldüğü gibi doğru cevab ı gizli madde yazı­

4)

mında sorunun doğru cevabı seçeneklerde direkt olarak verilmez. Örnek soruda olduğu gibi cevabın bir kısmı verilir. Örneğin isim soruluyorsa ismin

Olumsuz özelliklerle ilg ili çeldirici bulmakta zorlanıldığında, madde kökünü olumsuz cümle formatına dönüştürülmeli

B azı durumlarda, çeldirici nitelikte seçenekler bulmak zord ur. Mesela, bir maddeyle ilgili çok sayı da olumlu durum varken, öğ rencil ere o lumlu özelliklerden birini sord uğun uzda , eğer test 5 seçenekli ise, 4 ta ne olumsuz özellik yazmanız gerekmektedir. Olumsuz özellik yazmada zorl a nı yo rsa n ı z, madde kökünü olumsuz yapı p, çok say ı da olan olumlu özelliklerden 4 ta nesini yazar ve yazmakta zorl and ığını z o lumsuz özelliklerden sadece 1 tane yaza rs ını z. Tabii ki, çoktan seçmeli testlerde zaman ı etkili kullanmak ve dikkat toplamak önemli old uğun dan, baz ı öğrenciler olumsuz ifadeyi olumlu alg ıl ayabil irl er. Bu sorunu gidermek için maddenin olumsuz olduğ una yönelik aşağ ı daki gibi vurgulama !eklerinden birini kullanmak gerekir;

baş harfi, ikinci harfi, son harfi veya ismin kaç harften oluştuğu g ibi bil-

g iler seçeneklerde verilir. Bu durumda öğrencini n d oğru cevabı önce hatır­ laması gerekir. Görünce tanıma veya anımsama gibi hatırlam anın alt düzeyleri sorunun doğru cevabını işaretleme için yeterli olmaz. Doğru cevab ı gizli madde formatının kulla nılabi leceği di ğer bir durum da: i şleme dayalı , kavrama veya uygulama düzeyinde olan bazı soru ları , öğ rencil erin seçeneklerden harekette çözmesidir. Bu durumda, ölçülmek istenen zihinsel düzeye erişmemi ş öğ rencil erin bile soruyu doğru cevaplaması mümkündür. Bu durum, aynı zamanda, sorunun davra nışta planlanan düzeyde bir zihinsel etki nli ği ölçmedi ğ ind en , testin kapsam geçert iğ i d üşer. Sayısal sonuçların verildiği seçeneklerde, sonucun tamamı değil de virgülden sonraki ilk basamağı gibi belli bir kı sm ı verilerek maddenin doğru cevab ı gizlenebilir. Bu taktirde, o soruyla ölçülmesi planlanan zihinsel etki nli ğin ö lçülmesi sağl anabilir. Matematiksel işl em gerektiren sorularda doğ ru cevabın sonuç değil, bir eşitlik (bir işlem veya işlemler sonucu elde edilen, sadel eş ti rilmiş hali) olarak verilmesi de sorunun seçeneklerden faydalanarak çözümü sorununu giderebilir. Sonucu seçeneklerde gizlemenin bir yolu da sonucu aynen deği l , sonuç üzerinde bir işlem yaparak elde edilecek değeri vermektir: Sonucun toplamını seçeneklerde vermek gibi. Örneğin sonuç 63 ise seçeneklerde sonucu oluş turan rakamların toplamı (9) istenebilir.

altını çizmek kalın

yazmak,

italik yazmak, altı çizili ve kalın yazmak. altı

çizili ve italik yazmak,

kalın kalın,

ve italik yazmak, italik ve altı çizili yazmak,

BÜYÜK HARFLERLE YAZMAK.

Uygulama 3: Doğ ru cevab ı gizli olan madde forma tında, sayısal çözüm gerektiren bir çoktan seçmeli test maddesi yazınız ve maddenin doğ ru cevabını gizlemede izl ed iğ i niz yolu a çıklayı nı z . Doğru Cevabı

Gizli Test Maddesi:

Doğru Cevabı

Gizlemede izlenen Yol:

342

343

·-·> ·-

o.

Çokımı

Stymcli ve ~·lcştimıtli Tc.ı;1lcr

333

334

5) Ortak köklü maddeler formalı kullanılmalı

Ôğrdimdtı Ölr;ıııc 1·e Dq.".t!rltıulirmcı

Gerek okumada zaman kazanmak, gerekse al gılama kolaylı ğı sağla­ mak açısından, maddenin mümkün oldukça kısa olmasına dikkat edilmeli• dir. Test maddesinde kullanılan kelimeler öğrenci lere yabancı olmamalıdır. Önceden bahsedildiği gibi çoktan seçmeli bir test, dil bakımından grubun ortalama okuma yeteneğinin altında olmalıdır. Aşağıda iki tane çoktan seçmeli test maddesi tek sütun ve iki sütun formatında sunu l muştur. Her iki formaUa yazılm ı ş test maddelerini okuyunuz ve sizin için özellikle maddeyi a lgı lamakta veya di ğer hususlarda bir farklılık olup ol mad ı ğ ını s ını fla payl aş ını z.

Maddelerin ortak köklü olarak yazılması hem yazımda hem de öğrenci• ler için okumada ekonomiklik sağlar. Testteki okuma zama nını azaltması ve daha çok soru sorma olanağı da sağlayacağından testin kullan ışlılığı da artar.

Örnek: Ortak köklü çoktan seçmeli test maddeleri 1.- 4. soruları aşağıda verilen, 1O öğrencinin 5 tane çoktan seçmeli bir testten aldıkları puanlar ve madde güçlüklerine göre cevaplayı ­ nız .

Öğrencilerin aldıkları puanlar (X): 5, 4, 4, 5, 3, 4, 5, 5, 4, 1

Madde no: 1 Pj: 0.80

2 0.70

3 0.75

1. Sx=? i',) 1.18 8)1.40 C)3.74 0 )16

4 0.46

5 0.90

E)40

2. Birinci maddenin varyansı kaçtır? i',)0.16 8)0.20 C)0.40 0)0.80 E)0.84 3. Testin güvenirl iğin i hesap layınız. A) 0.24 8) 0.30 g 0.45 0)0.55 E) 0.70 4. Se =? A)0.53 8)0,65 C)0.79 QJ0.88 E) 1.04 Ortak köklü olarak sorulan sorularda bir madde köküyle ilgili birden çok soru sorulduğu için ortak kökle ilgili gereğind en çok soru sorma yoluna gi• dilmemelidir. 6)

Maddeler kolay uygun olmalı

algılanabi l ir

ve dil bakımından grubun düzeyine

Objektif testterle ilgili madde yazım ınd a uyulması gereken genel hususlarda beli rtildi ği gibi; madde, açık ve anlaşılır bir dille yazılmalıdır. Farklı alg ıl anabi lecek veya anl am ı ki şiden kişiye veya durumdan duruma farklı olabilecek aşağ ıdaki gibi kelimeler kullanılmamalıdır: "Çoğunlukla ",

"bazen"

344

345

·-·> ·-

o.

Çokımı

Stymcli ve ~·lcştimıtli Tc.ı;1lcr

335

A: Maddelerin Tek Sütun Olarak Düzenlenmesi 1.

7) Maddeler testin kapsam

maz. Mutlak suretle bilgi düzeyinden daha üst düzeyde zihinsel etkinlikleri gerektiren davranışların hem öğrencilere kazandınlması hem de testte yoklanması

Başta okunan kajjıtlara çok kıt puan verilmesine karşılık, sona kalan kajjıtlara gel i şi güzel bol puan veren bir öjjretmen ne tür bir hata yapmış olur?

8) Madde kökünde gereğinden fazla bilgi verilme!!!Jlli Çoktan seçmeli test maddelerinde. "madde kökü" maddenin mümkün olan en büyük kısm ın ı kapsamalı dır ve gereksiz açıklamalarla şişiril meme­ lidir. Çoktan seçmeli testterde testi okumaya harcanan süre genelde fazla olur. Bu nedenle testin mümkün oldukça az okuma gerektirmesine(kapsam geçerliğini bozmadan) özen gösterilmelidir. Bir test maddesinde gereksiz bilgiler sunulmama lı dır. Ayrıca , madde kökünde sorunun çözümü için gereğinden fazla bilgi verilmesi testin okuma yükünü arttırmanın yanı sıra öğrenci l erin kafasını da karışt ırır . Soruda verilenlerden bir k ısmını kullanarak soruyu doğru çözen biri, kulla nıl mayan bilgilerden dolayı çözümünde bir yanlışlık olduğ u inancın a sahip olabilir. Bu durum öğrencinin test süresine etkili bir şekilde ku llan masını da olumsuz etkileyebilir.

B: Maddelerin iki Sütun Olarak Düzenlenmesi Toplam puanı 40 olan bir yazılı yoklamada, sınav süresinin yetersizliğinden dolayı 4 puanlık bir soru sınıfın tümü tarafından mış.sa, larında

cevapsız

bırakıl­

bu öğrencilerin puanne tür bir hata olur?

A) Tesadüfi B) Sistematik C) Sistematik oranlı 0 ) Sabit oranlı E) Sabit

gerekmektedir. Bu sebeple, bir çoktan seçmeli testte genelde

hatırlama düzeyinin üstünde sorular olmalıd ır. Bununla birlikte , testi zorlaştırmak amacı yla çoktan seçmeli testlerde, önemsiz ayrıntıları sorarak testi n kapsam geçerliğini düşünn e yoluna gidilmemelidir.

A) Sabit B) Değişen oranlı C) Tesadüfi D) Sistematik E) Sabit oranlı

1.

geçerliğini arttıracak şekilde hazı rlanmalı

Yapılacak bir sınavın kapsam geçerliği yüksek olmalıdır. Bu nedenle, mutlaka sınav için uygun bir belirtke tablosu hazırlanmalı ve test maddeleri sınavın belirtke tablosuna uygun olacak şekilde hazırlanmalıdır. Hemen hemen hiçbir dersin hedef davranışları sadece bilgi düzeyi ile sınırlı ola-

Toplam puanı 40 olan bir yazılı yoklamada, s ı nav süresinin yetersizlijjinden dolayı 4 puanlık bir soru sınıfın tümü tarafından cevapsız bırakılmışsa, bu öğrencilerin puanlarında ne tür bir hata olur?

A) Tesadüfi B) Sistematik C) Sistematik oran lı D) Sabit oranlı E) Sabit 2.

ÖJjrtıimde Ölçme ,·e Def,'frltıulirme

336

2.

Başta

okunan kağıtlara çok puan verilmesine karşılık, sona kalan kağ ıtlara ge l işi güzel bol puan veren bir öğret­ men ne tür bir hata yapmış olur? kıt

9) Seçenek

yazımında

çok titiz

olunmalı

Çoktan seçmeli bir test maddesinin kalitesini etkileyen önemli noktalardan biri de seçeneklerin kalitesidir.

Tüm seçenekler madde kökü ile gramer açısından tutarlı olmalıdır. Seçenekler her şeyden önce, ifade tarzı, uzunluk ve kapsam bakımından benzer olmalıdır. Ölçmey1e ilgili bir sınavda, 4 seçenekten oluşan bir

A) Sabit B) Değişen oranlı C) Tesadüfi D) Sistematik E) Sabit oranlı

maddenin seçeneklerinin ikisi sınav türleri. ikisi ise ölçek türlerinden

olursa, o madde zaten çoktan seçmeli bir test maddesi olmaktan ziyade bir doğru-yanlış test maddesi gibi olur ve her durumda bu tür seçeneklere sahip maddelerin güveni rliği ve ayırt ediciliği düşük olur. Seçenekler anla şılırlığı bozmamak ka yd ı yla mümkün oldukça k ı sa yaSeçeneklerde aynı ifadelerin tekrarlı bir şekilde yazı l masından kaçınılmalıdır. Her seçenekte tekrar eden ifadeler madde köküne alınıp seçeneklerden ç ıkartılarak testin okuma yükü azalt ılmalıd ır. zıl malı .

346

347

·-·> ·-

o.

Çoktttn Stçmeli "e Eşltştirmtli Testler

ÖJjrttimde Ölçme ,·e Def,'frltıulirme

338

337

Çoktan seçmeli testlerde, doğru cevap seçeneklere sistemli bir şekilde dağıtılmamalıd ır.

Ornek: Madde kôkünde verilen 5

tanımın sırasıyla

hangi kavrama ait

olduğunun sorulduğu bir soruda seçenekler aşağıdaki gibi verilmiş ol-

Madde kökü negatif sorularda, seçeneklerde de negatif ifadeler kullan ıl mamalıdır. Çift olumsuz ifadelerde ol duğu gibi, öğrenci n in soruyu anlaması için çok çaba göstermesi gerekir. Seçenekler yazılırken hiçbiri ve hepsi seçeneklerinin kullanım ına dikkat edilmelidir. örneğin; "hiçbiri " seçeneği "negatif madde köklerinde". · en doğru cevabı seçtirirken" ve •sayısal sorularda" kullanılmamalıdır. özellikle, sayısal çözüm gerektiren maddelerde kullanırken çok dikkatli olunmalıdır veya hiç kullanılmamalıdır. Öğrenci soruyu yanlış çözmüşse, hemen "hiçbiri" seçeneğini işaretleyeb ili r ki sayısal çözüm gerektiren son.ı­ ı arda çok önemsiz de olsa bazı yanlışl ık lar yapmak mümkündür. "Hiçbiri" seçeneği olduğu için öğrenci çözümünü gözden geçirme ihtiyacı duymayabilir. ö te yandan, hiç çözümü bilmediği halde, ders hocasının seçenek yazımında sık sık hatalar yaptığı için ~hiçbiri" seçeneği ni kullandığını bilen öğrenciler "hiçbiri" seçeneğini işaretleyerek o maddeyi doğn.ı cevaplayabilirler. Tam tersi bir durum olarak, öğretmenin genelde seçenek yazı m ında hata yapmamasına rağmen yine de "hiçbiri'" seçeneğini bir nevi sigorta olarak kul landığını tahmin eden öğrenciler bu seçeneğ i eleyerek şans ba• şa rı sın ı arttırabili rter. "Hepsi" ve "hiçbiri· seçenekleri aynı madd7d7 _ kesin• likle birlikte kulla nılmamalıdır. Seçenek yazarken kullanıla n bırbırıne zıt şıklarda n biri her zaman doğ ru cevap olmama lıd ır. Yukandakilerden hepsi seçeneği kull anıldığında , seçeneklerden birinin yanl ı şlı ğ ı n ın belirlenmesi durumunda, hepsi seçeneğ i n in de doğru olamayacağ ı belirtenir ve elenir. Ayn ı zamanda iki seçeneğin doğru ol duğu­ nun belirlenmesi dun.ım unda ise, hepsi seçe neğ i otomatik olarak doğru olur. Genelde yukarıdaki l erin hepsi seçe neği nin doğru cevap olarak anahtarlanma ihtimali fazl adır ve teste alışık öğrenci ler bu dun.ım u bilirler. "Hepsi" seçeneğ i. diğer seçenekle r gerek ifade gerekse çeldiricilik bakı­ mından birbirlerine çok benzediği hallerde kullan ıl malıdır. "Hepsi" seçeneği bütün bir testte birkaç defa ve bazen doğ ru, bazen yanlış seçenek yerinde kulla nı l malıd ır. Bazı madde yazarların ın fa rk ı nda olmad ıkları bir dun.ım: "hepsi" veya "hiçbiri" seçeneklerini ya anahtarlanmış cevap ya da çeldirici olarak kullanma eğiliml erine sahip olma l arıdır.

sun: A)

Mod

Std. sapma

Medyan

Aritmetik oıt.

Z puanı

B)

Mod

Std. sapma

Ranj

Aritmetik ort.

Zpuanı

C)

Std. sapma Std. sapma

Ranj Ranj

Vaıyans

Z puanı

D)

Mod Medyan

Mod

Zpuanı

E)

Ranj

Std. sapma

Mod

Medyan

Zpuanı

Yukarıdaki seçeneklerde eğer B seçeneği doğru cevapsa ôğrenci konuyu hiç bilmeden "seçeneklerde en çok verilen kavramı belirleme• tekniğiyle sorunun doğru cevabını bulur. Bu durumda seçenekler ipucu veriyor demektir. ilk tanıma ait verilen 5 seçenekte en çok verilen kavram "Mod" seçenajidir. Konuyu bilmeyen öğrenciler ilk tanımın Mod olduğunu tahmin ederler. Birinci tanımı tutturmada izlenen yol üçüncü ve dördüncü tanım için de izlenir. ikinci ve beşinci tanım için zaten tüm seçeneklerde aynı kavram verilmiştir. O halde bu tanımların hangi kavrama ait oldu{ıu kesindir, tahmine bile gerek yok. Sorunun doğru cevabı da bu mantı{ıa uygun olarak belirlendi{ıinden, konuyu hiç bilmeyen bir ôğrenci doğru cevabın B seçeneği olduğunu tutturur.

Bu şekilde yazdığınız tüm sorularda aynı mantıkla doğru cevaplar tutturuluyorsa, seçenek yazım tekniğinizi düzeltme ihtiyacın ız var demektir.

Sorunun cevab ını bilmeyen öğrenciler seçeneklerden hareketle doğru cevabı bulamamalı. Aksi durumda, seçenekler doğru cevaba ipucu veriyor demektir. Bazen seçeneklerden hareketle konuyu hiç bilmeyen öğrenciler doğru cevabı bulabilir.

348

349

·-·> ·-

o.

Çoktttn Stçmeli "e Eşltştirmtli Testler

ÖJjrttimde Ölçme ,·e Def,'frltıulirme

340

339

11) Puanlamada şans Özetle, seçenek yazımında aşağıdaki hususlara d ikkat edil melidir: ✓

Seçenekler madde kökü ile gramer aç ı sından tu ta rlı



Seçenekler ifade tarz ı , uzunluk ve kapsam bak ı mınd an benzer olmalı ve seçeneklerde aynı ifadelerin tekrarlı bir şekilde yazıl ­

(a) " 0-1" puanlama yöntemi:



Doğru



Madde kökü negatif sorularda, seçeneklerde de negatif ifadeler ku llanıl mamalı



Hiçbiri seçeneği "negatif madde köklerinde", "en seçtirirken· ve ·say ısal sorularda" kullan ılmamalı aynı

(b) Ağırlıklı puan lama yöntemi : Hem maddedeki seçeneklerin. hem de maddelerin pua n ların ın farklı olmas ı , yani ağırlıkland ırı l ması mümkündür(Tan, 1998). Puanlamada; Doğ ru -yanlı ş ve çoktan seçmeli testler için (tüm maddelerdeki seçenek sayısı aynı ise) ölçümlerin şans başarısından arıtılması aşağ ıdaki eşitl ikten faydalanarak sağlanabil ir.

maddede kesinlikle birlikte

ku llan ıl mama lı

Birbirine zıt şıklardan biri her zaman doğ ru cevap olmamalı



"Hepsi" seçen eği bütün bir testte birkaç defa ve bazen doğru cevap, bazen çeldirici olarak kullanılma lı



Sorunun cevabını bilmeyen öğrenciler seçeneklerden hare• ketle doğru cevabı bulamamalı

cevaplanan maddelere ·1 puan· verilmesiyle testi oluşturan

·o puan·

maddelerin puanla n masıdır.

doğru cevab ı



D oğru

doğru cevaplanmayan maddelere

cevap seçeneklere sistemli bir şekilde dağ ı tı l mamalı

"Hepsi" ve "hiçbiri·" seçenekleri

giderme için düzeltme formülü kulla-

Çoktan seçmeli testlerde, her madde diğer maddelerden bağımsız olarak puanlanabilmelidir. Özellikle, ortak köklü sorularda, bir maddede elde edilen sonuç diğer maddenin çözümünde kullanı lacak şekilde sorular soru lmamalıdır. Çoktan seçmeli testleri puanlamada çok genel olarak kullanıl an iki puanlama yöntemi vardır.

ol malı

masınd an kaçınılma lıdır.



başarısı

nılma lı

y X= D - - -

a-1

D : Testteki doğru cevap sayısı Y : Testteki yanlış cevap sayısı a: Testi

olu ş turan

maddelerin seçenek

sayı sı

Çoktan seçmeli testlerde,

1 O) Çeldiriciler profesyonelce yaz ı lmalı Çeldiriciler konuyu iyi bilmeyen öğrencilerin yapabilecekleri hatalardan faydalanarak hazırlanmalı dır. Çoktan seçmeli testlerde çeldiriciler amatörce yazılmamalıd ır. Çeldiriciler soruda sorulanı bilmeyen öğrencilere ipucu vermemeli ve konu hakkında bilgisi olan d eğil bilgisiz öğrencileri ya• nıltmal ıdır. Sayısal seçenekler sıralı bir şekilde, artarak veya azalarak verilmelidir. Sayısal çözüm gerektiren sorularda her bir çeldirici yapılabilecek bir ya nlış çözümün sonucu olmalıdır. Çeldiriciler madde kökünde sorulan konuyla alakasız olmamalıdır. Çeldiricilerin doğru cevaba yakınlığ ı artlıkça madde daha zor bir madde olacağı gibi maddenin bilenle bilmeyeni ayırma gücü de artar. Tabii ki bir madde aş ırı derecede zor olursa, ayırıcılık gücü yine düşük olur.

a = 3 ise;

X = D-!

a = 4 ise;

X = D-!

a =5 ise;

X = D _.2'..., olur. a-ı

2

'

Örneğin: seçenek sayısı 5 olan ve 40 tane çoktan seçmeli maddeden oluşa n

bir testte: 20

doğ ru

ve 12

yan l ı şı

otan bir

öğren ci nin, şans başarı sı

g ideri lmiş puan ı aşağı da h esapl anm ı ştır:

X = D- -

y

O• l

350

12

= 20 - S- • l = 17 puan

351

> ··-

o.

Çoktttn Stçmeli "e Eşltştirmtli Testler

342

341

ÖJjrttimde Ölçme ,·e Def,'frltıulirme

sıdır. Yazılan bir çoktan seçmeli test maddesi mutlaka gözden geçirilmelidir. Testi alan grup için kullanılan kelimeler ve gramer basit olmalıdır. Her soruda tek bir seçeneğin doğru olduğundan emin olunmalıdır.

Çoktan seçmeli testler için test maddelerinin seçenek sayıları farklı olduğunda ölçümlerin şans başarısından arıtılmasında: ✓ Her doğru cevaplanmış maddeye 1 puan ve 1 ✓ Her yanlış cevaplanmış maddeye - -a -- t puan (negatif puan) verilir. Örneğin 5 seçenekli bir madde yanlış cevaplandıysa bu maddeden öğrenciye -~ = -. 25 puan verilir. Öğrencinin test puanın belirlerken testteki tüm maddelerden aldığ ı puanlar toplanır.

Yaz ılı yoklama. kısa cevaplı testler. 0 -Y ve çoktan seçmeli tesUer öğ­ rencilerin akademik başarılarını ölçmede kullanılabilir. S ınav türlerinden hangisi kullanılacaksa kullanılsın, zayıf bir şekilde hazırlanmışsa öğ­ renme -öğretme sürecini yanlış yönlendirebilir. Asıl sorun kullanılan sınav türünü uygun bir şeki lde hazırlamaktır. Bunun için de öğretmen l erin öncelikle s ınav yapma işini ciddiye almaları gerekmektedir. S ın avların gerek hazırla nması ve uygulanması . gerekse puanlanmas ında. öğretmenin tutumu , yaptığı işe önem verip vennemesi. sınavın güven i rliğ i ni ve geçerliğini önemli ölçüde etkilemektedir. Testin g üvenirliğinin yüksek olması açısından, maddelerin ipucu vermemeşi , öğrencilere sınav davranışlarıyla ve s ın avın puanla nmasıyl a ilgili gerekli açıklamaların yapıl ması gibi hususlara da dikkat etmek gerekir.

Eğer yeterlik sınavı yapıyorsak. yeterlik için kriter puanı biraz yüksek tulup (şans başarıs ı için uygun bir düzeyde) düzeltme fonnülünü kullanmama yoluna gidilebilir. Ama seçme veya sıralama amaçlı bir sınav yapı­ yorsak düzeltme formülünün kullanımı daha güvenilir ve geçerli ölçümler verir. Tan"ın (2004b) belirttiği gibi "Çoktan seçmeli testlerde şans başarı­ sını giderici herhangi bir tedbir alınmadığı durumda, söz konusu, öğrenci puanlarındaki şans puanı; her öğrencide aynı miktarda olmamaktadır. Sı­ navla ölçülmek istenen konuyla ilgili gerçek başarı düzeyleri az olan öğ• renciler gerçek başarı düzeyleri çok olan öğrencil ere k ı yasl a daha razıa şans puanına sahip ol maktadırlar." Bu nedenle. seçme veya s ıralama amaçlı testlerin puanlanmasında şans başarısı için bir düzeltme yapıl­ mazsa. ölçümlerin güvenirliği ve geçerliği azalır.

Aşağıdaki tabloda çoktan seçmeli test maddesi yazımı için sunulan öneriler özetlenerek sunulmuştur.

12. Oi~er Hususlar Çoktan seçmeli bir testte so ruların testteki dağılı m ı konu bazında ve genelde kolaydan zora doğru olması önerilir. Bazen soruların konu bazında olması konuların sıralarını bilen öğrenciler için doğru cevap hakk ında bir ipucu verebilir. Mesela önce güvenirlik. sonra geçerlik konusu işlenmiş ve sorular bu konu sırasında verilmişse. öğrenci sorunun doğru cevabı olarak güvenirlik ve geçerlik seçeneklerinden birini düşünüyorsa . konu sırası doğru cevabı bulmasını sağlar . Testte soru ların konu bazın ­ daki sırasını belirlemede konuların kitaptaki sıralarının izlenmesi gerekmiyor. Bazı ilişkili üniteleri birleştirip bir konu olarak da ele alabiliriz. Mesela, sınav türleriyle ilgili üniteler tek bir konu olarak ele alınabili r, benzer şekilde güvenirlik ve geçerlik ünitelerini de tek bir konu olarak ele alabiliriz. Ayrıca, testteki ilk sorunun çok zor olması durumunda, bazı öğren­ ciler soruyu çözemediklerinde, akıllarının o soruyla meşgul olması ve bu nedenle diğer sorulara yeterince odaklanamamas ı gibi bir sorun olu şabilir. ilk sorunun kolay olması genelde, öğrencinin moralinin yükselmesine fayda sağlar. Çoktan seçmeli test maddesi yazmanın çok dikkatli ve titiz olmayı gerektirdiği unutulmamalıdır. Çünkü çoktan seçmeli testlerin beklide en

önemli dezavantajı: iyi bir çoktan seçmeli test sorusu yazmanın zor olma-

352

353

·-·> ·-

o.

Çoktttn Stçmeli "e Eşltştirmtli Testler

343

344

Eşleştirmeli

Tablo 10-1: Çoktan Seçmeli Test Maddesi Yazımı için öneriler

2) Genelde doğru cevabı en doğru olan madde formatını kullanın ız 3) Doğru cevap, görünce tanıma becerisiyle veya seçeneklerden faydalanarak bulunabiliyorsa doğru cevabı gizli olan madde formatı kullanı nız

k ısma yaz ılır.

Omek: Eşleştirmeli test formalı:

4) Olumsuz özelliklerle ilgili çeldirici bulmakta zorfanıldı ğında, madde kökünü olumsuz cümle formatına dönüştürünüz ve ifadedeki olumsuzluk için vurgu kullan ın ız azaltıc ı

Açıklamalar: Sol kolondaki (A kolonu) satırlarda, bazı tarihi olaylar, sağdaki kolonlardaki (B kolonu) satırlarda ise bazı yıllar verilmiştir. A kolo nundaki sorunun (olayın) önündeki paranteze, B kolonunda o olayın ta• rihini veren seçeneğe ait harfi yazınız.

tedbirler alı nız. Or-

A Ko l on u (1) 1. Kadınlara milletvekili seçme A. ve seçilme hakk ının verilmesi B.

6) Maddelerin, testi alan grup için dil bakım ı ndan kolayca anl aşılab ili r nitelikte ol masını sağlayınız. Her maddeyi mutlaka gramer ve yazı m hafal arın ı görme amacıyla yazdıktan daha sonraki bir zamanda okuyunuz.

7) Testin kapsam geçer1iğinin yüksek olmasına özen gösteriniz

(0) 2. Miladi takvimin kabulü

8) Madde kökünde gereğinden fazla bilgi vermeyiniz 9) Seçenekler ifade tarz ı. uzunluk ve kapsam bakı mında n benzer olmalı , "Hepsi" ve •Hiçbiri' seçeneklerini kullanmayınız 1O) Çeldiricileri konuyu iyi bilmeyen dan faydalanarak hazı rlayını z 11) Puanlamada

şans başarısını

öğrencileri n

Testler

Eş leştirmeli testler, çoktan seçmeli testlerin bir çeşididir. Eşleştirmeli testlerde birden çok madde kökü, bazı seçeneklerle eşleştirili r. Diğer bir ifadeyle, eşleştirmeli testlerde, iki kolonda verilen kelimeler. numaralar. semboller ve/ya cümleler eşl eşti rilir. Genelde, madde kökü için hangi seçenek doğru ise bu seçeneğin önündeki harf madde numarasını belirten

1) Sorular sadece bilgi düzeyinde kalmamalı, bilgi düzeyinin üzerinde sorular da sorunuz

5) Testin içeriğini bozmadan okuma yükünü tak köklü madde formatları nı kullanmak g ibi

ÖJjrttimde Ölçme ,·e Def,'frltıulirme

1 Kasım 1922 3 Mart 1924

C.

30 Kas ı m 1925

o.

26 Aralık 1925

E. 17 Şubat 1926

(A) 4. Saltanatın kal dırılmas ı

F.

1 Temmuz 1926

G.

1

(B) 6 . Tevhid-i tedrisad kanunu

giderme için düzeltme formülünü kulla-

Ko lo nu

(E) 3. Medeni kanun

(H) 5. Soyadı kanununu

yapabilecekleri hatalar-

B

Kasım

1928

H , 21 Haziran 1934

1. 5 Aralık 1934

nınız

12) Yazdığınız test maddelerini mutlaka (iyileştirme amacıyla) kontrol edi-

Örnekte görüldüğü gibi, seçenek sayısı soru sayısından fazladır. Bu bilen öğrencilerin son soruları sadece şansl a doğru cevaplama olasılıkları azalmış olur. Örnekte gözden kaçmaması gereken önemli bir nokta da, A kolonundaki soruların hepsinin aynı içerikte olması, yani homojen yapıda olmasıdır. Bu şans başa rısını azaltan bir durumdur.

nız

şekilde , soruların çoğunu

Sorulan altı sorudan ikisi tarih, ikisi başkent adı, son ikisi de yazar adı olsun. Sunulan 9 seçenekten üÇü tarih, üçü başkent ve diğer üçü de yazar adı olsun. Bu durumda, maddelerin doğru cevabını şansla bulma ihtimali ne olur?

354

355

·-·> ·-

o.

Çoktttn Stçmeli "e Eşltştirmtli Testler

Eşleşti rmeli testı erte. i lişkil i olaylarla ilgili olarak kısa

ÖJjrttimde Ölçme ,·e Def,'frltıulirme

346

345

bir sürede çok sayıda

davranışı ölçmek mümkündür. İlişkili olay1ar takımlarını ölçmeye yönelik davranışları ölçmede, soru hazırtamak hem pratik hem de kol aydır, Yine de, kaliteli bir eşleşti rmeli madde seti hazı rl amak biraz teknik bUgi ve beceri gerektirir. Eşleşti rmel i testlerin hazı rla nmas ında önemli bir nokta da; sorulan bir sorunun doğru cevabın ın d tğer sorular için uygun bir çeldirici olm as ı zorunluluğudur. Aksi takdirde, sorulara cevap olabilecek seçenek sayı sı azalır veya şansla doğru cevabı bulma ol asılı ğı artar. Eşleş ti rmeli testler genelde bilgi düzeyindeki davra nışları n veya çok alt düzeydeki zihinsel davran ı şların ölçülmesinde kul lanılır. Eşleştirmel i bir soru setinin homojen yapıd a olması gereği , bazen ölçülmesi tasar1anmayan önemsiz ayrıntıları n da teste dahil edilmesi sorununu yaratabilir. Mesela, s ı navda 3 tane tarihle ilgili davranışın ölçülmesi planlanmakla iken, homojen bir soru seli için 3 sayıs ı nın yetersiz ol ması , daha önemsiz veya aslı nd a ölçülmesi amaçlanmayan başka tarih sorul arın ın da teste al ınmasına sebep olabilir. Bu sebeple, aslında eşl eşti rmeli test yerine, objektif testleri içeren bir karma test ol uştu rup , bu testin içinde eşleştirmeli sorul arı kullanmak daha kullan ı şlı olur. Kı sacası , eşleştirmel i tip sorul arı tek başı na bir test olarak k ullanmayıp , karma bir testin, bir alt kısmı olarak kulla nım ı daha uygun olur. Eşleşti rmeli maddeleri kullanmaktansa, çoktan seçmeli maddeleri kullanmak birçok durumda daha güvenilir ölçümler elde edilmesini sağlar.

A kolonunda

B Kolonunda

Tarihi olaylar...... ..

Tarihler Kavramlar

Tanımlar

..............

Kitap isimleri ....... ..

Yazarlar

Yaba ncı

Tüı1 ·-

o.

Çoktttn Stçmeli "e Eşltştirmtli Testler

ÖJjrttimde Ölçme ,·e Def,'frltıulirme

348

347

ÖZET

SINIF İÇİ UYGULAMA

Çoktan seçmeli testler; sorulan bir sorunun doğru cevabını, verilen seçeneklerden bulduran bir sın av türüdür. Çoktan seçmeli testlerde, öğren­ cinin vereceği cevap sunulan seçeneklere bağlıd ır. Çoktan seçmeli te.stle~e. kısa cevaplı, doğru-yanlış, eşleştirmeli testlerle ölçülebilen tüm davranışları ölçmek mümkündür. Çoktan seçmeli testler bilgi, kavrama ve uygulama düzeyindeki davran ışların ölçümünde kullanı labilir bir sınav türü olmakla bi~ikte, cevaplayıcının yaratıcılı ğını ölçmede kullanımı uygun değildir. Yine çoktan seçmeli testler, öğrencilerin düşüncelerini ortaya koyma yeteneklerini veya sentez ve değerfend irme düzeyindeki davranışları ölymede uygun bir sınav türü değildir. Tabii ki, öğrencilerin akademik başarı­ larını ölçmede yoklanan davranışlar çoğunlukla {bazı derslerde tamamen) bilgi ve kavrama düzeyinde olduğundan, öğrencilerin derslerdeki başarıla­ rını ölçmede kullanımı için oldukça uygun bir sınav türüdür. Çoktan seçmeli testlerde; sorunun doğru cevabı kendi içinde verilmiştir, test süresinin çoğu maddeleri okumaya ve doğru cevabı bulmaya harcanır, şans başa­ rıs ı vardır. Ayrıca, madde istatistikleri hesapla nm ı ş bir soru bankası ol uş­ turulabilir, yazımı uzmanlık ve tecrübe gerektirir, hazırlanması çok, puanl anması az zaman alır.

Al anınızla ilgili olarak mezun öğrencil erin m esleki yeterlik düzeylerini belirleme amacıyla (lng ilizce Yeterlik Sınavı gibi) çoktan seçmeli test maddesi yazacak alan uzmanlarının faydalan ması amacıyla çoktan seçmeli test maddesi yazım k ılavuzunun hazırlanması için aşağıdaki 3 görevi tamamlayınız :

1) Çoktan seçmeli test maddesi yazım ında uyulması gereken 3 kural yazın ız 2) Yazdı ğınız her kural için örnek olması amacıyla bu kurala uymayan bir çoktan seçmeli test maddesi yazınız 3) Bir önceki aşamada kurala uymayacak şekil de yazdığınız 3 test maddesini kurala uyacak şekil de düzelterek yeniden yazını z .

Eşl eştirmeli testler çoktan seçmeli testlerin bir versiyonudur. Eşl eşti r­ meli testlerde iki kolonda verilen kelimeler, numaralar, semboller ve/ya cümleler eşleştiril ir. Genelde, madde kökü için hangi seçenek doğru ise bu seçeneğin önündeki harf madde numarasını belirten kısma yazılır. Eşleş­ tirmeli maddeleri kullanmaktansa, çoktan seçmeli maddeleri kullanmak, birçok durumda daha güvenilir ölçümler elde edilmesini sağ l ar.

ÜNİTE SORULAR! 1. Çoktan seçmeli testlerin hangi düzeyde zihinsel etkinlikleri ölçmede kullanımı önerilir? 2. Örnek bir çoktan seçmeli test maddesi yazarak, üzerinde; madde kökünü. cevap ş ıkl arın ı , anahtarlanmış cevabı ve çeldiricileri gösteriniz. 3. Çoktan seçmeli testlerin temel özellikleri nelerdir? 4. Amatör bir çoktan seçmeli test maddesi yazarına neler önerirsiniz? 5. Eşleştirilm iş testlerin temel özellikleri nelerdir? 6. Eşleştirilm iş testleri ilk kez kullanacak olan bir öğretmene neler önerirsiniz?

358

359

·-·> ·-

o.

3S0

Öğrttimdc Ölçme ,-e Değe:rleı,dinııt

ALTERNATİF DEĞERLENDİRME

_ _ _ _ _ _ _ _ _ ____,/üNiTE 13

Çoktan seçmeli ve doğru yanlış gibi geleneksel test yöntemlerinin öğ­ renci başarısını değerfendirmede yeterfi ol madığ ı gerekçesiyle alternatif ölçme ve değerlendirme yöntemleri geli ştiri lmiştir . Alternatif değerl endi rme yöntemleri geliştirmede temel amaç. sadece kağıt kalem testlerine özellikle objektif testlere daya lı olarak yapı l an değerlendirmel ere atternatif olarak farklı değerlendirme türterini üretmektir. Alternatif ölçme ve değerlen­ dirme yöntemleri öğrencinin performansının değertendiril mesi ni farklı yeterlik ve öğrenmelere dayalı olarak yapı l masını amaçl amakta dır. Alternatif ölçme ve değerlendirme yöntemlerini geliştirenler, öğrencilerin sınav­ larda sorulan teorik temelli sorulara yönelik performansından çok , gerçek hayat koşullarındaki performanslarının önemli olduğunu savunmaktadırlar, Bu nedenle, alternatif ölçme ve değertendirmede öğ renci davranışı dolaysız bir şekilde gözlenebilmelidir. Alternatif değerfend irmede daha ziyade öğrencinin performa nsın ı somut hale getirme önem kazanmaktadır . Anlaşılacağı üzere, alternatif değerlendirme , öğrencinin bir şeyler yapması , göstermesi, oluştunnası, üretmesi gibi çalışmalarfa ilgilenir.

ALTERNATiF DEĞERLENDİRME ALTERNATIF DEĞERLENDiRME Altematif Ölçme ve Değerlendirme Öğrenci Gelişim Dosyası(portfolio) Değertendirmesi Diğer Alternatif Değertendirme Yöntem ve Teknikleri

öz değerlendirme Akran değerl endirme Anket Görüşme

Gözlem ÖZET ÜNiTE SORULAR! SINIF-İÇİ UYGULAMA

Alternatif değerlendirme öğrencinin ne bildiğinden ziyade ne yapaile ilgilenir. Bu nedenle bazı yazarlar alternatif değerlendirme ile performans değerlendirmeyi aynı anlamda kullanırlar. Performans değer­ lendirmede, öğrenci pe ıforma nsının somut bir şekilde ortaya konulması için öğrenciye uygulama olanağ ı sağlama ve öğrencinin öğrend iği bUgileri kullanarak kritik düşünme becerisini ölçmeyi amaçlar. Öğretmenin öğren­ cinin sınıf performansına yönelik doğal gözlemleri, öğrencilerin belli bir konuda yaptıkları çalışmaları sınıfta sunmaları ve proje çalışmaları. öğrenci­ lerin yazılı ve sözlü olarak kendilerini ifade edebilmeleri ve belki de en yaygın olarak bilineni öğrenci gelişim dosyası (portfolio) olu şturulması alternatif ölçme ve değerlendirme etkinliklerine örnek olarak verilebilir. Öğrenci geli şim dosyası (portfolio) öğrenci çalışmalarını ve öğrenci gelişi mine yönelik olarak düzenlenen, öğrencilerin çalışmalarından elde edilen ürünler ve ödevleri içerir. Anlaşılacağı üzere, alternatif ölçme ve değerfend irmeni n hangi tür ölçme ve değerlendirme etkinliklerine alternatif olduğu açıktır . Alternat~ ölçme ve değertendirme öğrenci performansını dolaylı olarak gözlemleyen ölçme yöntemlerine dayalı değertendirme yöntemlerine alternatif olarak geli ştirilmiştir. Yani öğrenci davranışlarının daha dolaysız ölçülmesi alternatif değertendirmenin ana amaçlarındandır. Çoklan seçmeli testler, doğru yanlış testleri gibi testlere dayalı ölçme ve değerlend irmelere alternatif olarak geliştirilen ve öğrenci performansının direkt olarak gözlenmesine dayalı ölçme ve değerlendirmeni n söz konusu olduğu bir yöntemdir. Alternatif ölçme ve değertendirmede öğrenciye bir bilgiyi sormaktan ziyade öğ­ rencinin o bilgiyi kulla n mas ına yönelik uygulama yapmas ı söz konusudur. bileceği

360

361

·-·> ·-

o.

AJıerııaJif De{.-erleıulirmc

35 l

Worthen, White, Fan, & Sudweeks (1999:281) farklı yazarla rın alter-

Alternatif veya Performans kinlikler

natif değerlendirme yaklaşımları nı incel emiş ve alternatif değerlendirm e

yöntemlerinin paylaştığı 3 ana no kta yı aşağıdaki gibi tanı mlamışlardır: 1) Alternatif değe rten d irme yöntemlerinin hepsi cevabı seçme gerektiren geleneksel (çoktan seçmeli ve doğ ru yanlış) başarı testlerine alternalif olarak gösterilmektedir.

s ınanmasını

yönelik olarak

yaptırmak.

ifade etmektedir.

değerl endi rme

Örnek 2: Öğrencilere sınav hazırlama, uygulama ve analizi ile ilgili bazı sorular sonrıak yerine öğren cilere sınav hazırlatıp. uygulatıp analiz ettirmek.

kullan ılan içe ri ğin farklı

için Yapılabilecek Et-

Örnek 1: Öğrencilere günlük plan yapılmasıyla ilgili olarak çoktan seçmeli veya d oğ ru yanlış testi uygulamak yerine öğ re n cile re günlük plan

yöntemlerinin tümü bilgiyi öğ renil en ve b ir fonksiyonu varsayan öğ ren me ve yeterliklerin görünümlerine d ayan ır.

3) Alternatif

Değerlendirmesi

Aşağıda performans değerlendirmesinin yapılmas ına Eğitim Bilimleriyle ilgili bazı örnekler verilmiştir.

2) Alternatif değe rtend irme yöntemlerinin hepsi okul d ı ş ı ndaki yaşaml a uygun olan önemli i ş lerde ki öğ renci performan s ının direkt olarak

Öğrttimdc Ölçme ,-e Değe:rleı,dinııt

352

Bu ta n ı m lamal a rdan da net olarak görüleceğ i gibi öğ re n ci performa ns ının daha somut olarak ve daha fazla gerçek hayattaki koşullara benzer veya tamamen gerçek hayat koşulları n da değe rlen d iril mesi önem kazanmaktadır. Yani bilginin gerçek hayat koşull arı n da kulla nı lmas ını veya yorumlanması nı içeren yöntemlere altematif değerl endi rme ağırlık vermektedir.

Örnek 3: Öğrencilere kavram haritasının oluşturulmasına yönelik soruöğ rencil ere kavram haritasını yaptırtmak .

far sormak yerine

Örnek 4: Türkçe dersinde, öğrencilere anadil bilincini kazandırmak için

Bazı

yazarlar alternatif değerlendirmeyle performans değerlendirmeyi anlamda kulla n ırl ar. Worthen, White, Fan, & Sudweeks'in (1999:282) belirttiği gibi Khattri & Sweet (1996:3) performans değerlendirmeyi şöyle ayn ı

bir ay boyunca çevrelerinde karşıla ştıkları ya nlış kullanılan Türkçe kelimelerdeki ya zım yanlışlıkları nı ve bu yanlış yazımların sebeplerini araş-

ta nımlar: Performans değerl endirme öğrenc i nin fiili olarak bir şeyi icra etmesini, göstermesini, bir ürünü oluşturma veya geliştirmesini ,

tırıp bir rapor hazırtatmak. Öğrencilerin hazırladıkları bu raporları sınıfta sunup tartışmal arını istemek.

belirl enmiş koşullar

ve standart.lar

altında

bir çözümü

o l uşturmasını

gerektirir. Yukarı d aki örneklerden de anlaşıl acağı gibi performans değerle n­ dirme için öğ retmenl er, öğre ncile re performansl arı nı somut olarak sergileyebilecekleri etkinlikler hazırla ya b il melidir. Worthen, W hite, Fan, & Sudweeks (1999:297) öğrenci performansını direkt olarak gözlemeye yönelik olarak uygulama l arı yapabilmek için bir öğretmenin aşağı d aki üç aşa ­

Worthen, White, Fan, & Sudweeks'in (1999:283) bel irttiğ i gibi Khattri & Sweet,(1996:5) performans değerlendirmenin 5 farklı türünü tan ımla­ m ış lardır . Bu ta nım lamal arı aşağ ıd aki gibidir: 1 ) Portfolyolar 2) Talep edilen görevler veya ka rş ıl aştırmal ar 3) Projeler 4) Gösteriler 5) Öğretmen gözlemleri

ma yı pl a nlaması gerektiğ i ni bel i rtmişti r:

1. Aşama : 2. Aşama:

D eğerl e ndi rmek Performansı

istenen performa ns ı tanı mla ma . göstermeye uygun i ş l eri veya alı ştırmaları

olu ş turma .

3. Aşama : Performans puanlama kriterlerini belirleme D eğerle ndi ril mek

leminin ilk

362

aşama s ı

istenen performans ı n tanı ml a nmas ı aynen ölçme i ş ­ olan niteliklerin belirlenmesi işid i r. Burada ölçme ya-

363

·-·> ·-

o.

AJıerııaJif De{.-erleıulirmc

353

Öğrttimdc Ölçme ,-e Değe:rleı,dinııt

354

Öğrenci Gelişim Dosyasının (Portfolyonun) içeriği

pabilmek için belirlenen nitelikler daha ziyade öğrencinin uygulama ve icrasına yönelik nitelikler ya da davranı şlardır. Bu aşamada öğretmenin öğ­ rencinin ne tür becerileri göstermesi gerektiğini net bir şekilde ortaya koyması gerekir (dakikada 30 kelimeyi hatas ız bir şekil de yazabilmek gibi). Öğrencinin performansını göstermesine uygun işler ve alıştırmaların oluş­ turulması aşamasın da, öğrenciye yaptırılacak becerinin önceki aşamada belirlenen nitelikleri içermesine dikkat edilmelidir. öğrenci peı1orrnansını puanlama için puanlama ölçütlerinin belirlenme.si gerekir. Puanlama ölçütlerinin belirlenmesinde hangi kalitedeki performansa hangi puanın verileceğinin detaylı olarak belirten rubriklerin yani bir tür derecelemeli puanlama anahtarının hazırlanması çok etkili olur. Rubrik h azırl ama dışında, öğrencinin icra edec.eği becerinin her bir aşaması Mçok kötü. kötü , orta, iyi ve çok iyi" gibi Likert tipi bir dereceleme ölçeğiyle de puanlanabilir.

Öğrencinin öğrenme düzeyini ve gelişimini içeren her şey öğrenci gel işim dosyasında yer alabilir. Dosyaya hangi çalışmaların seçileceğin e yö-

nelik ölçütler açık ve net olarak ortaya konmalıdır. öğrenci gelişim dosyasında öğren cinin öğrenme düzeyi ve gelişimiyle ilgili mümkün oldukça farklı türden belgelerin ol ması arzulanır. Worthen, White, Fan, & Sudweeks (1999:303), öğrenci gel işim dosyasında aşağıdaki ell ·-

o.

AJıerııaJif De{.-erleıulirmc

Öğrttimdc Ölçme ,-e Değe:rleı,dinııt

356

355

Öğrenci Gelişim Dosyalarına (Portfolyo) Ulaşım

Öğrenci Gelişim Dosyalarına Dayalı Değerlendirmenin Sınırlıkları

Öğrenci gelişim dosyalarına öğretmen. ilgili öğrenci, öğrencinin ailesi ve yöneticiler ulaşıp inceleme şansına sahip olmalıdırlar. Öğrenci gelişim dosyalarının hem öğretmenin hem de öğrencinin kolayca ulaşabil mesini sağlama açıs ınd an sını fın içerisinde bir yerde sa klan ma sı önerilir. W ort-

1) Öğrenci gelişim dosyalarının düzenlenmesinde dosyaya konulan çalışmaların belirlenmesinde öğrenciye göre farklılıkların olabilmesi bir dezavantaj olabilir. Sınıf için eşit olmayan, tutarsı z ve güvenirliği düşük kayıtlar söz konusu olabilir.

hen, Whae, Fan, & Sudweeks (1999)'da belirtild iği gibi öğre tmen ve öğ­ 2) Öğrenci gelişim dosyalarının puanlanma ve değertendirilmesinde

renci bu dosyala rı birlikte inceleyerek bir sonraki öğrenme etkinliklerine

birtikte karar vermelidirter. Öğrenci gelişim dosyaları elektronik ortamda da saklanabilir.

sübjektiflik söz konusu olabilir. 3) Öğretmenler için ekstra zaman harcamayı g erektirir.

Öğrenci Gelişim Dosyalarına Dayalı Değerlendirmenin Avantajları

4) Öğrenci çalışmalarının uygun bir şekilde örneklenememesi yanlış kararlara sebep olabilir.

1) Öğretmen (bireysel olarak) öğrencinin öğrenme ihtiyaçlarını daha sağlıklı bir şekilde belirler. Öğrencinin gelişimi hakkında çok geniş ve detaylı bir değertendirme olanağ ı sunulur. Dolayısı yla programın öğrenci ihtiyac ına dönük olması avantajı sağlanır.

Derecelemeli Puanlama Anahtarı (Rubric) Kullanımı Öğrencinin yaptığı çalışmaların nasıl puanlanacağının belirlenmesi, öğrenciden nelerin beklendiğini somut bir şek.i lde ortaya koyar. Öğrenciye verilen bir etkinlik veya ödevin puanlanmasının nası l yapılacağının ödevle birlikte öğrenciye bildirilmesi öğrenci için oldukça faydalı bir

2) Öğrenci gelişim dosyaları aile ve yöneticileri öğrencinin gelişimiyle ilgili olarak bilgilendirmede önemli bir kaynak olur. 3) Öğrenci gelişim dosyası hem öğretim sürecinin hem de öğretim ç ıktıl arı nın sürekli olarak d eğerlendiril mesini içerir. Bu nedenle, öğretimle değerlendirmenin

iç içe

uygulamadır. Bu durumda öğ renci kendisinden ne tür bir beceri veya beceriler bekl endi ğini, hangi tür ve kalitede bir i ş o rtaya koyd uğun da kaç puan alabileceğini anlayabilmektedir. Bu d urum öğ re n ci ni n çalışmasın ı kendinden beklenen düzeyde yapması açı sından ö nemli faydalar sağlar.

ol mas ı ava ntaj ı sağ la nır.

4) Öğrenciye öğrenmesinde önemli bir sorumluluk alma imkanı sağl ar. Bu amacın gerçekleşmesi için öğ renci gelişi m dosyası hakk ında her öğrenci ile bir dönemde en az 4-5 kez görüşmek gerekir. Öğrencinin öğrenme işinde sorumluluk alması ve yetkilendirilmesi öğren ci g üdülenmesini ve başarısını arttırır.

Diğer

Alternatif Değerl end i rme Yöntem ve Teknikleri

Ülkemizde alternatif değerlendirmeye olan ilgi her geçen gün artmakBu ölçme a raçl arı nın kullanımı öğ re tmen lerin öz d eğerl e n dirme, akran değerten dirme, tutum ölçme, anket, gözlem, görüşme gibi yöntem ve teknikler hakkında bilgi sahibi olmala.rını gerekli k ılmaktadır. Tutum öl çeği, gözlem. görüşme , anket formu gibi ölçme araçl arı nın h azırl a n mas ı ve yorumlanması uzmanl ık gerektirir. Öğretmenlerden beklenen uzmanlarca h az ırtanmı ş bu tür a raçları güvenilir ve geçerti bir şekild e uygula yı p, uzma nların beli rtediği yöntemlere göre yorumlamaları dır. Bu ölçme ara çları­ nın uyg u lan mas ı ve yoru ml anması için okul rehbertik servisinin veya ölçme değerl endi rme uzmanl arının d esteğ i nin de alın mas ı gerekir. Aşağ ıd a bu tür alternatif değertendirme yöntemlerine yönelik olarak k ısa açıkl amalara yer verilmektedir. internetten bu yöntem ve tekniklerle ilgili örnek test formları nı indirip incelemeniz, bu yöntem ve tekniklerin anlaşıl masını kolayl aş ­ tadır .

5) Öğrenci gelişim dosyasının değertendirmesi, öğretimle ilgili olarak öğren ci p erforma n s ını belirteme ve öğren ci nin belirli bir alandaki geli şim ini ortaya koymakla birtikte, öğren ci lerin güçlü ve zay ıf yanların ı belirleme meka nizmasını da sağlar. Portfotyo öğrenciye kendi

öğrenmesini

ve ilerlemesini izleme

o l anağı sağlar .

tıracaktır .

366

367

·-·> ·-

o.

AJıerııaJif De{.-erleıulirmc

Öğrttimdc Ölçme ,-e Değe:rleı,dinııt

358

357

Akran Öz Değerlendirme

Değerlendirme

Öğrenci hakkında bilgi toplamanın diğer bir yolu da öğrenciyi en yakın arkadaşın ın değerlendirmesidir. Başarıyla ilgili olarak genelde grup çalış­ malarından sonra uygu lanır. Ayrıca psikolojik testlerde çok fayda sağlayan bir yöntemdir. Teknik olarak ifade edersek, akran değerlendirme, gruptaki öğrencil erin belli ölçütler çerçevesinde birbirlerini değerlendirmeleridir. Akran değerlendirme de öğrencilerin , arkadaşlarının çalışmalarındaki ye-

öz değerlendirme öğrencinin kendi kendini değerlendirmesidir. öz değerlendirme birey kendinin üstün ve zayı f oldu ğu özellikleri keşfetmesine destek sağlar. Öğrencilerin yaptıkları çalışmaları sorgulamaları veya değerlendirmeleri olanağı sağlanır. Bireyin kendini daha iyi tanımasına yardımcı olur. Öğrencinin kendi çaba ve çalışmalarının yeterliği ve niteliği hakkında yorum yapmaları onlarda öğrenme ve değerlendirme sorumluluğu ve bilincini de geliştirebilir. Öz değerlendirmede önemli bir sorun insanların kendisini değerlendi­ rirken yanlı olmalarıdır. insanların kendisine yönelik olarak objektif olması çoğu zaman çok zordur. Objektiflik sağlanamadığ ında öz değerlendirme­ nin güvenilir ve geçerli sonuçlar vermeyeceği gerçeği karşımıza çıkar. Öğ· rencilere değerlendirmedeki temel amacın kendilerinin gelişmesi olduğu ve dürüst ol maları istend iğinde, objektiflik için gerekli motivasyon sağlan­ dığı nda öğrencilerden objektif bilgiler sağl anabilir.

terlik düzeylerini değerlendirirken kendilerinin el eş tirel düşünme becerilerinin de gelişeceği görüşü söz konusudur. Hem öz değerlend irme hem de akran değerlendirme de tanılayıcı amaçfı ölçme ve değertendirme etkinlikleri yapıldığında öğrenci lerin samimi ve doğru cevap verme olasılıkları daha yüksek olur.

Anket Öğrenci veya velilere yazılı olarak sorular sorulup, onlardan yazılı olarak cevapların alınmasını içeren bilgi toplama yöntemidir. Anket yoluyla, deneklerden isim alınmadığı durumlarda bazı hassas konular hakkında çok önemli genel bilgiler edinilebilir. Maliyet açısından ekonomiktir. Anketlerin hazır1anması kadar, uygulanması ve yorumlanması da ciddi uzmanlık gerektirir. Anketlerin elektronik ortamda uygulanabilmesi ve verilerin otomatik olarak veri tabanına işlenmesi avantajlarına ek olarak, anketlerin hazırtan­ ması, uyg ul anması ve analizini kola ylaştıran prog ramların ücretsiz olarak erişebil ir olmas ı gibi ava ntajl arında n dolayı ku llanım ı yayg ın laşmıştır. Anketlerte sadece öğrencinin gelişimine yönelik değil , öğretmenlerin, yöneti• cilerin, uygulanan kursların değerlendiril mes ine yönelik olarak da gö riişler

Soru 1: Bir insanı en doğru şekilde tanıyabilecek ve değerlendirebilecek kişi kendisidir. Görüşüne katılmakta mısınız? Neden?

alın ı p değerlendi rilebilmektedir.

Soru 2: Bir öğrencinin başarısını en doğru şekilde belirleyebilecek ve değerlendirebilecek kişi kendisidir. Görüşüne katılmakta mısınız? Neden?

Görüşme

Uzman bir kişi veya a raştırman ın denekleriyle genellikle karş ılı klı koyoluyla (yüz yüze, telefonla veya video konferansla görüşerek) veri toplan masını içerir. Araştırmanın amaçlarına uygun olarak, görüşülecek denekl e rin(cevap lay ıcıl arın) kimler ol acağ ın ın, görüşmen in i çeriğ in in ve görüşme süresince yap ıl acak etkinliklerin çok detaylı olarak belirtenmesi gerekir. Ankete k ı yasla genelde cevapl arın daha güvenilir olarak alınmas ı söz konusudur. Cevapl ayı cılar an lamad ı kl arı ifadelerin ne olduğ unu gözlemciye sorabilirler. Görüşme, gerek görülürse bazı konularta ilgili olarak daha derinlemesine bilgi alabilme es nekli ğ i sağlar. Anket uygulandıktan sonra elde edilen bazı bulguların gerekçelerine yönelik olarak veya bazı konularda daha detaylı bilgi edinme açısından göriişme yöntemi kullanı lır . Aslında hemen hemen her anketin görüşme yöntemiyle takviye edilmesi faydalı olur. Ankete nazaran daha maliyetlidir. nuşma

368

369

·-·> ·-

o.

AJıerııaJif De{.-erleıulirmc

Öğrttimdc Ölçme ,-e Değe:rleı,dinııt

360

359

ÜNİTE SORULAR!

Gözlem

Gözlem, belli bir konuda önceden belirlenen veya belirlenmeyen ama konuyta ilgili davranı şların gözlenmesi yoluyta verilerin toplanmas ını içerir. Ankette ve görü şmede olduğu gibi araştırılan konuyla ilgili, duygu düşünce ve görüşlerin alınmasını değil, davranışların incelenmesini içerir. Davranışlar hakkında daha somut ve ayrıntı lı veri sağlama olan ağı sunar. Gerçek ortam ve şa rtla rda davranışların gözlenmesi olanağ ı sunar. Buna karşılık denek sayısı ankete göre daha az olur ve verilerin toplanması daha fazla zaman alı r. Araştırmacı veya gözlemcilerin sonuca etkisi ankete nazaran daha fazla olur. Gözlemler doğal ortamda yapılabildiği gibi yapay ortamlarda da ya pıl maktad ır.

1.

Alternatif değerlendi rme yaklaşımının temel felsefesi nedir?

2.

Alternatif değerlendirmeye neden gerek duyul muştur?

3.

Alternatif değerten dirme yaklaşımını ne gibi olumsuz özellikleri vard ı r?

4. 5.

Alternatif de ğerlendirmeni n ne tür olumlu özellikleri vardır? öz değerlendirmenin ülkemizde uygulanabilirliğini tartışınız

6.

Akran değerl endirmesinin olumlu ve olumsuz yanl arını tartışınız

SINIF-IÇI UYGULAMA Alan ınızla

ÖZ.ET

ilgili olarak 5 tane alternatif ölçme ve değerlendirme yakla-

şımı öneriniz. Önerdiğiniz yaklaşımları kısaca açıklayınız.

Alternatif değerlendirme , öğrencin in bir şeyler yapması , göstermesi, Oluş ­ üretmesi gibi çatışmalarla ilgilenir. Alternatif değe rfend irmede, öğren ­ cinin performansının somut bir şekild e ortaya konul mas ı için öğrenci ye uygu• lama ol anağ ı sağl ama ve öğrencini n öğrend iğ i bilgileri kullanarak kritik düşünme becerisini ölçmeyi amaçlar. Alternatif değerlendirme öğrencinin ne bildiğinden ziyade ne yapabi leceği ile ilgilenir. Öğrenci gelişim dosyası (portfolio) öğrenci çalışmalarını ve öğrenci gelişi­ mine yönelik olarak arşivlenen öğrencilerin çalışma la rı ndan elde edilen ürün• ler ve ödevleri içerir. öz değerlendirme, belli bir konuda bireyin kendini değerlendirmesidir. öz değerlendirmede birey kendinin üstün ve zayıf olduğu özelllkleri keşfetmesine destek sağlar. Bireyin kendini daha iyi tanımasına yardımcı olur. Öğrenci hak• kı nda bilgi toplamanın dijer bir yolu da öğrenciyi en ya kı n aricadaşın ı n değer­ lendirmesidir. Akran değerlendirme, gruptaki öğrencilerin belli ölçütler çerçeve• sinde birbiı1erini değerte ndUTTleleridir. Anket, öğrenci veya velilere yazı lı olarak sorular sorulup, onlardan yazılı olarak bazı bilgilerin alın masını sağl ar. GörOşme, uzman bir kişi veya araştırman ın denekleriyle genellikle karşılı klı konuşma yoluyta (yüz yüze, telefonla veya video konferansla görüşerek) veri toplanması nı içerir. Gözlem, belli bir konuda önceden belirtenen veya belirten• meyen ama konuyla ilgili davranışl arın gözlenmesi yoluyla velilerin toplanmas ı nı içerir. turması,

370

371

·-·> ·-

o.

362

EK-1

TABL0-1: Bir Z değeri için Birim Normal Dağılım Eğrisinin Solunda Kalan Alan (Excel 201 6'da NORMSDAĞ(z) fonksiyonuyla da elde edilebilir)

z

o

•3,0 -2.9 -2.8 -2.7 -2.6

.0013 .0019 .0026 .0035 .0047

·2,5 •2,4 -2.3 -2.2 -2.1

,0062 .0082 .0107 .0139 .0179

.0080 .0104 .0136 .0174

·2.0 ·1.9 ·1.8 •1.7 •1.6

.0228 .0287 .0359 .0446 .0548

·1.5 -1.4 ·1.3 ·1.2 ,1.1

1 .0013 .0018 .0025 .0034 .0045

z

o

0.1 0.2 0.3 0.4 0.5

.5000 .5398 .5793 .6179 .6554 .6915

1 .5040 .5436 .5832 .6217 .6591 .6950

2 .5080 .5478 .5871 .6255 .6628 .6985

3 .5120 .5517 .5910 .6293 .6664 . 7019

4 .5160 .5557 .5948 .6331 .6700 .7054

5 .5199 .5596 .5987 .6368 .6736 .7088

6 .5239 .5636 .6026 .6406 .6772 .7123

7 .5279 .5675 .6064 .6443 .6808 .7157

8 .5319 .5714 .6103 .6480 .6844 .7190

9 .5359 .5753 .6141 .6517 .6879 .7224

0.6 0.7 0.8 0.9 1.0

.7257 .7580 .7881 .8159 .8413

.7291 .7611 .7910 .8186 .8436

.7324 .7642 .7939 .8212 .8461

.7357 . 7673 .7967 .8238 .8485

.7389 .7704 .7995 .8264 .8508

.7422 .7734 .8023 .8289 .8531

.7454 .7764 .8051 .8315 .8554

.7486 .7794 .8078 .8340 .8577

.7517 .7823 .8106 .8365 .8599

.7549 .7852 .8133 .8389 .8621

1.1 1.2 1.3 1.4 1.5

.8643 .8849 .9032 .9192 .9332

.8665 .8869 .9049 .9207 .9345

.8686 .8888 .9066 .9222 .9357

.8708 .8907 .9082 .9236 .9370

.8729 .8925 .9099 .9251 .9382

.8749 .8944 .9115 .9265 .9394

,8770 .8962 .9131 .9279 .9406

.8790 .8980 .9147 .9292 .9418

.8810 .8997 .9162 .9306 .9429

.8830 .9015 .9177 .9319 .9441

1.6 1.7 1.8 1.9 2.0

.9452 .9554 .9641 .9713 .9772

.9483 .9564 .9649 .97 19 .9778

.9474 .9573 .9656 .9726 .9783

.9484 .9582 .9664 .9732 .9788

.9495 .9591 .9671 .9738 .9793

.9505 .9599 .9678 .9744 .9798

,9515 .9608 .9686 .9750 .9803

.9575 .9616 .9693 .9756 .9808

.9535 .9625 .9699 .9761 .9812

.9545 .9633 .9706 .9767 .9817

2.1 2.2 2.3 2.4 2.5

.9821 .9861 .9893 .9918 .9938

.9826 ,9884 .9896 .9920 .9940

.9830 .9868 .9898 .9922 .9941

.9834 .9871 .9901 .9925 .9943

.9838 ,9675 .9904 .9927 .9945

.9842 .9878 .9906 .9929 .9946

.9846 .9881 .9909 .9931 .9948

,9650 ,9684 .9911 .9932 .9949

.9854 .9887 .9913 .9934 .9951

.9657 .9690 ,9916 .9936 .9952

2.6 2.7 2.8 2.9 3.0

.9953 .9965 .9974 .9981 .9987

.9955 .9966 .9975 .9982 .9987

.9956 .9967 .9976 .9982 .9987

.9957 .9968 .9977 ,9983 .9988

.9959 .9969 .9977 ,9984 .9988

.9960 .9970 .9978 .9984 .9989

.9961 .9971 .9979 .9985 .9989

.9962 .9972 .9979 .9985 .9989

.9963 .9973 .9980 ,9986 .9990

.9964 .9974 .9981 ,9986 .9990

o.o

TABLOLAR

2 .0013 .0018 .0024 .0033 .0044

3 .0012 .0017 .0023 .0032 .0043

4 .0012 .0016 .0023 .0031 .0041

5 .0011 .0016 .0022 .0030 .0040

6 .0011 .0015 .0021 .0029 .0039

7 .0011 .0015 .0021 .0028 .0038

8 .0010 .0014 .0020 .0027 .0037

9 .0010 .0014 .0019 .0026 .0036

.0060 .0059

.0078 .0102 .0132 .0170

.0057 .0075 .0099 .0129 .0166

.0055 .0073 .0096 .0125 .0162

,0054 .0071 .0094 .0122 .0158

.0052 .0069 .0091 .0119 .0154

.0051 .0068 .0089 .0116 .0150

.0049 .0066 .0087 .0113 .0146

,0048 .0064 .0084 .0110 .0 143

.0222 ,0281 .0351 .0436 .0537

.0217 .0274 ,0344 .0427 .0526

.0212 .0268 .0336 .0418 .0516

.0207 .0262 .0329 .0409 .0505

.0202 .0256 .0322 .0401 .0495

.0197 ,0250 .0314 .0392 .0485

.0192 .0244 ,0307 .0384 .0475

.0188 ,0239 ,0301 .0374 .0465

.0183 .0233 .0294 .0367 .0455

.0668 .0808 .0968 ,1151 .1357

.0655 .0793 .0951 ,1 131 .1335

.0643 .0778 .0934 .11 12 .1314

.0630 .0764 .0918 ,1093 .1292

.0618 .0749 .0901 .1075 .1271

.0606 .0735 .0885 .1056 .1251

.0594 .0721 .0669 .1038 .1230

.0582 ,0708 .0853 .1020 .1210

.0571 .0694 .0838 .1003 .1190

.0559 .0681 .0823 .0985 .1170

-1.0 -0.9 -0.8 ·0.7 ·0.6

.1587 .1841 .2119 .2420 .2743

.1562 .1814 .2090 .2389 .2709

.1539 .1788 .2061 .2358 .2676

.1515 .1762 .2033 .2327 .2643

.1492 .1736 .2005 .2296 .2611

.1469 .1711 .1977 .2266 .2578

.1446 .1685 ,1949 .2236 ,2546

.1423 .1660 .1922 .2206 .2514

.1401 .1635 .1894 .2177 ,2483

.1379 .161 1 ,1867 .2 148 .2451

-0.5 .0.4 .0.3 -0.2 •0,1 ·O.O

.3085 .3446 .3821 .4207 .4602 .5000

.3050 .3409 .3783 .4168 .4562 .4960

.3015 .3372 .3745 .4129 .4522 .4920

.2981 .3336 .3707 .4090 .4483 .4880

.2946 .3300 .3669 .4052 .4443 .4840

.2912 .3264 .3632 .4013 .4404 .4801

.2877 .3228 .3594 .3974 .4384 .4761

.2843 .3194 .3557 .3936 .4325 .4721

.2810 .3156 .3520 .3897 .4286 .4681

.2776 .3121 .3483 .3859 .4247 .4641

372

Öğrt:timde Ölçme ve Dcğtrlcmlimu:

373

> ··-

363 TABLO-2: Birim Normal Dağılımda Pı Değerleri için iZi ve Y Ordinat Değeri Pı

1Z 1

y



1Z 1

y

0.01 (0.99) 0.02 (0.98) 0.03 (0.97) 0.04 (0.96) 0.05 (0.95)

2.33 2.05 1.88 1.75 1.65

0.0265 0.0488 0.0681 0.0863 0.1040

0.26 (0.74) 0.27 (0.73) 0.28 (0.72) 0.29 (0.71 ) 0.30 (0.70)

0.64 0.61 0.58 0.55 0.52

0.3251 0.3312 0.3372 0.3429 0.3485

0.06 (0.94) 0.07 (0.93) 0.08 (0.92) 0.09 (0.91) 0.10 (0.90)

1.56 1.48 1.4 1 1.34 1.28

0.1200 0.1334 0.1476 0.1626 0.1758

0.31 0.32 0.33 0.34 0.35

(0.69) (0.68) (0.67) (0.66) (0.65)

0.50 0.47 0.44 0.41 0.39

0.3521 0.3572 0.3621 0.3668 0.3697

0.1 1 (0.89) 0.1 2 (0.88) 0.13 (0.87) 0.14 (0.86) 0.15 (0.85)

1.23 1.18 1.13 1.08 1.04

0.1872 0.2012 0.2107 0.2227 0.2323

0.36 (0.64) 0.37 (0.63) 0.38 (0.62) 0.39 (0.61) 0.40 (0.60)

0.36 0.33 0.31 0.28 0.25

0.3739 0.3778 0.3802 0.3836 0.3867

0.16 (0.84) 0.17 (0.83) 0.18 (0.82) 0.19 (0.81) 0.20 (0.80)

0.99 0.95 0.92 0.88 0.84

0.2444 0.2541 0.2613 0.2709 0.2803

0.41 (0.59) 0.42 (0.58) 0.43 (0.57) 0.44 (0.56) 0.45 (0.55)

0.23 0.20 0.18 0.15 0.13

0.3885 0.3910 0.3925 0.3945 0.3956

0.21 (0.79) 0.22 (0.78) 0.23 (0.77) 0.24 (0.76) 0.25 (0.75)

0.81 0.77 0.74 0.71 0.67

0.2874 0.2966 0.3034 0.310 1 0.3187

0.46 (0.54) 0.47 (0.53) 0.48 (0.52) 0.49 (0.51 ) 0.50 (0.50)

0.10 0.08 0.05 0.03 0.00

0.3970 0.3977 0.3984 0.3989 0.3989

374

375

·> ··-