Osnove anketnih istraživanja 9788660655334

Veoma praktično orijentisan psihometrijski udžbenik. Autor nudi razne praktične savete za istraživače koji nameravaju da

1,138 396 6MB

Serbian Pages [296] Year 2019

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Osnove anketnih istraživanja
 9788660655334

Table of contents :
Uvod
1.1. Šta je anketno istraživanje
1.2. (Vrlo) kratak istorijat anketnih istraživanja
1.3. Vrste anketnih istraživanja
1.3.1. Namena
1.3.2. Vrsta podataka
1.3.3. Cilj
1.3.4. Metode prikupljanja podataka
1.3.5. Nacrt
1.3.6. Vremenski aspekt
1.3.7. Populacija
1.3.8. Područje obuhvata
1.3.9. Organizacija koja sprovodi istraživanje
1.4. Zašto anketno istraživanje?
Faze anketnih istraživanja
2.1. Planiranje i nacrt
2.2. Prikupljanje podataka
2.3. Unos podataka
2.4. Uređivanje i ponderisanje podataka
2.5. Analiza
2.6. Pisanje izveštaja o rezultatima
2.7. Slanje izveštaja (diseminacija)
Populacija i uzorak
3.1. Populacija
3.1.1. Retke i skrivene populacije
3.2. Uzorak
3.2.1. Jedinice uzorkovanja, jedinice posmatranja, jedinice analize
3.2.2. Okvir uzorkovanja (spisak populacije)
3.2.2.1. Višestruki okviri uzorkovanja
3.2.2.2. Ažuriranje okvira uzorkovanja
3.2.2.2.1. Postupak poluotvorenih intervala
3.2.2.3. Slabosti okvira uzorkovanja
3.2.2.3.1. Nepokrivenost
3.2.2.3.2. Nelegitimne jedinice
3.2.2.3.3. Dupliranje
3.2.2.3.4. Grupisanje
3.2.3. Planirani i realizovani uzorak
Uzorkovanje
4.1. Nacrt uzorkovanja
4.2. Pouzdanost, validnost i preciznost uzorkovanja
4.3. Probabilističko i neprobabilističko uzorkovanje
4.3.1. Probabilističko uzorkovanje
4.3.1.1. Prosto slučajno uzorkovanje
4.3.1.1. Slučajno sistematsko biranje sa jednakim verovatnoćama
4.3.1.2. Klaster uzorkovanje
4.3.1.3. Stratifikovano slučajno biranje
4.3.2. Neprobabilističko uzorkovanje
4.3.2.1. Kvotno uzorkovanje
4.3.2.2. Ostali načini biranja
4.4. Višefazno uzorkovanje
4.4.1. Kišove tablice
4.5. Veličina uzorka
4.5.1. Određivanje optimalne veličine uzorka
4.5.1.1. Potrebna veličina klaster uzorka
4.5.1.2. Potrebna veličina stratifikovanog slučajnog uzorka
4.5.2. Cena istraživanja u zavisnosti od nacrta uzorkovanja
4.6. Skala kredibiliteta za male uzorke
Ukupna greška ankete
5.1. Greška uzorkovanja
5.2. Greška pokrivenosti
5.3. Greška neodgovora
5.4. Greška merenja
5.5. Primer upotrebe koncepta ukupne greške ankete na izbor nacrta
5.6. Greška podešavanja i greška obrade
5.7. Zaključak o izvorima grešaka u anketnim istraživanjima
Konstrukcija i evaluacija anketnog upitnika
6.1. Konstrukcija instrumenta
6.2. Pisanje stavki
6.2.1. Kognitivni proces davanja odgovora
6.2.1.1. Problemi tokom procesa odgovaranja na stavke
6.3. Formati stavki
6.4. Preporuke za pisanje stavki
6.5. Formatiranje upitnika
6.6. Redosled pitanja
6.6.1. Preporuke u vezi sa redosledom pitanja u anketi
6.6.2. Redosled ponuđenih odgovora
6.7. Evaluacija upitnika
6.7.1. Ekspertske procene upitnika
6.7.2. Pretest (pilot istraživanje)
6.7.3. Bihejvioralno kodiranje
6.7.4. Kognitivni intervju
6.7.5. Randomizovani eksperimenti
6.7.6. Ostale metode evaluacije upitnika i pitanja
Prikupljanje podataka
7.1. Ankete licem u lice
7.2. Grupne ankete
7.3. Telefonske ankete
7.4. Poštanske ankete
7.5. Ankete sa ličnom dostavom upitnika
7.6. Internet ankete
7.7. Ankete sa mešovitim modalitetima
7.8. Upotreba računara u anketnim istraživanjima
7.8.1. Različite varijante računarski podržanog prikupljanja podataka (CADAC)
7.8.1.1. CAPI
7.8.1.2. CASI
7.8.1.3. CATI
7.8.1.4. CARI
7.8.1.5. CAWI
7.8.1.6. EMS
7.8.1.7. DBM
7.8.1.8. CSAQ
7.9. Izbor modaliteta prikupljanja podataka,
7.9.1. Pitanja koja utiču na izbor metode prikupljanja podataka
7.9.1.1. Populacija
7.9.1.2. Uzorak
7.9.1.3. Tip pitanja u anketi
7.9.1.4. Sadržaj ankete
7.9.1.5. Pristrasnost ispitanika, netačno odgovaranje
7.9.1.6. Ostali bitni faktori pri izboru metode prikupljanja podataka
7.10. Dobre i loše strane različitih metoda prikupljanja podataka
Neodgovori
8.1. Stopa odgovora, stopa neodgovora, stopa odbijanja i stopa konverzije
8.2. Uticaj neodgovora na anketne pokazatelje
8.3. Izvori neodgovora
8.3.1. Neuspešno dostavljanje ankete
8.3.1.1. Kako smanjiti broj neodgovora zbog neuspešnog dostavljanja ankete
8.3.2. Neodgovori zbog odbijanja
8.3.2.1. Kako smanjiti broj neodgovora zbog odbijanja
8.3.3. Neodgovori zbog nemogućnosti davanja odgovora
8.3.3.1. Kako smanjiti broj neodgovora zbog nemogućnosti ispitanika da daju odgovore
8.4. Modalitet prikupljanja podataka i neodgovori
8.5. Neodgovori na pojedine stavke
Uloga anketara
9.1. Izbor anketara
9.2. Obuka anketara
9.3. Nadzor anketara
9.3.1. Falsifikovanje i validacija podataka
9.4. Uticaj anketara na anketne pokazatelje (pristrasnost anketara)
9.4.1. Pristrasnost anketara
Priprema podataka za analizu
10.1. Kodiranje (šifriranje)
10.2. Unos podataka
10.3. Uređivanje podataka
10.4. Ponderisanje i poststratifikacija
10.4.1. Koraci u ponderisanju
10.4.2. Ponderisanje i greška uzorkovanja
10.5. Imputacija nedostajućih podataka
10.5.1. Tretmani nedostajućih podataka
10.5.1.1. Metodi imputacije nedostajućih podataka
Pisanje i slanje izveštaja
11.1. Naslov
11.2. Sažetak
11.3. Uvod
11.4. Metod
11.5. Rezultati
Zaključci
11.7. Literatura
11.8. Prilozi
11.9. Prezentacija
Etička pitanja
12.1. Standardi u vezi sa istraživanjem
12.2. Standardi u vezi sa javnošću
12.3. Standardi u vezi sa klijentima
12.4. Standardi u vezi sa ispitanicima
12.4.1. Informisani voljni pristanak
12.4.2. Poštovanje dobrobiti ispitanika
12.4.3. Zaštita poverljivosti podataka
12.4.3.1. Statističko otkrivanje
12.4.4. Izbegavati obmanjivanje ispitanika
13. Reference
14. Indeks pojmova

Citation preview

Bojan Janičić

Osnove anketnih istraživanja

OSNOVE ANKETNIH ISTRAŽIVANJA

Izdavač UNIVERZITET U NOVOM SADU FILOZOFSKI FAKULTET Dr Zorana Đinđića 2 21000 Novi Sad Tel: +381214853900 www.ff.uns.ac.rs

Za izdavača prof. dr Ivana Živančević Sekeruš, dekan Bojan Janičić OSNOVE ANKETNIH ISTRAŽIVANJA

Recenzenti prof. dr Petar Čolović, Filozofski fakultet , Novi Sad prof. dr Ljiljana Mihić, Filozofski fakultet, Novi Sad Lektura Aleksandra Janičić

ISBN 978-86-6065-533-4

URL http://digitalna.ff.uns.ac.rs/sadrzaj/2019/978-86-6065-533-4

Novi Sad, 2019.

SADRŽAJ

SADRŽAJ

1.

Uvod ..............................................................................................................................................1 1.1. Šta je anketno istraživanje ....................................................................................... 1 1.2. (Vrlo) kratak istorijat anketnih istraživanja .................................................... 3 1.3. Vrste anketnih istraživanja ...................................................................................... 8 1.3.1. Namena ....................................................................................................................8 1.3.2. Vrsta podataka ......................................................................................................8 1.3.3. Cilj...............................................................................................................................9 1.3.4. Metode prikupljanja podataka ...................................................................... 9 1.3.5. Nacrt ....................................................................................................................... 10 1.3.6. Vremenski aspekt ............................................................................................. 11 1.3.7. Populacija............................................................................................................. 14 1.3.8. Područje obuhvata ........................................................................................... 14 1.3.9. Organizacija koja sprovodi istraživanje ................................................. 15 1.4. Zašto anketno istraživanje? .................................................................................. 16 2. Faze anketnih istraživanja ............................................................................................... 18 2.1. Planiranje i nacrt ....................................................................................................... 20 2.2. Prikupljanje podataka ............................................................................................. 26 2.3. Unos podataka ............................................................................................................ 28 2.4. Uređivanje i ponderisanje podataka................................................................. 28 2.5. Analiza............................................................................................................................ 29 2.6. Pisanje izveštaja o rezultatima............................................................................ 30 2.7. Slanje izveštaja (diseminacija) ............................................................................ 30 3. Populacija i uzorak .............................................................................................................. 31 3.1. Populacija ..................................................................................................................... 31 3.1.1. Retke i skrivene populacije .......................................................................... 33 3.2. Uzorak ............................................................................................................................ 36 3.2.1. Jedinice uzorkovanja, jedinice posmatranja, jedinice analize ...... 36 3.2.2. Okvir uzorkovanja (spisak populacije) ................................................... 38 3.2.3. Planirani i realizovani uzorak ..................................................................... 50 4. Uzorkovanje ........................................................................................................................... 53 4.1. Nacrt uzorkovanja .................................................................................................... 55 4.2. Pouzdanost, validnost i preciznost uzorkovanja ........................................ 57 4.3. Probabilističko i neprobabilističko uzorkovanje ........................................ 57 4.3.1. Probabilističko uzorkovanje........................................................................ 59 4.3.2. Neprobabilističko uzorkovanje .................................................................. 71 4.4. Višefazno uzorkovanje ............................................................................................ 79 4.4.1. Kišove tablice ..................................................................................................... 80 4.5. Veličina uzorka ........................................................................................................... 81 4.5.1. Određivanje optimalne veličine uzorka ................................................. 83 4.5.2. Cena istraživanja u zavisnosti od nacrta uzorkovanja ..................... 86 4.6. Skala kredibiliteta za male uzorke .................................................................... 87 5. Ukupna greška ankete ....................................................................................................... 90 5.1. Greška uzorkovanja ................................................................................................. 92 5.2. Greška pokrivenosti ................................................................................................. 96

i

OSNOVE ANKETNIH ISTRAŽIVANJA

5.3. Greška neodgovora................................................................................................... 98 5.4. Greška merenja ....................................................................................................... 101 5.5. Primer upotrebe koncepta ukupne greške ankete na izbor nacrta . 105 5.6. Greška podešavanja i greška obrade ............................................................. 107 5.7. Zaključak o izvorima grešaka u anketnim istraživanjima.................... 109 6. Konstrukcija i evaluacija anketnog upitnika......................................................... 110 6.1. Konstrukcija instrumenta .................................................................................. 112 6.2. Pisanje stavki ........................................................................................................... 113 6.2.1. Kognitivni proces davanja odgovora .................................................... 114 6.3. Formati stavki .......................................................................................................... 123 6.4. Preporuke za pisanje stavki .............................................................................. 127 6.5. Formatiranje upitnika .......................................................................................... 139 6.6. Redosled pitanja ..................................................................................................... 144 6.6.1. Preporuke u vezi sa redosledom pitanja u anketi........................... 147 6.6.2. Redosled ponuđenih odgovora ............................................................... 149 6.7. Evaluacija upitnika ................................................................................................ 153 6.7.1. Ekspertske procene upitnika ................................................................... 154 6.7.2. Pretest (pilot istraživanje) ........................................................................ 154 6.7.3. Bihejvioralno kodiranje .............................................................................. 156 6.7.4. Kognitivni intervju ........................................................................................ 156 6.7.5. Randomizovani eksperimenti .................................................................. 157 6.7.6. Ostale metode evaluacije upitnika i pitanja ....................................... 157 7. Prikupljanje podataka ..................................................................................................... 161 7.1. Ankete licem u lice ................................................................................................. 161 7.2. Grupne ankete ......................................................................................................... 162 7.3. Telefonske ankete .................................................................................................. 162 7.4. Poštanske ankete ................................................................................................... 163 7.5. Ankete sa ličnom dostavom upitnika ............................................................ 164 7.6. Internet ankete ........................................................................................................ 164 7.7. Ankete sa mešovitim modalitetima ............................................................... 165 7.8. Upotreba računara u anketnim istraživanjima ......................................... 165 7.8.1. Različite varijante računarski podržanog prikupljanja podataka (CADAC) 168 7.9. Izbor modaliteta prikupljanja podataka, ..................................................... 172 7.9.1. Pitanja koja utiču na izbor metode prikupljanja podataka ......... 174 7.10. Dobre i loše strane različitih metoda prikupljanja podataka ............. 180 8. Neodgovori .......................................................................................................................... 182 8.1. Stopa odgovora, stopa neodgovora, stopa odbijanja i stopa konverzije 183 8.2. Uticaj neodgovora na anketne pokazatelje ................................................. 185 8.3. Izvori neodgovora .................................................................................................. 187 8.3.1. Neuspešno dostavljanje ankete............................................................... 187 8.3.2. Neodgovori zbog odbijanja ....................................................................... 191 8.3.3. Neodgovori zbog nemogućnosti davanja odgovora ....................... 198 8.4. Modalitet prikupljanja podataka i neodgovori ......................................... 199 8.5. Neodgovori na pojedine stavke ....................................................................... 202 9. Uloga anketara ................................................................................................................... 204 9.1. Izbor anketara ......................................................................................................... 205 9.2. Obuka anketara ....................................................................................................... 205 9.3. Nadzor anketara ..................................................................................................... 207

ii

SADRŽAJ

9.3.1. Falsifikovanje i validacija podataka ...................................................... 208 9.4. Uticaj anketara na anketne pokazatelje (pristrasnost anketara) .... 210 9.4.1. Pristrasnost anketara .................................................................................. 212 10. Priprema podataka za analizu..................................................................................... 215 10.1. Kodiranje (šifriranje) ........................................................................................... 216 10.2. Unos podataka ......................................................................................................... 221 10.3. Uređivanje podataka............................................................................................. 224 10.4. Ponderisanje i poststratifikacija ...................................................................... 229 10.4.1. Koraci u ponderisanju ................................................................................. 231 10.4.2. Ponderisanje i greška uzorkovanja ....................................................... 232 10.5. Imputacija nedostajućih podataka ................................................................. 233 10.5.1. Tretmani nedostajućih podataka ........................................................... 242 11. Pisanje i slanje izveštaja ................................................................................................. 252 11.1. Naslov .......................................................................................................................... 253 11.2. Sažetak ........................................................................................................................ 253 11.3. Uvod ............................................................................................................................. 254 11.4. Metod ........................................................................................................................... 254 11.5. Rezultati ..................................................................................................................... 255 11.6. Zaključci ..................................................................................................................... 257 11.7. Literatura ................................................................................................................... 258 11.8. Prilozi .......................................................................................................................... 259 11.9. Prezentacija .............................................................................................................. 259 12. Etička pitanja ...................................................................................................................... 260 12.1. Standardi u vezi sa istraživanjem ................................................................... 260 12.2. Standardi u vezi sa javnošću ............................................................................. 261 12.3. Standardi u vezi sa klijentima .......................................................................... 262 12.4. Standardi u vezi sa ispitanicima ...................................................................... 262 12.4.1. Informisani voljni pristanak ..................................................................... 262 12.4.2. Poštovanje dobrobiti ispitanika .............................................................. 264 12.4.3. Zaštita poverljivosti podataka ................................................................. 265 12.4.4. Izbegavati obmanjivanje ispitanika ...................................................... 270 13. Reference .............................................................................................................................. 272 14. Indeks pojmova.................................................................................................................. 281

iii

UVOD

1. Uvod 1

Metodologija anketnih istraživanja je obuhvatna multidisciplinarna oblast, koja svojim obimom daleko prevazilazi ciljeve i svrhu ovog udžbenika, a to su uvod i upoznavanje čitaoca sa osnovnim pojmovima anketnih istraživanja. S obzirom na rastuću popularnost anketnih istraživanja i njihovu sve češću primenu u različitim oblastima i od strane istraživača koji nisu dovoljno upoznati sa problemima koji mogu nastati u njihovoj primeni, namera autora bila je da ukaže na moguće probleme koji mogu nastati u planiranju i sprovođenju, te da čitaoca uputi na neka od mogućih rešenja. Želja autora bila je da ovaj udžbenik posluži kao polazna tačka istraživačima i izvan oblasti nauka o ponašanju prilikom planiranja anketnih istraživanja. Cilj je bio da čitalac uvidi složenost ovog metoda istraživanja i da ne zanemari činioce koji ga mogu dovesti do pogrešnih zaključaka. Kako anketna istraživanja ne moraju imati čisto naučnu svrhu, već se rezultati dobijeni na ovaj način u velikoj meri koriste i za donošenje važnih informisanih odluka u različitim sferama života, želja autora bila je da čitaocu ukaže i na praktične strane njihovog organizovanja i sprovođenja. U udžbeniku biće objašnjeni osnovni pojmovi, principi i faze anketnih istraživanja, i date korisne preporuke za njihovu organizaciju, pa i prevenciju i otklanjanje mogućih problema koji mogu nastati.

1.1. Šta je anketno istraživanje

Termin anketa koji se koristi u srpskom jeziku preuzet je iz francuskog, od reči enquête što znači istraživanje, istraga, a vodi poreklo iz latinskog jezika, od reči inquisita sa istim značenjem (Fajgelj, 2004). U engleskom jeziku za ovakav tip istraživanja koristi se termin survey, a može se prevesti i terminom pregled. Doduše, i engleski termin je nastao iz francuskog survee, što opet, ima koren u latinskom od super (iznad, preko) i videre (gledati) (Schuman, 1997; prema: Groves, 2009). Udžbenik je nastao u okviru projekta „Nasledni, sredinski i psihološki činioci mentalnog zdravlja“ koji finansira Ministarstvo prosvete, nauke i tehnološkog razvoja Republike Srbije (projekat broj 179006) e-mail adresa autora: [email protected] 1

1

OSNOVE ANKETNIH ISTRAŽIVANJA

Kada se u srpskom jeziku kaže „anketa“ obično se pomisli na istraživanje koje uključuje upotrebu (anketnih) upitnika, a vrlo često i samo na upitnik. Važno je znati da se anketna istraživanja ne ograničavaju samo na upotrebu podataka dobijenih tim putem već se mogu koristiti podaci dobijeni različitim načinima merenja, ali i sekundarni podaci.

Sumirajući veći broj definicija de Leeuw i saradnici anketno istraživanje, odnosno anketu, definišu kao „istraživačku strategiju u kojoj se kvantitativne informacije sistematski prikupljaju na relativno velikom uzorku uzetom iz neke populacije“ (De Leeuw, Hox, Dillman, & European Association of Methodology, 2008, p. 2).

Ako ovu definiciju pažljivije pogledamo, možemo videti da se ne pominje anketni upitnik. Iako su upitnici trenutno dominantni način prikupljanja podataka, nisu i jedini. Ono što je bitno, bez obzira na metodu prikupljanja podataka koja se koristi, je da se to radi sistematski. Jedino na taj način moguća je smislena statistička obrada i analiza. Informacije koje se prikupljaju u anketnim istraživanjima obično su kvantitativne. Čak i ako to nije slučaj, kvalitativni podaci se kvantifikuju pre statističke obrade.

Sledeća važna komponenta navedene definicije je uzorak. Iako se anketna istraživanja u izuzetnim slučajevima mogu sprovoditi na čitavoj populaciji (ako se radi o malim i lako dostupnim populacijama 2), ona se po pravilu sprovode na uzorcima izvučenim iz populacija o kojima želimo da zaključujemo i saznamo više. Istraživanja sprovedena na uzorku, ukoliko su dobro planirana i sprovedena, mogu znatno brže i uz snižene troškove u odnosu na istraživanja na populaciji dati informacije dovoljne preciznosti za praktične potrebe (Mahalanobis, 1965). U definiciji anketnog istraživanja pominje se sintagma relativno veliki uzorak. Veličina uzorka jeste relativan pojam. Šta je dovoljno veliki uzorak zavisi od varijabilnosti same pojave, načina uzorkovanja i planiranih analiza. Mogli bismo reći jednostavno: „Što je uzorak veći – to bolje“. Međutim, prilikom sprovođenja anketnih istraživanja to ne mora uvek da bude tačno. Svaka anketa ima svoju cenu. Nekada jednostavno nema smisla prikupljati informacije od prevelikog broja jedinica istraživanja (ispitanika), jer sa njegovim povećanjem preciznost ankete neće bitno porasti, ali cena i vreme potrebno za njeno sprovođenje hoće. Možemo reći da je prilikom sprovođenja anketnih istraživanja bitno uskladiti sve ove elemente, a ne insistirati na što većem uzorku.

Pitanje uzorkovanja je vrlo važno i složeno i o njemu će biti više reči u posebnom poglavlju (4).

U ankete na celokupnoj populaciji bi se mogli ubrojati i popisi stanovništva. Iako po načinu sprovođenja liče na anketna istraživanja, oni se obično ne tretiraju tako već se nazivaju onim što i jesu – popisi (engl. census) 2

2

UVOD

Iako se kao jedna od osnovnih odrednica anketnih istraživanja često navodi da su ona neeksperimentalna (Fajgelj, 2004), videćemo da je u okviru njih moguća i upotreba eksperimentalnih nacrta (videti odeljak 1.3.5.).

1.2. (Vrlo) kratak istorijat anketnih istraživanja

Korene anketnih istraživanja nalazimo u popisima stanovništva (ali i stoke i drugih dobara). Popisi su imali za cilj da obuhvate celokupnu populaciju neke države, a vlade su ih sprovodile u cilju oporezivanja i političkog predstavljanja (Groves, 2009). Imajući to u vidu, možemo reći da anketna istraživanja imaju začetke još u drevnom Vavilonu 3800 g.p.n.e, za kada se veruje da je obavljen prvi popis. Praksa popisa stanovništva i imovine bila je prisutna i u starom Egiptu, Rimu i Kini. Forma popisa stanovništva postojala je XI–XVI veka u majanskom carstvu u Južnoj Americi. Na tlu Evrope možemo pomenuti „Knjigu sudnjeg dana“ (engl. „Doomsday Book“), koja predstavlja vrstu popisa stanovništva velikog dela Engleske i Velsa, dovršenog krajem XI veka po naredbi kralja Viljema Osvajača. „Knjiga sudnjega dana“ takođe je napravljena u cilju evidencije plaćanja poreza. Popisi su u XVII veku obavljani na teritoriji današnje Kanade, a vek kasnije i na teritoriji današnje Finske i Švedske. Kada su u XIX veku krenula prva istraživanja koja se nisu ticala broja ljudi, domaćinstava, imovine, već mišljenja ljudi, bazirala su se na pristupu koji se primenjuje u popisima, odnosno predstavljala su pokušaj da bude ispitana celokupna populacija (Rossi, Wright, & Anderson, 1983).

Prvi pokušaj zaključivanja o populaciji na osnovu podataka koji se odnose na jedan njen manji deo (odnosno na osnovu uzorka), vezuje se za rad engleskog trgovca pozamanterijom Džona Graunta (John Graunt) iz XVII veka (Bethlehem, 2009). On je u svom delu iz 1662. godine „Natural and Political Observations Upon the Bills of Mortality“ na osnovu podataka iz crkvenih knjiga nekoliko parohija koje su imale dobro vođene arhive, došao do zakonitosti o odnosu broja porodica koje su živele u njima i godišnjeg broja sahrana. Pretpostavljajući da sličan odnos važi i u ostalim parohijama, on je na osnovu godišnjeg broja sahrana pokušao da proceni broj porodica koje su u njima živele. Graunt nije sproveo anketno istraživanje već je primenio statističko zaključivanje na osnovu uzorka sekundarnih podataka. Sličan je bio rad Laplasa (Pierre Simon Laplace) u Francuskoj početkom XIX veka. Želeći da proceni broj stanovnika tadašnje Francuske uzeo je uzorak od 30 departmana 3 birajući one sa boljim arhivama, istovremeno vodeći računa da budu zastupljeni departmani sa različitom klimom. Na taj način pokušao je da kontroliše uticaj klimatskog faktora. Koristeći centralnu graničnu teoremu, dokazao je normalnu distribuciju statističke procene. Na žalost prevideo je činjenicu da je nacrt uzorkovanja bilo uzorkovanje klastera (ispitanika sa sličnim osobinama), a ne prosto slučajno (videti poglavlje 4). Šta više, departmani su birani namerno a ne slučajno (Bethlehem, 2009). 3

Upravne jedinice u Francuskoj koje se sastoje iz okruga.

3

OSNOVE ANKETNIH ISTRAŽIVANJA

Drugi deo XIX veka doneo je značajan napredak u razvoju teorije verovatnoće i statistike. Značajna je uloga Ketlea (Lambert Adolphe Jacques Quetlet 4) u razvoju anketnih istraživanja i primeni dostignuća iz teorije verovatnoće i statistike u njima. Ketlea možemo smatrati odgovornim za uvođenje pojma prave vrednosti. Naime, on je pretpostavio da statistici dobijeni na uzorcima variraju oko neke prave vrednosti koju bismo dobili kada bismo izmerili celu populaciju. Takođe, njemu možemo pripisati koncept prosečnog čoveka, odnosno čoveka čije bi sve osobine bile jednake pravim vrednostima (Bethlehem, 2009). Na konceptu prosečnog čoveka zasnivao se veliki broj istraživanja krajem XIX i početkom XX veka. Naime, shvatanje da je dovoljno prikupiti informacije samo od tipičnih (prosečnih) ljudi tada se smatralo prihvatljivim, dok se anketiranje ekstrema izbegavalo.

Tek u XX veku počinje upotreba istraživanja nalik anketnim za ispitivanje stavova i preferencija ispitanika. Čuvena su bila predizborna istraživanja časopisa „Literary Digest“, koji je na osnovu njih od 1920. do 1932. godine (svake 4 godine) tačno predviđao rezultate predsedničkih izbora u SAD. Istraživanja su imala formu glasanja pre glasanja, a obavljala su se na delu populacije. Ovaj deo populacije ne možemo nazvati uzorkom (bar ne pravim, a svakako ne reprezentativnim). Sačinjavali su ga pretplatnici časopisa, vlasnici telefona i registrovanih automobila, registrovani članovi klubova... Zanimljivo je da časopis nije ostao upamćen po uspešnim predviđanjima, već po neuspehu iz 1936. godine kada je predvideo pobedu Alfreda Landena (Alfred Landon), a pobedio je Frenklin Delano Ruzvelt (Franklin Dellano Roosevelt). Časopis je svoje predviđanje obavio na osnovu 2,4 miliona glasova koje je dobio sa deset miliona adresa na koje je poslao pitanje. Broj ispitanika koji je odgovorio je impresivan, a još impresivniji je broj na koje je pitanje poslato. Iako se već sam spisak adresa na koje je pitanje poslato čini problematičnim, jer su ga činili imućniji Amerikanci koji su u doba ekonomske krize sebi mogli da priušte pretplatu na časopis, telefon, automobil i članstvo u klubovima, postoje nalazi koji ukazuju da bez udruženog delovanja sa samoselekcijom ispitanika (Squire, 1988), odnosno onoga što se naziva pristrasnošću neodgovora (videti odeljak 5.3), rezultati ne bi u toj meri bili pogrešni i časopis bi verovatno pogodio pobedničkog kandidata (ali ne i procente).

Sve u svemu, ni ogroman broj ispitanika nije doprineo tačnosti predviđanja. Istovremeno je Američki institut za ispitivanje javnog mnenja Džordža Galupa (Georg Gallup) na osnovu mnogo manjeg uzorka tačno predvideo rezultate izbora. Ovaj događaj, pored toga što je doprineo propasti časopisa Literary Digest 5, smatra se prekretni-

Inače, Ketle je bio uključen u pokušaj formiranja Centralnog biroa za statistiku Holandije 1826. godine, a nakon odvajanja Belgije bio je nadzornik za statistiku u toj zemlji. Nije se bavio istraživanjima na uzorku već samo popisima. 5 Samo ime Literary Digest postalo je sinonim za grešku velikih razmera kao npr. u radovima Gayo-Avello, D. (2011). Don't turn social media into another 'Literary Digest' poll. Communications of the ACM, 54(10), 121–128. ili Cahalan, D. (1989). Com4

4

UVOD

com u razvoju anketnih istraživanja nakon kojeg se mnogo više pažnje poklanjalo metodologiji istraživanja, a posebno uzorkovanja. U prvo vreme javljaju se kvotni uzorci, a kasnije probabilistički.

Posle Prvog svetskog rata na popularnosti su dobila i marketinška istraživanja, odnosno istraživanja preferencija kupaca. Ni ona nisu imala formu anketnih istraživanja u savremenom obliku, već su više ličila na laboratorijska istraživanja. Pozivane su manje grupe ispitanika i ispitivane su njihove preferencije u vezi sa određenim proizvodima pomoću standardizovanih upitnika. Kombinacija ovakvih pristupa dala je ono što nazivamo modernim anketnim istraživanjima. Iz oblasti marketinških istraživanja preuzet je metod ispitivanja preferencija pomoću standardizovanih upitnika, iz novinskih i socioloških anketa preuzeti su predmeti istraživanja, a bilo je potrebno dodati još samo koncept probabilističkog uzorkovanja (Rossi et al., 1983).

Uslovi za to su se stekli tridesetih godina XX veka. Ankete su počele da se upotrebljavaju radi sticanja uvida u društvene probleme ili da bi se dobio sistematski uvid u stavove „običnih ljudi“ u anketama iz oblasti žurnalizma i marketinga (Groves, 2009). Počinje upotreba anketnih istraživanja u komercijalne svrhe za potrebe reklamiranja na radiju. U to doba počinje da se koristi pošta i telefon za svrhe anketiranja u današnjem smislu. Fokus se pomera sa obeležja ispitanika na ono šta oni znaju, misle i osećaju. Podaci dobijeni na ovaj način počeli su sve više da se koriste za upravljanje kompanijama i u politici (posebno u kampanjama).

Dakle, početak modernih anketnih istraživanja možemo smestiti u tridesete godine XX veka. Koncentracija na subjektivno kod ispitanika i sve rasprostranjenija upotreba anketiranja, rezultirala je i razvojem standardizovanih upitnika. Masovnost anketiranja i povećanje uzoraka uticala je da broj obučenih, stručnih anketara koji su mogli da kvalitetno obave intervjue postane premali. Pošto su za potrebe anketiranja morali biti angažovani i ljudi koji nisu imali potrebno iskustvo i znanja iz oblasti društvenih istraživanja, bilo je potrebno pažljivo sročiti pitanja koja će oni postavljati ispitanicima kako bi istraživač dobio informacije koje su mu zaista i potrebne. Razvoju standardizovanih upitnika doprineli su radovi psihometričara i psihologa koji su početkom XX radili na razvoju testova koji će meriti različite psihološke konstrukte. Za razvoj anketnih istraživanja posebno su bitni radovi Terstona (Leon Louis Thurstone) i Likerta (Ransis Likert) na merenju stavova (Groves, 2009). Pojava takozvane Likertove skale je omogućila skraćivanje standardizovanih upitnika pošto je pokazano da se jednim jednostavnim pitanjem sa uređenom skalom odgovora može postići gotovo ista stvar u merenju stavova koja se ranije dobijala velikim brojem poređenja po parovima. Na ovaj način upitnici su postali kraći, odnosno, omogućeno je ispitivanje više stvari u jedinici vremena. ment: The Digest Poll Rides Again!

5

OSNOVE ANKETNIH ISTRAŽIVANJA

Razvoj standardizovanih upitnika bio je praćen i razvojem uzorkovanja. U početku, anketna istraživanja pokušavala su da obuhvate sve jedinice populacije. Ovakav način anketiranja bio je zahtevan sa aspekta prikupljanja podataka, ali je takođe stvarao i poteškoće prilikom obrade velike količine informacija. Zato je često obrađivan samo deo prikupljenih podataka. Sa porastom upotrebe anketiranja u različite svrhe i od strane različitih istraživača, anketiranje celokupne populacije postaje neekonomično, a često i nemoguće. Prvi pokušaji uzorkovanja bili su neprobabilistički. Manji broj ispitanika (recimo pola populacije) biran je namerno, tako da reprodukuje strukturu populacije po važnim obeležjima. Ovakvim uzorkovanjem je u početku bio biran deo podataka (od svih prikupljenih) koji će biti obrađen. Prvi probabilistički uzorci bili su ono što sada zovemo sistematski slučajni uzorci (biran je svaki n-ti ispitanik) iz podataka dobijenih popisom. Ovakvi uzorci nazivaju se probabilističkim ili verovatnosnim zato što svaki član populacije ima neku, nenultu verovatnoću da bude izabran u uzorak. Ovakav vid uzorkovanja danas se smatra standardom sa kojim se porede ostali uzorci. Kada god se sprovode istraživanja koja za cilj imaju donošenje važnih odluka primenjuju se probabilistički uzorci (Groves, 2009). Slučajni uzorci su značajni i zato što nam omogućuju statističko zaključivanje. Sprovođenje istraživanja neke pojave na populaciji (recimo visine stanovnika neke države) rezultiraće parametrom (prosečnom visinom). Ukoliko su svi ispitanici pravilno izmereni to će biti tačna, prava vrednost tog parametra u populaciji. Međutim, ako merenje vršimo na uzorku, rezultat koji dobijemo (aritmetička sredina) biće statistik, odnosno procena parametra populacije. Ovaj statistik obično neće biti jednak parametru populacije, a na ponovljenim merenjima na različitim uzorcima, dobijeni statistici će se i međusobno razlikovati. Ove procene su, dakle, skopčane sa određenim nivoom greške. Kolika je ta greška takođe možemo statistički proceniti i na osnovu nje možemo izgraditi interval poverenja oko statistika. Nakon toga, možemo sa određenim nivoom sigurnosti (obično 95 ili 99%) reći da se parametar populacije, prava vrednost merene osobine u populaciji, nalazi u okviru datog intervala poverenja. Međutim, ovo važi samo za probabilističke uzorke, ne i za namerne.

Iako su probabilistički uzorci u većini slučajeva najbolji, vrlo često nisu ostvarivi. Naime, za slučajno biranje tačno određenih jedinica populacije potrebno je posedovati „spisak“ njenih članova. Ovakve spiskove poseduju samo državni organi i po zakonima smeju ih upotrebljavati samo za svrhe za koje su takvi spiskovi pravljeni. Zainteresovani istraživači, bilo naučni ili komercijalni, ne mogu doći do ovakvih spiskova. Zato je značajan proboj u razvoju metoda uzorkovanja predstavljala pojava zonskih 6 (oblasnih) verovatnosnih uzoraka (engl. area probability sampling), koji su u anketna istraživanja ušli iz istraživanja u oblasti poljoprivrede (Groves, 2009). Ovakav vid uzorkova6

6

Za detalje o zonskom uzorkovanju videti odeljak 3.2.2.

UVOD

nja omogućio je verovatnosno uzorkovanje i u slučaju kada ne postoji spisak populacije u obliku liste ispitanika.

Razvoj modernih anketnih istraživanja može se posmatrati i kroz razvoj metoda prikupljanja podataka. U početku su ankete sprovođene primenom intervjua licem u lice. Šezdesetih godina XX veka dominantan način anketiranja postaju poštanske ankete. Ove ankete su bile znatno jeftinije od anketa licem u lice, ali zbog prirode medija na podatke je trebalo duže čekati. Širenje telefonske mreže omogućilo je porast broja anketa sprovedenih ovim putem. Istraživači iz oblasti marketinga među prvima su uvideli prednosti ovakvog načina sprovođenja anketa. Podaci su pristizali znatno brže nego kod poštanskih anketa, a cena ankete je bila još uvek manja nego u anketama licem u lice. Do devedesetih godina XX veka većina marketinških istraživanja u SAD bila je obavljana na ovaj način.

Naravno, ni telefonske ankete nisu bile savršene. Glavna mana ovog metoda prikupljanja podataka bila je i jeste činjenica da određene grupe stanovništva nisu posedovale (i ne poseduju) telefone i nisu mogle biti deo uzorka. Pojava računara, odnosno njihova sve veća dostupnost dalje je unapredila oblast anketiranja. Pored unapređenja u oblasti prečišćavanja i obrade prikupljenih podataka, napredak je ostvaren i u oblasti prikupljanja podataka. Postoje različiti oblici primene računara u prikupljanju podataka (engl. Computer Assisted Data Collection – CADAC) u anketama tipa licem u lice i telefonskim anketama, ali najveći proboj ostvaren je pojavom interneta i onlajn anketiranja. Ovakav način prikupljanja podataka postaje sve zastupljeniji. Jeftiniji je i od telefonskih anketa, a podaci su dostupni računarskoj obradi čim ispitanik završi odgovaranje. Pošto ovaj vid anketiranja omogućava logičku kontrolu toka ankete i odgovaranja ispitanika, mala je verovatnoća javljanja neodgovarajućih (nemogućih) odgovora. Podaci prikupljeni putem CADAC pristupa odmah se nalaze u bazi podataka i u najvećoj meri spremni su za obradu. Kada govori o razvoju modernog anketiranja (posebno u SAD), Grouvs (Groves, 2011) govori o tri razdoblja anketnih istraživanja. U prvom razdoblju, od 1930. do 1960, dolazi do razvoja metodologije anketnih istraživanja. U ovom periodu dolazi i do osnivanja institucija koje se bave anketiranjem u akademskom, vladinom i privatnom sektoru. U drugom razdoblju, od 1960. do 1990, dolazi do povećane primene anketnih istraživanja za potrebe vladinih organizacija, društvenih istraživanja i u marketingu. Poslednji period, od 1990. godine na ovamo, karakteriše razvoj različitih načina prikupljanja podataka, opadanje stope odgovora u anketama, opadanje kvaliteta okvira uzorkovanja te porast kontinuiranog prikupljanja procesnih podataka iz digitalnih sistema, posebno sa interneta.

Iako se, kako smo videli, različite vrste istraživanja mogu smatrati anketnim istraživanjima, ubuduće, kada budemo govorili o anketnim istraživanjima to će se odnositi na istraživanja: 1.) čiji je cilj dobijanje statistika, odnosno numeričkih pokazatelja koji za svrhu imaju opis nekih osobina populacije na koju se odnose, 2.) koja do

7

OSNOVE ANKETNIH ISTRAŽIVANJA

potrebnih informacija dolaze postavljanjem pitanja ispitanicima (jedinicama istraživanja) i 3.) koja se obavljaju na određenom delu populacije, odnosno na uzorku.

1.3. Vrste anketnih istraživanja

Klasifikacija anketnih istraživanja može se napraviti na osnovu različitih kriterijuma. Možemo ih podeliti na osnovu: namene, vrste podataka koje prikupljaju, cilja, metode prikupljanja podataka, vremenskog aspekta, populacije, područja obuhvata, organizacije koja ih sprovodi...

1.3.1. Namena

U zavisnosti od namene istraživanja, možemo razlikovati sledeće grupe anketnih istraživanja:     

marketinška medijska politikološka socioekonomska sociopsihološka

Marketinška istraživanja bave se potrošačkim ponašanjem i preferencijama. Npr. koji od ponuđenih proizvoda je bolji, da li biste kupovali neki proizvod ako bi promenio cenu ili pakovanje, koliko često kupujete neki proizvod ili koristite neke usluge.... Medijska istraživanja bave se gledanošću, slušanošću, čitanošću pojedinih medija, poverenjem u njih...

Politikološka istraživanja bave se stavovima ispitanika prema važnim društvenim pitanjima, poverenjem u određene političke ličnosti, stranke i organizacije. Takve su, na primer, predizborne ankete.

Socioekonomska istraživanja bave se materijalnim statusom ispitanika, njihovim obrazovanjem, zanimanjem i sl.

Sociopsihološka istraživanja bave se navikama ispitanika, verovanjima, vrednostima, stilom života...

1.3.2. Vrsta podataka baviti:

S obzirom na vrstu podataka koji se prikupljaju, anketna istraživanja mogu se

 sociološkim, ekonomskim i antropološkim svojstvima ispitanika  njihovim ponašanjem  njihovim stavovima i mišljenjima (Fajgelj, 2004).

8

UVOD

U prvu grupu podataka spadaju obeležja ispitanika poput pola, obrazovanja, zanimanja, verske pripadnosti, seksualnog opredeljenja, težine, visine... U drugu grupu spadaju podaci o svim ponašanjima ispitanika, bilo da se dešavaju sada, desila su se u prošlosti, ili je to nešto što ispitanik tek namerava da uradi (koliko često putuje, da li je u poslednjih pet godina kupio auto, da li namerava da izađe na izbore i sl.). U treću grupu podataka spadaju oni o stavovima i mišljenjima ispitanika (da li su za ulazak ili izlazak iz EU, za ili protiv prihvatanja izbeglica...). Treća grupa podataka predstavlja najtipičniju primenu anketa i ono što se još zove ispitivanje javnog mnenja.

1.3.3. Cilj

S obzirom na cilj, anketna istraživanja se još mogu podeliti na eksplorativna i konfirmativna.

Prilikom eksplorativnih istraživanja, istraživač ne zna puno o ispitivanoj pojavi i cilj ovakvog istraživanja je da stekne osnovni uvid i neka početna znanja o predmetu istraživanja. Rezultati ovakvih istraživanja su obično u vidu prosečnih vrednosti, frekvencija, procenata...

Kada su u pitanju konfirmativna istraživanja, istraživač ima neke polazne pretpostavke o predmetu istraživanja i želi da ih proveri, odnosno potvrdi ili opovrgne. U ovakvim istraživanjima rezultati su u obliku statističkih testova koji testiraju te hipoteze.

Ova podela je bitna i zbog činjenice da testiranje hipoteza vrlo često zahteva drugačije pristupe procesu uzorkovanja i veće uzorke koji omogućavaju primenu adekvatnih statističkih testova.

1.3.4. Metode prikupljanja podataka

Vrlo česta je i podela anketnih istraživanja s obzirom na primenjene metode prikupljanja podataka.       vlju (7).

Na taj način razlikujemo sledeće vrste anketnih istraživanja: licem u lice grupne ankete telefonske ankete poštanske ankete ankete sa ličnom dostavom upitnika internet ankete

O različitim metodama prikupljanja podataka biće više reči u posebnom pogla-

9

OSNOVE ANKETNIH ISTRAŽIVANJA

1.3.5. Nacrt Prednost anketnih istraživanja nad laboratorijskim eksperimentima je u tome što se posmatrana pojava ispituje u prirodnijem okruženju, dok veštački, laboratorijski uslovi, dovode u pitanje generalizabilnost nalaza istraživanja. S druge strane, upravo manji stepen kontrole koji postoji u prirodnim uslovima terenskog istraživanja dovodi u pitanje validnost zaključaka o kauzalnosti (Fajgelj, 2004; Visser, Krosnick, & Lavrakas, 2000). Upotreba eksperimenata u anketnim istraživanjima može nam ipak pružiti određen uvid u kauzalne odnose ispitivanih pojava. Prema tome, anketna istraživanja prema nacrtu možemo podeliti na eksplorativna ili opisna (engl. observational, descriptive) i eksperimentalna (Fink, 2003).

U eksperimentalnim anketnim istraživanjima postoje najmanje dve grupe ispitanika od kojih je jedna kontrolna, dok druga (ili više njih) prolazi neki tretman i naziva se eksperimentalnom. Pod grupama se podrazumevaju skupine ispitanika koje dele neko iskustvo ili pripadnost nekoj prirodnoj grupi (poput razreda, firme u kojoj rade...) U zavisnosti od načina razvrstavanja ispitanika u grupe možemo razlikovati eksperimentalne i kvazi-eksperimentalne nacrte. Ukoliko su ispitanici u grupe razvrstavani slučajnim izborom govorimo o eksperimentalnom nacrtu, odnosno o nacrtu sa ekvivalentnim grupama. Ekvivalentne grupe mogu biti rezultat slučajnog biranja ispitanika u grupe (randomizacija), ali i jednačenja grupa. Jednačenje grupa podrazumeva namerno razvrstavanje ispitanika u grupe na način koji bi trebalo da obezbedi ujednačenost grupa po relevantnim varijablama, odnosno po onim varijablama koje mogu uticati na ispitivanu (zavisnu varijablu) i/ili po samoj zavisnoj varijabli. Randomizacija obično daje bolje rezultate pošto za ovaj postupak nije nužno poznavati i meriti varijable koje bi mogle uticati na zavisnu varijablu, niti je potrebno imati mere same zavisne varijable pre istraživanja. U ovom slučaju oslanjamo se na principe verovatnoće i slučajno biranje. Kompletna randomizacija je trostepeni postupak (Fajgelj, 2004). Prvo se prostim slučajnim uzorkovanjem (odeljak 4.3.1.1) ispitanici biraju u uzorak. Zatim se, takođe slučajnim metodom, ispitanici izabrani u uzorak razvrstavaju u grupe. Na kraju se slučajnim biranjem određuje koja će grupa biti podvrgnuta eksperimentalnom tretmanu, a koja ne.

Kada je broj ispitanika koji je na raspolaganju istraživaču mali, jednačenje grupa će često dati bolje rezultate nego randomizacija. Što je broj varijabli po kojima je potrebno jednačiti grupe veći, potreban je veći uzorak pa se ova prednost jednačenja gubi. Ovo je primetno čim je broj varijabli po kojima je potrebno jednačiti grupe veći od 1 (Fajgelj, 2004). Jedna od varijanti postupka jednačenja grupa je da se ispitanici sortiraju po varijabli po kojoj se jednače. Zatim se sa vrha (ili dna) liste odabere onoliko ispitanika koliko je ujednačenih grupa potrebno formirati, pa se ti ispitanici slučajnom metodom razvrstaju u grupe. Postupak se ponavlja dok se ne iscrpi osnovni spisak ispitanika.

10

UVOD

Jednačenje je relativno lako dok se vrši po jednoj varijabli. Čim ga je potrebno izvršiti po više varijabli teže je pronaći ispitanike koji će biti ujednačeni po njima. Situacija se komplikuje i sa povećanjem broja nivoa varijabli po kojim se jednačenje vrši, ali i broja ekvivalentnih grupa koje je potrebno formirati. U svim ovim slučajevima potreban je veliki uzorak kao i kod randomizacije.

Ako članovi kontrolne grupe nisu slučajno birani niti su grupe jednačene, onda se radi o nacrtu sa neekvivalentnim grupama, odnosno o kvazi-eksperimentalnom nacrtu (Fink, 2003). Mogući su nacrti sa istorijskim kontrolnim grupama (engl. historical controls) u kojima se nalazi porede sa istorijskim podacima, odnosno podacima dobijenim na istraživanju nekih drugih ispitanika u prošlosti (tada su u pitanju ponovljena transverzalna istraživanja odnosno istraživanja trenda – videti odeljak 1.3.6).

Eksperimenti u okviru anketnih istraživanja se često upotrebljavaju u cilju evaluacije različitih postupaka i/ili instrumenata koji se koriste u samom procesu anketiranja, a sa ciljem njihovog unapređenja (Marsden & Wright, 2010). Eksperimenti u okviru anketnih istraživanja mogu se koristiti i za ispitivanje određenih društvenih pojava. Međutim, ovo nije tipična situacija. Anketna istraživanja su po pravilu neeksperimentalna. Npr. možemo ispitivati kakav će biti stav ispitanika prema vakcinaciji u zavisnosti od (različitih) pamfleta koji su im podeljeni pre same ankete ili u zavisnosti od toga ko prenosi (istu) poruku.

Kada ispitanici sami sebi služe kao kontrolna grupa onda imamo nacrte sa ponovljenim merenjima, odnosno longitudinalne nacrte. Ovakvi su nacrti koji uključuju ponovljena ispitivanja kohorti 7 i ispitivanja u kojima se od ispitanika traži retrospekcija. Međutim ovakvi nacrti spadaju u opisne. Opisni nacrti imaju za cilj da prikupe podatke o grupama koje već postoje. Ne kreiraju se nikakve nove grupe.

1.3.6. Vremenski aspekt

S obzirom na to da li su predmet anketnog istraživanja promene koje su nastale tokom vremena anketna istraživanja možemo podeliti na:  transverzalna (engl. cross-sectional)  longitudinalna

Transverzalna istraživanja ili studije preseka, bave se određenom pojavom u jednoj vremenskoj tački i istraživača ne zanimaju promene u istraživanoj pojavi koje su mogle nastati tokom vremena. Kohorte su subpopulacije ispitanika koji su prošli neko zajedničko iskustvo u određenom vremenskom periodu: završili školu ili diplomirali iste godine, učestvovali u ratu, dobili decu... 7

11

OSNOVE ANKETNIH ISTRAŽIVANJA

Kada su predmet istraživanja promene u posmatranoj pojavi ili pojavama koje nastaju tokom vremena, koriste se longitudinalna istraživanja. Na primer, može nas zanimati: kako se menja stav stanovništva prema pristupanju Evropskoj uniji iz godine u godinu; da li će se stavovi stanovništva prema uslugama iz oblasti zdravstvene zaštite promeniti kao rezultat sprovođenja reformi u zdravstvu; da li je došlo do promena u zaposlenosti stanovništva; da li se potrošačke navike stanovništva menjaju sa uvođenjem mera štednje i sl.

Za proučavanje promena u stavovima, navikama i ponašanjima ispitanika moguća su dva pristupa. Kada koristimo isti ili sličan upitnik u više transverzalnih studija na različitim uzorcima i u različitim vremenskim tačkama možemo pratiti trend promena posmatrane pojave. Istraživanja trenda ne moraju od početka biti zamišljena kao longitudinalna. Ako se istraživač naknadno doseti da bi bilo zanimljivo i korisno proveriti da li je došlo do promene u pojavi koja je ispitana u nekom ranijem istraživanju, on može istraživanje ponoviti na novom uzorku, upotrebom istog ili sličnog instrumenta. Ukoliko ima pristup podacima iz prethodnog istraživanja, rezultate može uporediti i doći do traženih zaključaka. Ovakva istraživanja se mogu temeljiti i na prethodnim istraživanjima drugih istraživača. U ovim slučajevima posebno su korisni repozitorijumi istraživačkih podataka kakvi se sve češće formiraju 8. Međutim, ovakva istraživanja ne nude nam uvek sve potrebne informacije. S obzirom da se radi o različitim uzorcima ispitanika, ona nam ne mogu odgovoriti na pitanja tipa: Da li je kod istih ispitanika došlo do promene u stavovima, ponašanju, statusu i sl? Ponovljenom transverzalnom studijom može se pokazati da nije došlo do značajne promene stope zaposlenosti. To može značiti da su oni koji su imali posao – posao zadržali, a oni koji ga nisu imali – nisu ga ni našli. S druge strane, moguć je i scenario da stopa zaposlenosti ostane približno ista, a da bez posla ostane veći broj ispitanika sa višim stepenom obrazovanja (recimo u oblasti prosvete), a da se zaposli približno jednak broj osoba sa niskim obrazovanjem (na nisko plaćenim radnim mestima u javnim preduzećima).

Takođe, promene u pojavi od interesa možemo ispitivati primenom transverzalnog pristupa, jednostavno pitajući ispitanike da se prisete kako su se ponašali (kakvi su im bili stavovi, mišljenje, osećanja) pre određenog vremena i da li se to sada promenilo. Na taj način možemo dobiti sliku o menjanju posmatrane pojave. Međutim, ona će biti bazirana na prisećanju ispitanika koje može biti vrlo neprecizno i varljivo (Groves, 2009).

Ako istraživača zanimaju ovakva pitanja (i odgovori), a želi što preciznije i što validnije odgovore, onda bi on trebalo da se opredeli za formu panel istraživanja. Panel istraživanja su istraživanja koja koriste isti ili sličan merni instrument (anketu) u više vremenskih tačaka (talasa) na istom uzorku ispitanika. Ovakav način istraživanja je često i jeftiniji jer je jeftinije ispitivanje u više navrata ponavljati na istoj adresi. Naime, panel istraživanje omogućava da se samo u prvom talasu, kada je potrebno obezbe-

Na primer: videti CESSDA ERIC (Consortium of European Social Science data Archives / European Research Infrastructure) vebsajt www.cessda.eu 8

12

UVOD

diti saradnju ispitanika, koristi pristup licem u lice koji je finansijski zahtevan. U ostalim talasima može se koristiti telefonska, anketa elektronskom ili klasičnom poštom, što znatno smanjuje troškove istraživanja.

Pored dobrih strana, panel istraživanja imaju i specifične probleme. S obzirom da se istraživanje ponavlja više puta na istom uzorku, javlja se problem sa doživljajem anonimnosti kod ispitanika. Iako su prilikom sprovođenja anketnih istraživanja ispitanici retko u potpunosti anonimni, u panel istraživanjima ovo postaje očigledno. Prilikom sprovođenja panel istraživanja ispitanike je teže uveriti u suštinsku anonimnost pošto istraživač može (ili mora) saznati njihova imena i posedovati njihove kontakt podatke.

Drugi problem je problem osipanja uzorka. Panel istraživanje se obavlja u više talasa. Neće svi ispitanici koji su učestvovali u prvom talasu pristati da učestvuju u narednim. S druge strane, neki od njih će se preseliti, iseliti, neki neće biti dostupni anketaru, a neki možda neće biti ni živi. Zbog toga, nakon poslednjeg talasa istraživač može završiti sa mnogo manje ispitanika koji imaju podatke za sve talase nego što je planirao. Zato pri prvom kontaktu ispitanike treba pitati za saglasnost da učestvuju u više talasa istraživanja (Fajgelj, 2004). Uprkos dobijenim saglasnostima, do osipanja uzorka će neminovno doći. Razlozi osipanja su nepredvidivi, ali se osipanje uzorka svakako može predvideti. Iz tog razloga preporučuje se da se prilikom planiranja uzorka to uračuna i odabere nešto veći broj ispitanika nego što je zaista potrebno. Na ruku istraživaču ovde ide činjenica da testovi bazirani na ponovljenim merenjima imaju manje standardne greške, odnosno veću snagu, pa je za isti nivo preciznosti potrebna manja veličina uzorka.

Međutim, osipanje ne mora da utiče samo na veličinu realizovanog uzorka. Kao što je rečeno, uzroci osipanja mogu biti različiti, ali najveći problem je kada je ono sistematsko, odnosno, povezano sa predmetom istraživanja. Tako, pored smanjenja realizovanog uzorka, osipanje može dovesti do značajnih poremećaja u njegovoj strukturi, pri čemu se realizovani uzorak može značajno razlikovati od planiranog i izgubiti željene karakteristike (doduše, ova razlika se može javiti i kod transverzalnih istraživanja).

Panel istraživanja mogu trajati godinama (pa i decenijama) 9. Protokom vremena ciljna populacija se menja i uzorak koji je u početku bio reprezentativan, protokom vremena više ne mora biti. Takođe, osipanje uzorka će uticati i na njegovu veličinu. Zato je korisno uzorak dopunjavati i delimično menjati.

Imajući to u vidu, zanimljiv je i koncept rotirajućih panel istraživanja. U ovakvim istraživanjima anketiranje se kao kod svih panela periodično ponavlja, pri čemu se iz uzorka u svakom talasu izbacuje deo uzorka i uvodi novi (Pfeffermann & Rao, 2010). Npr. Panel Study of Income Dynamics koja se sprovodi u SAD još od šezdesetih godina XX veka (Hofferth et al., 2016) 9

13

OSNOVE ANKETNIH ISTRAŽIVANJA

Jedan primer mogućih šema rotacije uzoraka na godišnjem nivou je Tabela 1. U primeru iz tabele anketa se ponavlja na mesečnom nivou, a svakog meseca se menja jedna šestina uzorka (redovi). Uzorak je inače podeljen na 16 delova (u1–u16), a svakog meseca u anketi učestvuje 6/16. Svaka šesnaestina uzorka učestvuje u 7 uzastopnih talasa (kolone) a zatim pauzira 12 (meseci), nakon čega ponovo učestvuje u anketi. Tabela 1 – Primer šeme rotiranja uzoraka

1 u1 u2 u3 u4 u5 u6

2 u7 u2 u3 u4 u5 u6

3 u7 u8 u3 u4 u5 u6

4 u7 u8 u9 u4 u5 u6

5 u7 u8 u9 u10 u5 u6

6 u7 u8 u9 u10 u11 u6

7 u7 u8 u9 u10 u11 u12

mesec 8 u7 u8 u9 u10 u11 u12

9 u13 u8 u9 u10 u11 u12

10 u13 u14 u9 u10 u11 u12

11 u13 u14 u15 u10 u11 u12

12 u13 u14 u15 u16 u11 u12

13 (1) u13 u14 u15 u16 u1 u12

(adaptirano prema: Pfeffermann & Rao, 2010)

Kao i kod standardnih panel istraživanja, između talasa kod kojih postoji preklapanje uzoraka javlja se pozitivna korelacija, što dalje utiče na smanjenje varijanse uzorkovanja, odnosno standardne greške procene promene (razlike) između dva talasa. Na taj način dobija se na preciznosti procene, odnosno snazi statističkih testova.

1.3.7. Populacija

Populaciju od interesa za anketna istraživanja mogu predstavljati različiti entiteti. Kada razmišljamo o populaciji prvo što nam padne na pamet su pojedinci, međutim, elementi ciljne populacije mogu biti različiti. To mogu biti:      

pojedinci domaćinstva preduzeća dani putovanja drugi događaji...

Jedna anketa može za cilj imati ispitivanje više različitih tipova entiteta.

Na primer, jedinice posmatranja (videti odeljak 3.2.1) jednog anketnog istraživanja mogu biti i domaćinstva i pojedinci...

1.3.8. Područje obuhvata

   

14

Prema području obuhvata anketna istraživanja mogu biti: regionalna nacionalna internacionalna kros-nacionalna

UVOD

Nacionalne ankete obuhvataju populaciju jedne zemlje, dok se regionalne odnose na neku zajednicu unutar te zemlje (recimo: Vojvodina, Šumadija, Novi Sad, Kraljevo...)

Internacionalna anketna istraživanja obuhvataju populacije više zemalja. Ovakva istraživanja su retko izvodljiva zbog nedostatka nadnacionalnih okvira uzorkovanja. Češće se sprovode u formi kros-nacionalnih istraživanja. U ovom slučaju rade se odvojena nacionalna istraživanja koja koriste iste/slične instrumente, metodologiju i daju uporedive rezultate i izveštaje (Gideon, 2012).

1.3.9. Organizacija koja sprovodi istraživanje

Kada se govori o organizaciji koja sprovodi istraživanje nekada se misli na organizaciju koja je odgovorna za organizovanje i sprovođenje anketnog istraživanja, a nekada na organizaciju koja je sponzor, odnosno naručuje i plaća za istraživanje.

S obzirom na organizaciju koja je zadužena za sprovođenje istraživanja, razlikujemo ankete koje organizuju:  nacionalna statistička služba/institut/zavod (u Republici Srbiji to je Republički zavod za statistiku Srbije – RZS)  akademske institucije (univerziteti, fakulteti...)  marketinške agencije  neprofitne organizacije

Naručioci anketnog istraživanja mogu biti razni, državni organi, nevladine organizacije, preduzeća, mediji, političke organizacije...

Moguće su i kombinacije različitih tipova naručilaca, ali i različitih organizacija koje sprovode anketna istraživanja, tako da ova podela nije čista.

Postoje mišljenja da su anketna istraživanja koje sprovode nacionalne statističke službe, akademske institucije i marketinške agencije tri zasebna sveta. U zvaničnoj statistici ključna reč je uzorkovanje i istraživanja se obično zasnivaju na probabilističkim uzorcima, dok marketinške agencije uglavnom koriste neprobabilističke uzorke 10. Razlika između akademskih i marketinških anketnih istraživanja je, prema nekim autorima (P. Smith, 2009), u različitim tipovima znanja koje poseduju stručnjaci iz ove dve oblasti. Dok stručnjaci iz oblasti marketinških istraživanja imaju praktična znanja, odnosno znaju kako da sprovedu anketno istraživanje, nedostaju im teorijska znanja. S druge strane, stručnjaci iz akademskih institucija imaju teorijska znanja, ali im nedostaju praktična. 10Državnim

zavodima su dostupni okviri uzorkovanja koji omogućavaju ovakav vid uzorkovanja, što nije slučaj sa marketinškim agencijama i akademskim ustanovama.

15

OSNOVE ANKETNIH ISTRAŽIVANJA 11

Zanimljivo je da stopa odgovora (ili neodgovora ) na anketu zavisi i od naručioca ankete. Istraživanja pokazuju da ispitanici radije pristaju da učestvuju u anketama iza kojih stoje akademske institucije i država, nego u onim koje sponzorišu komercijalne organizacije (Gideon, 2012).

1.4. Zašto anketno istraživanje? Bez obzira na tip anketnog istraživanja, za sva je zajedničko da pokušavaju da na osnovu malog dela populacije dođu do precizne procene parametara u okviru mogućnosti koje su definisane društvenim, ekonomskim i socijalnim okruženjem (De Leeuw et al., 2008).

Ankete se sprovode u raznim oblastima i sa različitim ciljevima. U oblasti naučnog istraživanja obično je cilj da se stekne uvid i prošire znanja o nekoj pojavi, o njenoj rasprostranjenosti i odnosu sa drugim pojavama, i tako obogati korpus naučnih znanja. U primenjenim oblastima cilj je da se na osnovu stečenih znanja pripremi plan delovanja i konačno sprovede neka akcija u vezi sa predmetom istraživanja. Takav je na primer slučaj u marketinškim istraživanjima, istraživanjima iz oblasti socijalne politike, ekonomije i nekim istraživanjima javnog mnenja (recimo, onim vezanim za izbore). Kao što je već rečeno, svako anketno istraživanje košta, neko manje neko više. Najviše košta anketno istraživanje koje nije bilo potrebno ili ono koje nije sprovedeno kako treba. pitanja:

Prilikom odlučivanja za anketno istraživanje prvo bi trebalo postaviti sledeća

1. Koje su nam informacije neophodne (ili mislimo da jesu)?

Da li je anketno istraživanje neophodno ili već raspolažemo podacima koji su nam potrebni da bismo mogli da zaključujemo o pojavi koja nas zanima? Nekada se istraživanje može obaviti na sekundarnim podacima. Razlika između primarnih i sekundarnih podataka je u tome postoje li ti podaci od ranije ili ne. Primarni podaci su oni koje istraživač prikuplja za potrebe aktuelnog istraživanja, a sekundarni oni koje je već prikupio neko drugi (ili sam istraživač) za neke druge potrebe. Sekundarni podaci se još nazivaju arhivski podaci. Prilikom opredeljivanja za istraživanje koje će koristiti sekundarne podatke, istraživač mora imati u vidu moguću pristrasnost ovih podataka, koja se može ispoljiti u vidu selektivnosti odlaganja i čuvanja ovih podataka, te reaktivnosti ispitanika u situaciji kada su podaci beleženi (Fajgelj, 2004). Takođe, sekundarni podaci ne moraju se u potpunosti poklapati sa varijablama (podacima) koje su nam potrebne. Tu je i pitanje tačnosti sekundarnih podataka. U zavisnosti od vrste sekundarnih podataka, odnosno od načina na koji su prikupljeni, i oni mogu patiti od istih grešaka kao i primarni podaci (poglavlje 5).

Termin „neodgovor“ koristimo za prevod engleskog termina „nonresponse“. Više o neodgovorima i samom terminu u poglavlju 8. 11

16

UVOD

2. Zašto su nam informacije potrebne? Koliko su nam bitni ti razlozi? Već je rečeno da svako anketno istraživanje ima cenu koja zavisi od različitih činilaca kao što su metod prikupljanja podataka, obim i sadržaj ankete, veličina uzorka... Prilikom odlučivanja za sprovođenje anketnog istraživanja trebalo bi razmotriti da li potrebne informacije možemo prikupiti na neki drugi način i da li su nam za ostvarenje našeg cilja potrebne baš sve informacije koje smo planirali da prikupimo. Takođe, ako se opredelimo za anketno istraživanje, bitno je da prikupimo sve neophodne informacije bez kojih ne možemo ostvariti ciljeve zbog kojih ga sprovodimo. Iako povećanje obima ankete povećava njenu cenu, dobijeni rezultati nam neće puno vredeti ako na osnovu njih ne ostvarimo cilj, odnosno ne dođemo do željenih saznanja. Razlog zbog kojeg planiramo sprovođenje ankete utiče na njenu opaženu cenu. Skupa anketa koja može dovesti do još veće dobiti, manje je skupa od jeftine na osnovu koje ne ostvarujemo nikakvu dobit.

3. Kako će različiti nalazi ankete uticati na eventualne odluke? Ovo je bitno kako bismo znali koja preciznost podataka je bitna. Nedovoljna preciznost rezultata anketnog istraživanja može dovesti do pogrešnih odluka. Potrebno je imati u vidu kakva može biti cena takvih pogrešnih odluka. Željena preciznost rezultata i varijabilnost ispitivane pojave presudno utiču na veličinu potrebnog uzorka, od koga u velikoj meri zavisi dizajn anketnog istraživanja.

Dakle, pre nego što krenemo u planiranje ankete morali bismo znati (bar okvirno): 1. ciljnu populaciju, odnosno populaciju čije parametre želimo da procenimo i 2. koje su to informacije koje želimo da prikupimo (moraju biti jasno definisane). Na osnovu toga možemo zaključiti da li je anketno istraživanje primereno za problem koji želimo da ispitamo.

Rej i Parker (Rea & Parker, 2014) zaključuju da je anketno istraživanje primerena metoda istraživanja kada:    

ne postoje adekvatni sekundarni podaci želimo da generalizujemo nalaze sa uzorka na populaciju ciljna populacija nam je dostupna podaci koje želimo da dobijemo su subjektivna mišljenja i stavovi pripadnika populacije (bazirani na samoizveštaju)

17

OSNOVE ANKETNIH ISTRAŽIVANJA

2. Faze anketnih istraživanja

Proces anketnog istraživanja možemo posmatrati iz dve perspektive. Prva je perspektiva merenja konstrukta, a druga perspektiva opisivanja populacije (Groves, 2009). Što se tiče merenja konstrukta, svaka anketa kreće definisanjem predmeta merenja (konstrukta), njegovom operacionalizacijom (definisanjem mera/pitanja), pa se preko odgovaranja ispitanika i uređivanja odgovora dolazi do željenih statistika. Konstrukt je ono što istraživač želi da izmeri. Iako konstrukt na prvi pogled može delovati kao nešto jasno i očigledno, on je često samo ideja koja nije u potpunosti definisana. Primeri predmeta merenja su: učestalost rizičnog ponašanja mladih, učestalost migracija stanovništva, zaposlenost... Istraživača može zanimati koliko ljudi u Republici Srbiji je zaposleno/nezaposleno. I konstrukt zaposlenosti može se različito definisati. Da li je zaposlen samo onaj koji radi na neodređeno vreme ili se kao zaposlenost računa i rad po ugovoru na određeno vreme? Ako se računa, da li se računaju ugovori kraći od 3 meseca ili ne? Da li je zaposlen neko ko radi samo honorarne poslove? Ako jeste, da li je bitna učestalost takvih poslova? Da li je zaposlen neko ko radi bez ugovora ili u neregistrovanim firmama? Da li je zaposlen neko ko ne prima platu? Da li je zaposlen neko ko je u toku prošle nedelje radio bar jedan dan i za to primio naknadu u novcu ili naturi?

Različite definicije konstrukta daće različite rezultate. Da bismo rezultate istraživanja mogli korektno preneti zainteresovanim stranama, konstrukt je potrebno jasno definisati i to navesti u izveštaju istraživanja. Na taj način korisnik rezultata će znati šta je tačno ispitivano.

Kako bi mogao biti izmeren konstrukt moramo operacionalizovati i, ukoliko je to moguće, definisati indikatore koji se mogu prevesti u konkretna pitanja. Cilj je napraviti mere koje će ga najbolje reprezentovati. Kada kažemo mere, obično se misli na pitanja koja vidi ispitanik, ali to mogu biti i drugi oblici prikupljanja podataka (poput opservacija anketara i raznih fizičkih merenja...) U istraživanju rizičnih ponašanja mladih ne bi bilo dovoljno pitati: „Koliko često se ponašate rizično?“ ili „Da li se ponašate rizično?“, pošto neka od ponašanja koja istraživač možda podvodi pod taj konstrukt, mladi ne doživljavaju kao takva. Zbog toga bi bilo bolje postaviti niz konkretnih pitanja koja ispituju indikatore te pojave, poput konzumiranja alkohola, zloupotrebe narkotika, pušenja, kockanja, rane seksualne aktivnosti...

Naredna faza je odgovaranje ispitanika. Ispitanik to može činiti prisećajući se ili donoseći neki sud. Može tražiti pomoć od drugih osoba (ukoliko ne može da se priseti),

18

FAZE ANKETNIH ISTRAŽIVANJA

a može i pogledati u dokumentaciju ukoliko je to potrebno. Ukoliko se anketa sastoji od pitanja sa ponuđenim odgovorima, ispitanik bira jedan od njih, a u pitanjima otvorenog tipa potrebno je da sam konstruiše odgovor (Groves, 2009). Nekada ispitanik neće ni dati odgovor, bilo zato što nema stav o predmetu pitanja ili ne može da se priseti, bilo zato što ne želi da odgovori na pitanje.

Nakon faze odgovaranja sledi faza pripreme podataka za analizu. U zavisnosti od načina prikupljanja odgovora nekada je odgovore potrebno korigovati i verifikovati. U ovoj fazi se kodiraju otvoreni odgovori (šifriranje) i koriguju nemoguće vrednosti. Takođe se proveravaju i malo verovatni odgovori. Analiza obično uključuje analizu autlejera i atipičnih sklopova odgovora. Ukoliko je potrebno (i moguće), ispitanici sa ovakvim sklopovima odgovora se ponovo kontaktiraju i traži se razjašnjenje. U ovoj fazi se proverava i procenat neodgovora ispitanika i donosi odluka da li će se nedostajući podaci nekako nadomestiti ili će se protokol ispitanika odbaciti i tretirati kao da nije popunio anketu. Ovo prevashodno zavisi i od broja pitanja na koje ispitanik nije odgovorio.

Ovu fazu je moguće olakšati u računarski podržanim modalitetima prikupljanja podataka pošto je u njima moguće ugraditi logičke kontrole (videti odeljak 7.8). Logička kontrola upitnika se sastoji u kontrolisanju opsega odgovora, selekciji narednih pitanja u zavisnosti od prethodnih odgovora i eventualnom kontrolom da li je ispitanik odgovorio na sva obavezna pitanja. U računarski podržanom modalitetu prikupljanja podataka sa ugrađenim logičkim kontrolama nemoguće je, na primer, da ispitanik koji je rekao da nikada nije koristio usluge i proizvode neke banke odgovara na pitanja koja se tiču kvaliteta tih usluga i proizvoda. Takođe, moguće je podsetiti ispitanika da nije odgovorio na neko pitanja i zamoliti još jednom da to učini (tzv. meki podsetnik / engl. soft reminder), ili čak sprečiti da pređe na naredno pitanje ako nije odgovorio na prethodno (tvrdi podsetnik / engl. hard reminder).

Tek na ovako uređenim podacima se rade statističke analize i računaju željeni statistici.

Kada je u pitanju opisivanje populacije, prvo je potrebno definisati ciljnu populaciju, a zatim definisati okvir uzorkovanja takav da omogući nacrt uzorkovanja koji će rezultirati reprezentativnim uzorkom. Dalje, u fazi terenskog rada potrebno je realizovati planirani uzorak. Zbog neodgovora nekada će biti potrebne naknadne korekcije u vidu ponderisanja i nadomeštanja nedostajućih podataka kako bi se popravio kvalitet anketnih pokazatelja. U zavisnosti od aktivnosti koje se sprovode, anketna istraživanja možemo podeliti u faze. U literaturi se može sresti više različitih podela, manje ili više detaljnih. Bler i saradnici (Blair, Czaja, & Blair, 2014) navode sledećih 5 faza: 1. 2.

Preliminarni nacrt i planiranje Kreiranje upitnika, pretest i pilot istraživanje

19

OSNOVE ANKETNIH ISTRAŽIVANJA

3. 4. 5. 11 faza:

Konačni dizajn Izbor uzorka i prikupljanje podataka Kodiranje podataka, konstrukcija datoteke sa podacima, analiza i konačni izveštaj

Rej i Parker (Rea & Parker, 2014), s druge strane, anketno istraživanje dele na

1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.

Identifikovanje problema i metoda istraživanja Utvrđivanje plana i budžeta istraživanja Uspostavljanje informacione baze Utvrđivanje okvira uzorkovanja Određivanje veličine uzorka i nacrta uzorkovanja Kreiranje anketnog instrumenta (upitnika ili intervjua) Pretest instrumenta i pilot istraživanje Izbor i obuka anketara Prikupljanje podataka (anketiranje) Kodiranje i unošenje podataka u računar Analiza podataka i priprema konačnog izveštaja

1. 2. 3. 4. 5. 6. 7.

Planiranje i nacrt istraživanja Prikupljanje podataka Unos podataka Priprema i prečišćavanje podataka Analiza Pisanje izveštaja Slanje izveštaja

Faze anketnih istraživanja su ovde prikazane kao razdvojeni koraci, ali u stvarnosti to nije zaista tako. One se u velikoj meri preklapaju, teku paralelno, a ponekad je potrebno vraćati se na prethodne korake i korigovati donete odluke. Ova preklapanja su najveća, a povratak na prethodne faze najčešći, pre nego što počne samo prikupljanje podataka, pa mislimo da je razumno sve korake koji prethode implementaciji ankete svrstati u jednu fazu, kako to u svojoj podeli čini Meir (Meir, 2006). Takođe, anketna istraživanja se sprovode sa ciljem koji može biti saznajni ili praktičan. U oba slučaja, anketno istraživanje će svoj konačni cilj ostvariti tek kada je izveštaj napisan i predočen onom ko na osnovu njega može da dela. Uzevši sve ovo u obzir, opredelili smo se da aktivnosti u sprovođenju anketnih istraživanja prikažemo prema Meirovoj podeli. Ova podela obuhvata 7 faza:

2.1. Planiranje i nacrt

Pre nego što krene primena ankete na terenu, odnosno prikupljanje podataka, potrebno je pažljivo sprovesti fazu planiranja i nacrta. Najveći troškovi ankete obično

20

FAZE ANKETNIH ISTRAŽIVANJA

su vezani za fazu prikupljanja podataka. Ako prethodno nije sve dobro isplanirano prikupljeni podaci mogu biti u manjoj ili većoj meri neupotrebljivi, a na osnovu njih neće biti moguće ostvariti ciljeve istraživanja, a uložena sredstva i vreme biće protraćeni.

Samu fazu planiranja i nacrta možemo podeliti u više koraka koji se, kao što je već rečeno, ne moraju sprovoditi sukcesivno, već se mogu odvijati simultano, a nekada i iterativno. Pre svega potrebno je definisati predmet i ciljeve, te kako će se informacije koristiti, sve vreme imajući u vidu resurse koji istraživaču stoje na raspolaganju. Pod resursima o kojima treba voditi računa podrazumevaju se materijalni resursi, vreme kojim raspolažemo, ali i ljudski resursi.

Anketno istraživanje ne mora imati samo jedan predmet istraživanja. Postoje i tzv. omnibus ankete koje uopšte nemaju specifičnu temu (Gideon, 2012). U takvim anketama se za potrebe više naručilaca prikuplja širok spektar podataka.

Svrha istraživanja može biti da se: opiše populacija, dobije povratna informacija od neke grupe (npr. od korisnika neke usluge, potrošača...), saznaju želje i potrebe ljudi, uporede različite grupe, testira neka hipoteza, ispitaju promene koje se dešavaju tokom vremena u stavovima pripadnika populacije, ispitaju promene u načinu poslovanja kompanija i slično (Blair et al., 2014; Rea & Parker, 2014; Thayer-Hart, Dykema, Elver, Schaeffer, & Stevenson, 2010).

Ako predmet istraživanja nije dovoljno poznat samom istraživaču (npr. radi se o naručenom istraživanju), nekada je potrebno prikupiti relevantne informacije od zainteresovane strane (naručioca) i onih koji su u problem upućeni. Ovo se može učiniti u obliku neformalne diskusije ili upotrebom fokus grupa. Kada je u pitanju nova pojava, nekada može biti neophodno da se obavi prethodno polustrukturisano posmatranje populacije, u kojem obučeni posmatrači sistematski beleže važne podatke (Rea & Parker, 2014). Predmet istraživanja može se definisati na razne načine, nekada uže – nekada šire. U anketnim istraživanjima (a i bilo kojim drugim) istraživač gotovo uvek mora da pravi kompromise. U zavisnosti od resursa i znanja kojima istraživač i njegov tim raspolažu, vrlo često će morati da odustane od idealnog cilja i nacrta istraživanja. Na primer, istraživač može želeti da obavi istraživanje stavova prema abortusu na opštoj populaciji primenom ličnog intervjuisanja licem u lice na stratifikovanom slučajnom uzorku. U toj nameri ga može sprečiti kratak vremenski rok, pa se može opredeliti da promeni metod prikupljanja podataka i izabere telefonsku anketu kod koje faza prikupljanja podataka traje kraće. Međutim, ukoliko ne poseduje uređaje i softver potreban za telefonsku anketu i taj plan se može izjaloviti.

Ili, recimo da istraživač ima dovoljno vremena, ali da je ograničavajući faktor novac (što vrlo često jeste). Istraživač se može opredeliti za poštansku anketu koja je jeftinija, ali ukoliko ne poseduje odgovarajući spisak populacije (sa imenima i adresama ispitanika) ni stratifikovano slučajno biranje neće biti moguće ili će biti znatno otežano.

21

OSNOVE ANKETNIH ISTRAŽIVANJA

Prilikom definisanja ciljeva istraživanja trebalo bi biti što specifičniji. Pri tome potrebno je imati u vidu kakve analize su potrebne, kakvi izveštaji će biti rezultat istraživanja i za čega će nalazi biti korišćeni. Ako se anketa sprovodi sa ciljem unapređenja prodaje nekog proizvoda ili usluge, onda bi cilj trebalo da bude definisan na način koji omogućava što preciznije određivanje činilaca koji će do toga dovesti.

Ukoliko želite da saznate šta će uticati na to da korisnici jednog operatera mobilne telefonije (A) pređu kod drugog operatera (B), nije dovoljno definisati cilj samo tako. Mnogo je bolje definisati specifične ciljeve poput: „Da li će smanjenje cene pretplate uticati na to da korisnici pređu kod operatera B?“, „Da li će se korisnici češće odlučivati da pređu kod operatera B, ako im ovaj ponudi neograničene minute za razgovor?“, „Da li će se korisnici češće odlučivati da pređu kod operatera B, ako im ponudi neograničen internet za određene servise?“, „Da li će se korisnici češće odlučiti da pređu kod operatera B ako im ponudi dva besplatna servisa?“ i tako dalje.

U principu, anketni upitnik ili intervju bi trebalo da budu što kraći, ali takav da prikupi sve potrebne podatke koji će omogućiti ostvarivanje ciljeva ankete. Specifični ciljevi omogućavaju istraživaču da zna šta sve treba da pita ispitanike, odnosno koja pitanja je potrebno da im postavi. Način definisanja ciljeva anketnog istraživanja sličan je određivanju predmeta merenja i njegovoj operacionalizaciji prilikom konstrukcije psiholoških testova. Razlika je u tome što psihološki test obično ima jedan predmet merenja, dok ih anketa može imati više. Ako je naučno istraživanje u pitanju, u fazi planiranja bi trebalo definisati i određene hipoteze, odnosno očekivanja koja postoje u vezi sa rezultatima. Neočekivani rezultati, posebno oni koji su u suprotnosti sa hipotezama ili odudaraju od uobičajenih nalaza iz prethodnih sličnih istraživanja, nekada mogu biti signal da postoji greška u sprovođenju ankete.

Već je rečeno da bi prilikom planiranja anketnog istraživanja trebalo voditi računa i o tome kako će se rezultati koristiti. Ako je cilj ankete samo da se stekne neki početni uvid u ispitivanu pojavu ili opiše neka populacija, istraživaču neće biti potrebna ista preciznost kao za istraživanje na osnovu kojeg će biti donošene odluke koje mogu imati značajne finansijske ili posledice druge prirode. Od potrebne preciznosti može dalje zavisiti i veličina uzorka, ali i izbor metode uzorkovanja, a posredno i metode prikupljanja podatka i druge komponente ankete. Ciljevi anketnog istraživanja mogu se menjati u toku procesa planiranja.

U fazi pripreme, istraživač se opredeljuje i za metod prikupljanja podataka (licem u lice, telefonska anketa, poštanska anketa, internet anketa...). Metod prikupljanja podataka zavisiće od ciljeva istraživanja, složenosti podataka koje je potrebno prikupiti, vremena raspoloživog za sprovođenje ankete, raspoloživih resursa, ciljne populacije... Ovo je složeno pitanje i biće mu posvećeno posebno poglavlje (7). Kada smo definisali ciljeve istraživanja, potrebno je utvrditi budžet istraživanja i da li nam on dozvoljava da prikupimo sve željene i potrebne podatke, te da to učinimo

22

FAZE ANKETNIH ISTRAŽIVANJA

na način koji smo planirali. Dakle, potrebno je utvrditi koliko će istraživanje (kakvo smo planirali) koštati i da li imamo sredstava da ga sprovedemo na planirani način. U slučaju da nema dovoljno sredstava, istraživač može pokušati da ih nekako pribavi, ali češće će modifikovati (redukovati) ciljeve ili odabrati jeftiniji metod prikupljanja podataka 12. Prilikom definisanja budžeta istraživanja dobro je uvek „predvideti nepredvidivo“, odnosno računati da će postojati nepredviđeni troškovi. Anketno istraživanje (i bilo koje drugo) često će biti skuplje nego što je istraživač planirao.

Slična situacija je i sa vremenskim planom istraživanja. Prilikom planiranja anketnog istraživanja potrebno je definisati koliko će istraživanje trajati i kada će rezultati biti dostupni. Dobro je odrediti vremenske okvire (raspored) za svaku od faza istraživanja, kako bi bilo moguće da se prati napredak i reaguje ako postoji zaostajanje. Prilikom planiranja vremenskog okvira važno je da istraživač ne vodi računa samo o vremenu potrebnom za sprovođenje pojedinih faza istraživanja, već i o datumima kada bi se te faze odigrale. Na primer, nije svejedno da li će faza terenskog rada, odnosno prikupljanja podataka pasti za vreme praznika i kolektivnih godišnjih odmora ili ne. Ukoliko se ovo poklopi odziv može biti umanjen i zahtevati produženje vremenskog okvira anketnog istraživanja kako bi se taj nedostatak nadomestio.

Vreme potrebno za anketno istraživanje u najvećoj meri zavisi od metoda prikupljanja podataka. Neke metode imaju brži povrat podataka 13 (licem u lice, telefonske ankete, grupne ankete...), a neke sporiji (poštanske i neke internet ankete). Nakon prikupljanja podataka, njih je potrebno učiniti dostupnim računarskoj obradi, prečistiti... Ova faza se značajno može skratiti primenom računarski podržanih metoda.

Vreme potrebno za sprovođenje anketnog istraživanja zavisiće i od toga da li postoji gotov upitnik ili ga je potrebno kreirati. Ako postoji gotov upitnik vreme potrebno za istraživanje biće znatno kraće. Kreiranje upitnika može se skratiti preradom nekog postojeće sličnog upitnika ili recikliranjem proverenih pitanja iz ranijih upitnika. Kao i kod planiranja budžeta istraživanja, i u planiranju vremenskog okvira istraživanja treba računati na nepredviđena kašnjenja. Istraživanje će često trajati duže nego što je planirano.

Takođe, u fazi pripreme potrebno je definisati ciljnu populaciju. Ciljna populacija je deo populacije o kojem želimo da donosimo zaključke, odnosno populacija na koju želimo da generalizujemo rezultate koje dobijemo istraživanjem na uzorku. Rekli smo da se anketno istraživanje po pravilu sprovodi na uzorku iz razloga ekonomičnosti ili zbog nemogućnosti ispitivanja cele populacije. Od odluke šta je ciljna populacija zavisiće i druge faze i komponente anketnog istraživanja, poput uzorkovanja, osobina upitnika i izbora metode prikupljanja podataka.

Najveći troškovi anketnih istraživanja vezani su za prikupljanje i unos podataka (Meir, 2006). 13 Misli se na vreme za koje je potrebno da se prikupe podaci od ispitanika. 12

23

OSNOVE ANKETNIH ISTRAŽIVANJA

Ako istraživač planira da ispita mlađu decu onda mora prilagoditi dužinu upitnika (skratiti ga) pošto deca teško mogu da održe koncentraciju duže vremena. Pored dužine upitnika mora se prilagoditi i složenost pitanja i rečnik koji se koristi. Od metoda prikupljanja podataka trebalo bi izbegavati one koji zahtevaju čitanje, a ni telefonska anketa nije primerena. S druge strane, ako se radi o starijoj penzionerskoj populaciji, dužina ankete nije problem, ali bi recimo, trebalo izbegavati žargon. Od metoda prikupljanja podataka trebalo bi izbegavati internet ankete i štampane upitnike. Primerenija bi bila anketa licem u lice, kao i u slučaju istraživanja kod dece. Kod istraživanja populacije zaposlenih u zanimanjima kod kojih se po prirodi posla često putuje i/ili radi po smenama, sam izgled upitnika ne bi trebalo da bude problem, ali od metoda prikupljanja podataka bi bile primerenije one koje ispitanicima dozvoljavaju da ih popune kada to oni žele i mogu. Pošto je takve ispitanike teže naći kod kuće, primerene metode bi mogle biti poštanska ili internet anketa.

Prilikom određivanja ciljne populacije potrebno je voditi računa i o tome kakvi spiskovi populacije su dostupni i da li se na osnovu njih može obaviti kvalitetno uzorkovanje. Izbor spiska populacije zavisi i od izbora, odnosno željene metode prikupljanja podataka – i obrnuto. Dostupni spiskovi populacije ograničiće istraživača u izboru metode prikupljanja podataka. Ako se istraživač odluči za onlajn anketu za koju će pozivi biti poslani elektronskom poštom, mora posedovati spisak koji sadrži ažurne elektronske adrese ispitanika. Ukoliko ne poseduje takav spisak populacije, najverovatnije će morati da se opredeli za drugu metodu prikupljanja podataka.

U fazi pripreme i planiranja potrebno je isplanirati i odabrati uzorak. Pre svega, u zavisnosti od ciljeva istraživanja, planirane primene rezultata, varijabilnosti ispitivane pojave i odabranog načina uzorkovanja, potrebno je odrediti i potrebnu veličinu uzorka. Već smo rekli da se za anketna istraživanja ne može jednostavno reći „što veći uzorak – to bolje“. Premali uzorak neće omogućiti dovoljnu preciznost za generalizaciju na populaciju. S druge strane, preveliki uzorak je bacanje para i vremena (a vreme je opet novac).

U većini anketnih istraživanja bitna je cena njegovog sprovođenja. Povećanje veličine uzorka kod većine metoda prikupljanja podataka povećaće troškove ankete (najmanje u internet anketama), a uticaće i na produženje vremena potrebnog za sprovođenje ankete. Zato je potrebno odrediti optimalnu veličinu uzorka. To je ona veličina uzorka koja je dovoljna da postignemo željenu preciznost odnosno marginu greške uz što manje troškova (videti poglavlje 4.2). Koliko će to zaista biti zavisi pre svega od željene preciznosti rezultata i varijabiliteta ispitivane pojave. Osim ovih činilaca na potrebnu veličinu uzorka može uticati i način uzorkovanja (posredno – preko uticaja na varijabilnost distribucije uzorkovanja, odnosno standardnu grešku). Na primer, za istu veličinu uzorka rezultati će biti precizniji ako je uzorak nastao stratifikovanim slučajnim biranjem, a ne prostim slučajnim biranjem (Fajgelj, 2004). S druge strane, rezultati dobijeni na uzorku nastalom slučajnim klaster biranjem biće manje precizni upravo zbog uticaja ovog načina uzorkovanja na varijabilitet distribucije uzorkovanja.

24

FAZE ANKETNIH ISTRAŽIVANJA

O određivanju potrebne veličine uzorka biće više reči u poglavlju o uzorkovanju (poglavlje 4). Na kraju, u ovoj fazi može biti izabran uzorak ili definisana procedura njegovog biranja u fazi terenskog rada.

Bitna odluka koju istraživač mora da donese u pripremnoj fazi anketnog istraživanja je i odluka o metodu prikupljanja podataka. Metod prikupljanja podataka mora biti prilagođen ciljnoj populaciji, osobinama uzorka, dostupnim okvirima uzorkovanja, karakteristikama upitnika, osetljivosti teme, ali naravno i raspoloživim sredstvima, novcu, vremenu. Ovoj temi je posvećeno posebno poglavlje (poglavlje 7).

Uporedo sa odlukama o načinu uzorkovanja, potrebnoj veličini uzorka i izborom metoda prikupljanja podataka, konstruiše se i anketni upitnik/intervju. Preporuka u vezi sa konstrukcijom upitnika sa kojom se svi slažu je da pitanja moraju biti jasna i nedvosmislena. Ne smeju pitati više stvari odjednom, a moraju biti formulisana tako da ih svi ispitanici (ili bar velika većina) razume na isti način. Ukoliko želite da ispitujete stavove prema mučenju životinja, ispitanike možete pitati „Da li volite da posećujete svinjokolje?“. Neki ispitanici mogu odgovoriti sa „da“ na ovo pitanje, zato što zaista vole da gledaju nasilje nad životinjama. Drugi mogu odgovoriti sa „da“ zato što vole socijalni aspekt ovih događaja, dok treći mogu odgovoriti na isti način jer cene njegove gastronomske aspekte. Tri grupe ispitanika su isto pitanje razumele na tri načina, a isti odgovori se odnose na tri različite stvari (jedni vole nasilje nad životinjama, drugi da se druže, a treći da jedu).

Ukoliko ispitanici ne razumeju isto pitanje na isti način postoji problem sa njegovom validnošću. Ono ne meri ono što bi trebalo da meri.

Prilikom organizacije istraživanja, istraživači često osećaju potrebu da pitaju sve što ih zanima. Međutim, postoje mišljenja da dužina upitnika utiče na stopu neodgovora, ali ovakva mišljenja nisu u dovoljnoj meri empirijski potkrepljena (Bogen, 1996). Verovatnije je da dužina anketnog upitnika ima statistički značajan efekat na stopu nekompletnih upitnika i da to zavisi i od metode prikupljanja podataka. Ovaj efekat nije značajan kod onlajn anketa, marginalno je značajan u telefonskim anketama, a značajan je u poštanskim anketama (Bautista, Ghandour, & Croen, 2015; Sahlqvist et al., 2011). Dužina upitnika, osim na odbijanje učešća ili prekidanje popunjavanja ankete, može uticati i na kvalitet odgovora. Kod dužih upitnika ispitanici pred kraj postaju nepažljivi i manje motivisani, a odgovori na pitanja iz grupa stavki koje imaju istu skalu odgovora imaju manju varijansu (Galesic & Bosnjak, 2009). Kvantitet može ići nauštrb kvaliteta odgovora. Odgovori na pitanja pred kraj predugog upitnika mogu biti manje validni i više govoriti o motivaciji i pažljivosti ispitanika, a manje o predmetu merenja. Ako je potrebno birati između većeg broja nevalidnih i manjeg broja validnih odgovora – izbor se sam nameće. Zaključci na osnovu nevalidnih odgovora biće svakako pogrešni, a njihov veći broj i grešku će činiti većom. Upitnik nije gotov kada je popunjen pitanjima. Pre primene na uzorku potrebno je sama pitanja proveriti i ukoliko postoje problemi, bilo na strani ispitanika ili na strani anketara, trebalo bi ih modifikovati. Prvi korak je pretest na manjoj grupi ispita-

25

OSNOVE ANKETNIH ISTRAŽIVANJA

nika koji mogu biti i saradnici. Povratne informacije dobijene pretestom mogu ukazati na problematična pitanja (nerazumljiva, dvosmislena, nepotrebna, ona na koje je nemoguće odgovoriti). Nakon eventualnih korekcija potrebno je obaviti pilot istraživanje na manjem broju ispitanika (20–50) koji su slični populaciji koju nameravate da ispitujete. U pilot istraživanju se ne proveravaju samo pitanja i upitnik, već i anketari, metodologija prikupljanja podataka... Pilot istraživanje je nekad potrebno ponoviti, ukoliko su izmene na osnovu prvog pilot istraživanja bile značajne. U svakom slučaju, mnogo je bolje i jeftinije ponavljati pilot istraživanja, nego potrošiti sredstva namenjena prikupljanju podataka na upitnik koji neće dati podatke koji su nam potrebni. Konstrukciji upitnika, kao vrlo značajnoj temi, će takođe biti posvećeno posebno poglavlje (poglavlje 6).

U pripremnoj fazi anketnog istraživanja potrebno je izabrati i obučiti anketare ukoliko ih metod prikupljanja podataka predviđa. Za anketare je neophodno da tečno čitaju, imaju odgovarajuće komunikacijske sposobnosti, da su spremni i mogu da rade u različitim smenama, a sve više je potrebno i da se snalaze u radu sa računarima. Veliki plus je ako imaju neka znanja i razumeju metodologiju istraživanja u društvenim naukama. U svakom slučaju, anketare je potrebno obučiti i upoznati sa ciljevima istraživanja, tehnikom postavljanja pitanja, razjašnjavanja neadekvatnih odgovora, načinom beleženja odgovora i administracijom ankete (videti poglavlje 8).

Čak i ako metod prikupljanja podataka ne predviđa anketare, potrebno je izabrati i obučiti ljude koji su zaduženi za slanje poziva za anketu i podsetnika elektronskom ili običnom poštom (ukoliko se radi o ovim modalitetima prikupljanja podataka).

Iz svega prethodno rečenog, lako je zaključiti da je pravilno sprovedena pripremna faza ključna za uspešno sprovođenje anketnog istraživanja. Ona stvara preduslove za uspešno prikupljanje podataka i njihovu kasniju analizu (ali ih naravno ne garantuje).

2.2. Prikupljanje podataka

Za fazu prikupljanja podataka moglo bi se reći da je najbitnija faza anketnih istraživanja. Doduše, to bi se moglo reći za svaku fazu, ali kako je ova faza često vremenski i finansijski najzahtevnija, greške napravljene u njoj teško se mogu korigovati. Čak i kada su korekcije moguće, one traju i koštaju.

Zato je bitno postarati se da ova faza protekne što je više moguće u skladu sa planom. Međutim, ako se istraživač može na nešto osloniti, to je činjenica da će u svakom anketnom istraživanju biti nepredviđenih i neplaniranih problema. Stoga je jedna od najbitnijih preporuka istraživačima: „Očekujte neočekivano“. U svakom slučaju, prilikom planiranja faze prikupljanja podataka potrebno je (ili bar dobro) predvideti finansijske i vremenske rezerve za nepredviđene probleme.

26

FAZE ANKETNIH ISTRAŽIVANJA

To nas vraća na fazu planiranja i nacrta istraživanja. Ukoliko su greške koje se tiču faze prikupljanja podataka napravljene u samoj fazi planiranja (ako su donete pogrešne odluke), korektno sprovođenje planiranog neće ispraviti greške. Za uspešno obavljanje faze prikupljanja podataka potrebno je obezbediti sva potrebna sredstva i resurse. Ukoliko je planirano da anketa bude sprovedena licem u lice ili kao telefonska anketa sa učešćem anketara, pre započinjanja same faze terenskog rada potrebno je obezbediti dovoljan broj obučenih anketara koji će omogućiti sprovođenje ankete po željenoj dinamici i u zadatom vremenskom okviru.

Kontrola rada anketara je takođe bitna komponenta koja će obezbediti da faza prikupljana podataka prođe kako treba. Za to je potrebno obezbediti obučene supervizore i potrebna tehnička sredstva (videti odeljak 9.3).

Takođe, potrebno je obezbediti sredstva koja će omogućiti anketarima da kontaktiraju potencijalne ispitanike. To mogu biti finansijska sredstava namenjena putnim troškovima anketara ili oprema za telefonsko anketiranje. Ako je predviđeno računarski podržano prikupljanje podataka, potrebno je obezbediti sve hardverske i softverske uslove koji će omogućiti da anketa protekne u skladu sa planom. Onlajn anketiranje je sve popularnije. Najčešće podrazumeva anketni upitnik postavljen na nekoj web adresi i slanje poziva ispitanicima putem imejla ili eventualno na neki drugi način. Prilikom ovakvih istraživanja potrebno je voditi računa o raznim stvarima. Npr. ukoliko se pozivi na anketu šalju elektronskom poštom valja voditi računa da oni od strane spam filtera ne budu prepoznati kao spam (neželjena pošta) i eliminisani.

Potrebno je imati ljude koji su obučeni za slanje ili nadziranje slanja poziva i podsetnika, proveru odbijenih (engl. bounced) i nepostojećih imejl adresa, proveru odgovora ispitanika... Osim toga, anketu je potrebno postaviti na server koji će omogućiti da istovremeno veći broj ispitanika odgovara na nju, a da to ne izazove njegovo preopterećenje. Sam istraživač može na to uticati slanjem poziva u talasima, a ne odjednom svim ispitanicima.

Ako su obezbeđena potrebna sredstva za sprovođenje faze prikupljanja podataka, potrebno je obezbediti i konstantnu kontrolu sprovođenja ankete. Na ovaj način istraživač će znati da li se sve odvija po planu ili ne. Ova kontrola ne podrazumeva samo kontrolu rada anketara već i kontrolu funkcionisanja kompletne metodologije prikupljanja podataka, instrumenta, konstantno praćenje stope odgovora (kako na nivou instrumenta tako i na nivou pojedinačnih pitanja)... Na ovaj način istraživač će biti u mogućnosti da reaguje na vreme, pre nego što budu nepovratno utrošena sredstva i vreme koje je imao na raspolaganju. Svim navedenim činiocima biće posvećena pažnja u poglavljima koja se na njih odnose. Ovde ćemo samo reći da posebnu pažnju treba pokloniti neodgovorima (videti poglavlje 8 i odeljak 5.3). Ukoliko su oni sistematski povezani sa predmetom istraživanja mogu dovesti do pristrasnih pokazatelja i samim tim do pogrešnih zaključaka i predviđanja (kao u primeru istraživanja koje je sproveo Literary Digest).

27

OSNOVE ANKETNIH ISTRAŽIVANJA

2.3. Unos podataka U fazi unosa podataka, oni se čine dostupni računarskoj obradi, odnosno pretvaraju se u oblik pogodan za statističku analizu. Ovo se pre svega odnosi na podatke prikupljene klasičnom metodom papir-olovka.

Faza unosa se može učiniti nebitnom, ali na nju treba obratiti pažnju pošto i ona može biti izvor grešaka. Kako bi greške iz ovog izvora bile što manje, preporučuje se da unos rade profesionalci i da se vrši kontrola unosa upotrebom maski za unos i dvostrukim unosom (o tome će biti više reči u odeljku 10.2). Ukoliko se unos vrši bez kontrole, podatke je naknadno potrebno prečistiti. U ovoj fazi se može obavljati i kodiranje odgovora i zatvaranje pitanja sa otvorenim odgovorima. Pre samog unosa, ali i nakon što su podaci uneti, upitnici (protokoli ispitanika) se pregledaju i eliminišu se nepotpuni (oni koje nije moguće ili nije isplativo kompletirati).

Unos se može obavljati i računarski podržanim putem, optičkim čitanjem specijalno pripremljenih formulara za odgovore.

Ukoliko se anketiranje sprovodi računarski podržanim modalitetom, faza unosa podataka, troškovi i greške koje mogu nastati tom prilikom mogu se skoro u potpunosti izbeći. U računarski podržanom prikupljanju podataka podaci se beleže u računar u trenutku dok ispitanik odgovara, bilo da odgovore upisuje sam, birajući ponuđene opcije, ili to za njega čini anketar koji je prisutan.

2.4. Uređivanje i ponderisanje podataka

Fazu unosa sledi faza uređivanja i prečišćavanja podataka. U ovoj fazi vrši se kontrola konzistentnosti odgovora, koriguju nemogući ili nedosledni (nekonzistentni) odgovori, a ukoliko ih nije moguće korigovati klasifikuju se kao nedostajući. Upotrebom računarski podržanog prikupljanja podataka konzistentnost odgovora može se kontrolisati već tokom samog procesa anketiranja. Softver za anketiranje može kontrolisati tok ankete i ispitanicima postavljati samo ona pitanja na koja bi ispitanik trebalo da odgovara (npr. ispitanika koji nema motorno vozilo nećemo pitati koje benzinske stanice imaju najbolje gorivo). Takođe, softver može kontrolisati da li ispitanik daje odgovore u mogućem rasponu i da li su podaci koje daje odgovarajućeg tipa (brojevi, reči, web adrese...). U ovoj fazi mogu se izračunavati i izvedeni pokazatelji koji nastaju kao kombinacije, kategorizacije, klasifikacije (...) podataka dobijenih od ispitanika. Mogu se računati ukupni ili prosečni skorovi ukoliko u anketi postoje multiajtemske mere. Takođe, u ovom koraku može se raditi i ujednačavanje skala na kojima su procenjivani različiti objekti u anketi kako bismo postigli njihovu uporedivost (Meir, 2006).

28

FAZE ANKETNIH ISTRAŽIVANJA

U ovoj fazi podaci se mogu transformisati i ukoliko je to potrebno – ponderisati. Takođe, u ovom koraku mogu se nadomeštati nedostajući podaci. Više o svim ovim postupcima u poglavlju 9.4.1.

2.5. Analiza

Moglo bi se reći da celokupno anketno istraživanje vodi ka ovoj fazi. Nakon što smo prikupili i prečistili podatke sledi njihova analiza. Ona nam omogućava da na osnovu podataka izvedemo zaključke i donesemo informisane odluke.

Statističke analize uobičajeno obuhvataju deskriptivne pokazatelje koji se tiču distribucije, ukupnog broja, procenata, mera centralne tendencije, raspršenja i intervala poverenja 14. Iako se deskriptivni pokazatelji često smatraju „manje vrednim“, mora im se ukazati dužna pažnja. Pokazatelji distribucije, osim što nam govore o osobinama posmatrane populacije, omogućavaju da se upoznamo sa podacima i da odlučimo koje još statističke modele možemo primeniti i da li je potrebno pre toga transformisati podatke. Osim deskriptivnih mogu se koristiti metode inferencijalne statistike, odnosno analize koje omogućavaju utvrđivanje povezanosti među varijablama, razlika među grupama, predviđanja ishoda itd.

Sama analiza podataka, ako se obavlja temeljno, može biti vremenski zahtevna. Za njeno sprovođenje potrebno je odabrati softver koji je fleksibilan i omogućava beleženje sprovedenih analiza i njihovo ponavljanje. Poželjno je da statistički softver ima nešto što se, recimo, u R-u zove „istorija“ („history“) ili u IBM SPSS Statistics (SPSS) „dnevnik“ („journal“). U istoriji i dnevniku beleže se izvršene statističke analize sa svim zadatim parametrima. Obavljene analize beleže se u vidu tekstualnih komandi (sintakse), pa ih je moguće ponoviti u svakom trenutku na istim, dopunjenim, ili izmenjenim podacima (npr. na uzorku iz pilot istraživanja i na konačnom uzorku). Takođe, moguće je analize korigovati i ponoviti u izmenjenom obliku. Čak i ako nemamo nameru da analizu ponavljamo, na ovaj način nam ostaje trag o izvršenim analizama i njihovim parametrima.

Statističko okruženje R (R Core Team, 2019) je upravo i namenjeno za rad iz komandne linije. Analitičar piše skript analize koji se naknadno izvršava. Iako se možda čini lakšim kliktati na menije i „dugmiće“, rad iz komandne linije je zapravo brži i fleksibilniji. Čak i u SPSS-u, koji je pre svega namenjen za rad kroz grafički korisnički interfejs (GUI), neke opcije analiza dostupne su samo kroz sintaksu. Ne postoji prepreka da u SPSS-u celu analizu obavite kroz pisanje sintakse. Kasnije ćete saznati da širina polovine intervala poverenja predstavlja čuvenu marginu greške, koja se često pominje u izveštajima o istraživanjima, naročito onim politikološkim, i najčešće u jeku izbornih kampanja. Ovo je bio spojler. ;) 14

29

OSNOVE ANKETNIH ISTRAŽIVANJA

2.6. Pisanje izveštaja o rezultatima Pisanje izveštaja je faza koja se nastavlja na fazu analize podataka. Nalaze do kojih smo došli u prethodnoj fazi potrebno je na razumljiv i pristupačan način predočiti krajnjem korisniku informacija. Izveštaj treba prilagoditi onome kome je namenjen. Ako krajnji korisnik nalaza poseduje zavidno znanje iz statistike i metodologije, moguće je izveštaj napisati koristeći stručnu i tehničku terminologiju. Međutim, to najčešće nije slučaj i u izveštaju je obično potrebno krajnjem korisniku objasniti šta znače konkretni brojevi, procenti, proseci, variranja, intervali poverenja, razlike i sl. Objašnjenja moraju biti prilagođena onome koji treba da postupa na osnovu nalaza. Izveštaj o istraživanju obično ima formu koja je u velikoj meri slična bilo kom drugom naučnom izveštaju. Potrebno je objasniti kontekst i razloge za sprovođenje istraživanja, detaljno opisati korišćenu metodologiju (ciljnu populaciju, uzorak, instrumente, način prikupljanja i analize podataka), rezultate i zaključke koji se iz njih mogu izvesti. Takođe, potrebno je navesti eventualne manjkavosti i ograničenja istraživanja.

Izveštaji, odnosno rezultati anketnih istraživanja, mogu imati i format baza podataka. Baze podataka su pogodne jer koristeći njih svaki potencijalni korisnik može dobiti interaktivni izveštaj, odnosno izveštaj prilagođen njegovim potrebama. Više o pisanju izveštaja u poglavlju 11.

2.7. Slanje izveštaja (diseminacija)

Kada je izveštaj gotov, potrebno ga je objaviti ili dostaviti krajnjem korisniku, odnosno onome ko je izveštaj naručio i/ili onome ko na osnovu njega može delovati. Ukoliko istraživač to ne uradi, onda samo istraživanje nema previše smisla i predstavlja gubitak novca i resursa 15.

Nekada onaj ko je naručio izveštaj i onaj ko na osnovu njega može delovati ne moraju biti isti entiteti. Npr. naručilac izveštaja može biti neka nevladina organizacija, dok na osnovu izveštaja može delovati i vlada, ali i drugi činioci društva.

Izveštaje istraživanja potrebno je učiniti dostupnim i vidljivim svim potencijalnim korisnicima (naravno ako se to ne kosi sa pravima naručioca – ukoliko on postoji).

Možda je ovo prejako rečeno pošto saznanja koja na osnovu istraživanja stekne istraživač svakako nešto vrede. 15

30

POPULACIJA I UZORAK

3. Populacija i uzorak

Već je nekoliko puta rečeno da se anketna istraživanja po pravilu obavljaju na uzorku, a ne na populaciji. Iako su istraživanja na populaciji moguća, ona su najčešće neekonomična i teško sprovodljiva. Anketna istraživanja su namenjena istraživanju konačnih populacija i njihova metodologija je namenjena i prilagođena tom cilju. Zato istraživači koji se bave ovakvim tipom istraživanja insistiraju na eksplicitnoj definiciji populacije koja je predmet istraživanja (Groves, 2009). Kada čujemo termin „populacija“ obično pomislimo na celokupno stanovništvo planete Zemlje, na stanovništvo neke države, sve jedinke određene životinjske vrste na nekom području... Međutim, populacija koja zanima istraživača može biti mnogo manja. Na primer, populacija zaposlenih u (nekoj imaginarnoj) oglednoj osnovnoj školi „Narodni heroj Bojan Janičić – Suri“ bila bi vrlo mala i lako dostupna. Ukoliko bi nekoga zanimalo samo mišljenje zaposlenih ove škole o rukovođenju baš tom školom lako bi mogao ispitati sve članove populacije i izračunati parametre. U ovakvim i sličnim slučajevima nije potrebno raditi istraživanje na uzorku i na osnovu tako dobijenih statistika procenjivati parametre. Međutim, u velikom broju slučajeva populacije nisu tako male i istraživač je prinuđen da na osnovu merenja obavljenih na uzorku generalizuje zaključke na populaciju iz koje je taj uzorak izvučen.

3.1. Populacija Populacija je skup svih entiteta o kojima želimo da zaključujemo. Naziva se još i osnovni skup ili statistička masa (Fajgelj, 2004). Osnovne jedinice populacije nazivaju se elementi populacije ili članovi populacije, a sama populacija predstavlja skup svih elemenata, odnosno članova (Fajgelj, 2004; Groves, 2009).

Kada se govori o populaciji najčešće se misli na osobe, odnosno pojedince, ali u anketnim istraživanjima postoje i populacije druge vrste. Kao što je već ranije napomenuto, populacije se mogu sastojati od različitih članova: ljudi, domaćinstava, ustanova, preduzeća, organizacija, geografskih celina, ali i od odnosa, dâna, stvari ili događaja (poput kupovine automobila, poseta tržnom centru, putovanja i slično). U jednom anketnom istraživanju možemo imati i više različitih tipova elemenata. Na primer, u istraživanju zapošljivosti diplomiranih studenata osnovni elementi istraživanja (ili jedinice istraživanja) su diplomirani studenti, ali istovremeno to mogu biti i fakulteti i univerzi-

31

OSNOVE ANKETNIH ISTRAŽIVANJA

teti na kojima su oni diplomirali.

Populacije u anketnim istraživanjima su grupe (skupovi) entiteta na koje želimo da generalizujemo zaključke istraživanja. Ovako definisana populacija naziva se ciljna populacija (Groves, 2011). Međutim, da bi generalizacija bila moguća, populaciju je potrebno ograničiti prostorno i/ili vremenski, odnosno, ona mora biti konačna (bar teorijski prebrojiva) i mora biti takva da joj se može pristupiti. Kada bismo želeli da ispitamo stav punoletnih stanovnika Republike Srbije prema upotrebi pametnih telefona, ciljnu populaciju bi predstavljali svi punoletni stanovnici RS. Ovako definisana populacija nije dovoljno specifikovana. Na primer, nije definisano da li se to odnosi na sve punoletne stanovnike RS ili samo one koji žive u domaćinstvima (za razliku od onih koji su u tom trenutku u institucijama poput zatvora, domova za stare, bolnica). U trenutku planiranja istraživanja, ciljnu populaciju bi činili oni koji su u toj vremenskoj tački punoletni. Sa protokom vremena, neki od starijih članova populacije će verovatno umreti, a neki koji su bili maloletni postaće punoletni i legitimni članovi ciljne populacije. S obzirom da je očekivano da mlađi ispitanici (oni koji su ranije došli u kontakt sa ovom tehnologijom) imaju pozitivnije stavove prema pametnim telefonima, nalazi istraživanja dobijeni u jednoj vremenskoj tački ne bi se adekvatno mogli generalizovati na ciljnu populaciju iz druge vremenske tačke. Protokom vremena bitne karakteristike ove populacije su se promenile i stoga je ovu populaciju potrebno i vremenski ograničiti kako bi generalizacije bile ispravne.

Analogno tome, ukoliko ne možemo pristupiti svim članovima neke populacije i ne postoji šansa da jedan deo te populacije bude ispitan, onda o tom delu populacije ne možemo ni zaključivati. Generalizacije na osnovu nalaza istraživanja mogu biti ispravne samo ako generalizujemo na populaciju bez onog dela kojem nismo mogli pristupiti. Ako je deo populacije kojem ne možemo pristupiti, recimo, prostorno homogen, onda ciljnu populaciju moramo prostorno ograničiti.

Vremenskim i/ili prostornim ograničavanjem populacije činimo je konačnom. Ovakva populacija ima konačan broj članova (Fajgelj, 2004). Ciljna populacija je konačna populacija (Groves, 2009). Punoletno stanovništvo neke države nije konačna populacija upravo zbog onoga što je navedeno u prethodnom primeru. Neki članovi populacije umiru, neki postaju punoletni, neki se iseljavaju iz države, neki se useljavaju, država gubi ili dobija teritorije... Ukoliko se vremenski ne ograniči, ova populacija je beskonačna.

Iz ciljne populacije se isključuju ispitanici koji ne mogu biti kontaktirani (na primer, u anketi domaćinstava unutar neke države to su osobe koje žive u inostranstvu ili se nalaze u nekim institucijama, poput bolnica, staračkih domova, kasarni...).

Na ovom mestu potrebno je napraviti i razliku između teorijske i dostupne populacije. Naime, istraživač neće uvek biti u stanju da pristupi svim članovima neke populacije. Iako istraživač može imati jasnu zamisao koji elementi čine ciljnu populaciju, neki od elemenata ciljne populacije neće se nalaziti na spisku populacije i neće moći biti izabrani u uzorak. Recimo da želimo da ispitamo stavove kriminalaca prema upotrebi vatrenog oružja. U ovom slučaju kao spisak populacije mogli bismo koristiti neki spisak osuđivanih kriminalaca, ali teško bismo mogli doći do onih neosuđivanih čije bi nam mišljenje takođe bilo značajno. U ovom slučaju

32

POPULACIJA I UZORAK skup svih kriminalaca bi činio teorijsku populaciju, a dostupnu populaciju samo oni kriminalci koji se nalaze na spisku populacije.

Dostupna populacija 16 predstavlja skup članova populacije koji mogu biti izabrani u uzorak upotrebom određenog okvira uzorkovanja, odnosno spiska populacije. Ovakva populacija se naziva još i praktičnom ili operacionalizovanom populacijom (Fajgelj, 2004; Gideon, 2012).

Pre samog procesa uzorkovanja potrebno je prečistiti okvir uzorkovanja, kako bi iz njega bili izbačeni članovi koji ne pripadaju populaciji o kojoj želimo da zaključujemo. Ovakve jedinice nazivamo nelegitimnim jedinicama. Na primer, ako koristimo telefonski imenik kao spisak populacije u cilju uzorkovanja domaćinstava, iz njega bi trebalo eliminisati telefonske brojeve koji pripadaju preduzećima, organizacijama i slično.

U ovoj fazi moguće je iz okvira uzorkovanja odstraniti i delove populacije do kojih neće biti moguće doći zbog objektivnih okolnosti poput elementarnih nepogoda, ratnih dešavanja i slično.

Moguće je da, i pored prečišćavanja spiska populacije, u njemu ostanu nelegitimni članovi. Ukoliko je to slučaj i ukoliko ih je moguće uočiti nakon uzorkovanja, potrebno je odstraniti takve jedinice iz uzorka. Tek nakon toga se pristupa prikupljanju podataka. Oni članovi koji odgovore na anketu definišu anketnu populaciju.

3.1.1. Retke i skrivene populacije

Termin retka populacija ima više značenja. Pod retkim populacijama mogu se smatrati one populacije koje imaju mali apsolutan broj članova. Drugo značenje se odnosi na male subpopulacije, odnosno mali broj članova neke veće populacije koji ispoljava osobinu koja nas zanima. Primer za ovo značenje bi bila deca rođena sa albinizmom. Treće značenje se odnosi na populacije čiji broj elemenata nije mali, ali je skriven, pa ove populacije samo izgledaju malobrojne jer možemo uočiti samo mali broj članova. Primer ovakve populacije je populacija kriminalaca. Četvrto značenje se odnosi na populacije koje ne moraju nužno biti male, niti (sub)populacija mora biti mala u odnosu na populaciju kojoj pripada. U ovom slučaju radi se o populacijama koje su prostorno ili na neki drugi način koncentrisane, pa je broj jedinica uzorkovanja koje ih sadrže mali (Pfeffermann & Rao, 2010). Retke (sub)populacije se mogu definisati i preko njihovog udela u opštoj populaciji. S obzirom na to, možemo govoriti o: većim populacijama (engl. major populations) sa udelom većim od 10%, manjim populacijama (engl. minor) sa udelom 1–10%, mini populacijama sa udelom 0,1–1%, i retkim tipovima (engl. rare types) sa udelom

U engleskom jeziku koristi se i termin frame population (populacija okvira uzorkovanja) 16

33

OSNOVE ANKETNIH ISTRAŽIVANJA

manjim od 0,1%. Procene dobijene na većim populacijama su uglavnom pouzdane, a da bismo to ostvarili na manjim populacijama potrebni su posebni načini uzorkovanja. Za pouzdane procene na mini populacijama potrebno je koristiti statističko modelovanje, a kada su u pitanju retki tipovi, modeli uzorkovanja koji se koriste u anketnim istraživanjima u najvećem broju slučajeva nisu adekvatni (Kalton, 2009).

Retke (sub)populacije se mogu definisati i preko odnosa njihove proporcije u opštoj populaciji i njihove pristupačnosti (engl. reachability). Ukoliko je proporcija neke (sub)populacije dovoljna, a populacija pristupačna, ovakva populacija se naziva dovoljnom populacijom (engl. sufficient population). U slučaju da (sub)populacija ima dovoljnu proporciju, ali nije pristupačna, radi se o skrivenoj populaciji (engl. hidden population). Kada govorimo o (sub)populacijama koje predstavljaju malu proporciju opšte populacije, nepristupačne populacije se nazivaju malim skrivenim populacijama (engl. small hidden population). One pristupačne nazivaju se retkim populacijama (engl. rare population) (Spreen, 1992). Bitna razlika između skrivenih i retkih populacija je u osobini koja je predmet istraživanja (odnosno u osobini koja je definiše). Kod skrivenih populacija ta osobina (ukoliko bi bila javna) predstavlja pretnju za člana populacije, kod retkih ne. Dve su osnovne karakteristike skrivene populacije: 1) obično ne postoji spisak populacije (okvir uzorkovanja) pa nije poznata ni veličina populacije, i 2) pripadnici ove populacije su obično zabrinuti zbog privatnosti pošto bi ih otkrivanje pripadnosti takvoj populaciji moglo stigmatizovati ili inkriminisati (Heckathorn, 1997). Kada bismo se odlučili da sprovedemo istraživanje kriminalaca, vrlo je verovatno da bi se ova populacija pokazala skrivenom. Međutim, kada bismo hteli da sprovedemo istraživanje uspešnih niskoobrazovanih (kontraverznih) biznismena koji voze skupa kola i vole debeo zlatan nakit, ova populacija bi mogla biti retka, ali ne i nužno skrivena.

Osim toga, skrivene i retke populacije razlikuju se i po kooperativnosti. Članovi skrivenih populacija manje su kooperativni, češće odbijaju odgovaranje i manje su iskreni kako ne bi inkriminisali sebe.

U anketnim istraživanjima možemo se susresti sa dva tipa problema u vezi sa retkim populacijama. Prvi je situacija kada želimo da procenimo njihovu veličinu (N), gustinu (učestalost u okviru prostorne jedinice), ili proporciju javljanja u okviru opšte populacije. Upotrebom probabilističkog uzorkovanja ovakve populacije često umeju da budu podreprezentovane, odnosno da njihov udeo u uzorku bude manji nego u populaciji. Samim tim i procene parametara neće biti adekvatne. Druga vrsta problema se javlja kada želimo da procenimo karakteristike tih retkih populacija. Čak i kada retke populacije nisu podreprezentovane, broj jedinica iz ovakvih populacija izabranih u uzorak često nije dovoljan za pouzdane procene i ozbiljnije analize, pa ih je nužno ili nadreprezentovati ili se ukupan uzorak mora dovoljno uvećati kako bi i pripadnici retke populacije bili zastupljeni u dovoljno velikom broju. Oba problema mogu se rešiti uvećanjem ukupnog uzorka. Druga vrsta proble-

34

POPULACIJA I UZORAK

ma ekonomičnije se može rešiti nadreprezentovanjem retke populacije ili eventualno primenom egzaktnih testova, odnosno reuzorkovanja (engl. resampling, bootstrapping) u fazi obrade podataka (Fajgelj, 2004; Pfeffermann & Rao, 2010).

Kao što je rečeno, da bismo u konačnom uzorku imali željeni broj pripadnika neke retke populacije, veličinu ukupnog uzorka bismo morali prilagoditi tome. Ukoliko kao način uzorkovanja koristimo prosto slučajno biranje 17 (videti kasnije) uz skrining (engl. screening) 18, a željeni broj pripadnika retke populacije označimo sa nr i njihovu proporciju u opštoj populaciji sa pr, potrebnu veličinu uzorka možemo izračunati na sledeći način (Pfeffermann & Rao, 2010): 𝑛𝑛𝑡𝑡𝑡𝑡𝑡𝑡 = 𝑛𝑛𝑟𝑟 /𝑝𝑝𝑟𝑟

[1]

Na primer, ukoliko želimo da u uzorku imamo 100 pripadnika subpopulacije koja je u opštoj populaciji zastupljena sa 9% (pr=0,09), koristeći okvir uzorkovanja za opštu populaciju i prosto slučajno biranje bilo bi potrebno da ukupan uzorak bude ntot=nr/pr=100/0,09=1111.

Ukoliko bismo želeli prethodno da uračunamo stopu neodgovora od 30% (proporciju neodgovora označićemo sa pno=0,3), kako bismo pokušali da obezbedimo da dobijemo 100 odgovora od pripadnika retke populacije, prethodno bismo mogli uračunati korekciju za neodgovore. Korekcija se računa na sličan način: nrkor=nr/(1-pno)=100/(1-0,3)=100/0,7=143. Dakle, da bi 100 pripadnika retke populacije odgovorilo na anketu, sa stopom neodgovora od 0,3, potrebno je da u uzorku bude 143 ispitanika iz te populacije. To znači da bismo u formuli [ 1 ] nr morali zameniti sa nrkor pa bi onda potrebna veličina ukupnog uzorka bila ntot=nrkor/pr=143/0,09=1589. Više o strategijama uzorkovanja retkih populacija možete videti u Feferman i Rao (Pfeffermann & Rao, 2010).

Ukoliko želimo da nadreprezentujemo pripadnike retke populacije biće nam potreban poseban okvir uzorkovanja za populaciju od interesa. Ne treba ni naglašavati da bi i ovaj uzorak trebalo da bude reprezentativan (po načinu biranja i po veličini) za populaciju na koju se odnosi. Osim toga, ukoliko smo nadreprezentovali neku subpopulaciju kako bismo za nju mogli izračunati pouzdane pokazatelje, prilikom računanja pokazatelja za ukupnu populaciju potrebno je ponderisati odgovore članova nadreprezentovane populacije tako da im umanjimo značaj. Na primer, ako je neka subpopulacija nadreprezentovana tako da je njena proporcija u uzorku dva puta veća nego u populaciji, odgovore njenih članova bi trebalo ponderisati sa 0,5 (1/2=0,5). Ukoliko je subpopulacija nadreprezentovana 4 puta, onda bi ponder trebalo da iznosi 0,25 (1/4). Više o ponderisanju možete videti u poglavlju 9.4.1, a posebno u odeljku 10.4. Prosto slučajno biranje nije pogodno za istraživanja koja imaju za cilj utvrđivanje parametara retkih populacija zbog toga što će takvi uzorci imati nijednog ili mali broj članova ovakvih populacija (Pfeffermann & Rao, 2010). 18 Prilikom skrininga proveravamo da li su izabrane legitimne jedinice. 17

35

OSNOVE ANKETNIH ISTRAŽIVANJA

3.2. Uzorak Uzorak predstavlja skup članova ciljne populacije (tačnije – dostupne populacije) na kojima se obavlja istraživanje. S obzirom da obično želimo da na osnovu uzorka zaključujemo o populaciji iz koje je uzorak izvučen, bitno je da on bude reprezentativan za ciljnu populaciju. Reprezentativnost uzorka obezbeđuje se njegovom veličinom i načinom biranja (Fajgelj, 2004). Najbolji način biranja članova populacije u uzorak iz perspektive reprezentativnosti je slučajno, odnosno probabilističko biranje.

Da bi slučajno biranje bilo moguće potreban nam je odgovarajući spisak populacije. Ako je taj spisak manjkav (kao u ranijem primeru sa anketom kriminalaca) onda ni uzorak neće valjati bez obzira što smo članove populacije birali slučajno. Ako na osnovu spiska populacije iz primera o anketi kriminalaca (primer za teorijsku i dostupnu populaciju) u vezi sa upotrebom vatrenog oružja izaberemo slučajan uzorak kriminalaca, u tom uzorku se neće naći oni koji nisu osuđivani. Koliko god puta ponovili uzorkovanje na tom okviru uzorkovanja to se neće desiti jer neosuđivanih nema na spisku. Kriminalac neće biti osuđivan zato što nije uhvaćen u krivičnom delu (što znači da dobro radi svoj posao), ne ostavlja svedoke ili zato što je vrlo uspešan pa može da plati dobru odbranu. Ukoliko je predmet istraživanja ankete povezan sa uspešnošću kriminalaca, ovaj uzorak neće biti reprezentativan iako je biran metodom slučajnog biranja i ima dovoljnu veličinu.

Prilikom formiranja uzorka potrebno je voditi računa o potrebnoj veličini, procedurama biranja članova, stratifikaciji, načinu izračunavanja standardnih grešaka (Fajgelj, 2004). Svi ovi činioci koji su deo plana uzorka međusobno su zavisni. Kada formiramo uzorak za neko anketno istraživanje obično polazimo od željene preciznosti rezultata (odnosno standardne greške, polovine intervala poverenja ili margine greške) i od jedinica uzorkovanja. Od varijabilnosti posmatrane pojave i željene preciznosti zavisiće potrebna veličina uzorka. Međutim, preciznost će zavisiti i od toga da li je uzorak stratifikovan ili ne, da li se radi o klaster uzorkovanju ili ne... Drugim rečima, zavisiće od jedinica uzorkovanja.

3.2.1. Jedinice uzorkovanja, jedinice posmatranja, jedinice analize

Jedinice uzorkovanja su članovi populacije koje biramo u procesu uzorkovanja i u zavisnosti od vrste populacije to mogu biti osobe, grupe, organizacije, preduzeća, stvari, događaji itd. Jedinice posmatranja ili jedinice istraživanja su članovi populacije od kojih prikupljamo potrebne podatke.

Vrlo često se jedinice uzorkovanja i jedinice posmatranja poklapaju, ali ne moraju nužno biti iste. Takav je slučaj kada se koristi višefazno (višeetapno) uzorkovanje, ali ne samo tada. Detalje o višefaznom uzorkovanju možete naći u istoimenom odeljku (4.4).

36

POPULACIJA I UZORAK Jedinice uzorkovanja i jedinice posmatranja mogu se razlikovati i kada nemamo višefazno uzorkovanje. Ukoliko ispitujemo potrošačke navike kupaca u nekom tržnom centru, jedinice uzorkovanja mogu biti događaji, recimo, svaka stota kupovina (ostvarena u tom tržnom centru u toku dve nedelje). U ovom slučaju jedinice uzorkovanja su kupovine, a jedinice istraživanja su kupci koji su učestvovali u tim događajima, pošto ćemo od njih prikupljati podatke.

Jedinice analize su entiteti za koje izračunavamo statističke pokazatelje. One se mogu razlikovati od jedinica uzorkovanja i jedinica posmatranja (Trochim, 2006). Bez obzira što smo podatke prikupili intervjuišući pojedince, ako je naš primarni interes neka grupa kojoj pojedinac pripada, onda će jedinica analize biti ta grupa, a ne pojedinac. Ukoliko u ispitivanju domaćinstava pitamo koliko novca domaćinstvo godišnje potroši na letovanje i kao rezultat prikažemo prosečnu potrošnju po domaćinstvu, onda je jedinica analize domaćinstvo. Međutim, ukoliko analiziramo koliko se seoska i gradska domaćinstva razlikuju po toj sumi, onda su nam jedinice analize tipovi naselja (selo – grad).

Pre samog uzorkovanja potrebno je definisati jedinicu uzorkovanja. Definicija jedinice uzorkovanja mora biti takva da jasno odredi koje su jedinice legitimne, a koje ne. Legitimne jedinice su one koje želimo da uključimo u istraživanje, odnosno predstavljaju deo ciljne populacije. Jedinice uzorkovanja možemo definisati kao: „punoletne osobe koje žive u domaćinstvima u Republici Srbiji“. U tom slučaju nelegitimne jedinice bile bi sve osobe mlađe od 18 godina, ili one koje su navršile 18 godina ali se u vreme sprovođenja ankete nalaze u ustanovama (bolnica, zatvor...) ili su van države. Ako se definiše na ovaj način, nije bitno da li je osoba državljanin RS ili ne. Ako su jedinice uzorkovanja domaćinstva ili nam definicija jedinice uzorkovanja uključuje termin „domaćinstvo“, trebalo bi definisati šta je to. Domaćinstvo možemo definisati kao „sve osobe koje nastanjuju stambenu jedinicu i zajednički troše svoje prihode“. U prethodnoj definiciji sve deluje potpuno jasno, međutim da li je baš potpuno jasno šta je to stambena jedinica? Ona bi se mogla definisati kao „kuća, stan, pokretna kuća, soba, grupa soba koje su nastanjene ili namenjene stanovanju kao odvojene stambene celine, odnosno čine jedinstvenu upotrebnu celinu koja obezbeđuje uslove za življenje i boravak u njemu“. Iako smo možda pri pomenu stambene jedinice imali u vidu kuću, stan ili sobu, na terenu bismo mogli naići i na druge pojavne oblike stambenih jedinica, ali bitne karakteristike stambenih jedinica su da su namenjene stanovanju (dakle nisu magacini, garaže i sl.), te da se radi o odvojenim stambenim celinama. Pod odvojenim stambenim celinama podrazumevaju se one u kojima stanari žive i jedu odvojeno od drugih osoba koje nastanjuju građevinu i imaju pristup stambenoj celini bilo direktno ili kroz zajednički hodnik (dakle, tu ne spadaju kolektivni centri, poput izbegličkih, kasarne, bolnice...). Kada kažemo da stanari žive, jedu, imaju pristup, postavlja se pitanje: Ko su stanari? Njih možemo definisati kao jednu osobu ili porodicu, ili više porodica, ili grupu osoba koje su povezane ili ne rodbinskim odnosima, a koje žive zajedno. Ovde, međutim, nije definisano da li osobe imaju prijavljeno prebivalište na adresi ili ne. Možemo razlikovati stanare de facto i de iure. De iure stanari su samo oni koji imaju prijavljeno prebivalište na određenoj adresi (stambenoj jedinici...). De fac-

37

OSNOVE ANKETNIH ISTRAŽIVANJA

to stanari su one osobe koje zaista žive na određenoj adresi, bez obzira da li su na njoj prijavljeni ili ne. Za koju god od ove dve definicije se istraživač odluči, bitno je da bude dosledan. Dakle, punoletne osobe koje su predmet ovog anketnog istraživanja, pored svog punoletstva moraju za vreme obavljanja istraživanja živeti u okviru domaćinstva u RS, bez obzira da li su državljani ili ne. Pri tome, domaćinstvo je definisano kao skup svih osoba koje nastanjuju stambenu jedinicu (odvojenu stambenu celinu namenjenu stanovanju) i zajedno troše svoje prihode.

Kao što je već rečeno, uzorkovanje se vrši prema planu uzorka koji obuhvata veličinu uzorka, procedure biranja, nacrt uzorkovanja i sl. Da bi uzorkovanje (pre svega probabilističko) uopšte bilo moguće, potrebno je da postoji neki spisak populacije ili okvir uzorkovanja.

3.2.2. Okvir uzorkovanja (spisak populacije) Spisak populacije ili kako se još naziva okvir uzorkovanja (engl. sampling frame) predstavlja niz koraka koji od ciljne populacije dovode do uzorka. On nekada može biti spisak ili više spiskova elemenata ciljne populacije, koji nam služe za identifikovanje jedinica istraživanja, a nekada može biti procedura poput slučajnog biranja telefonskih brojeva (engl. Random Digit Dialing – RDD) ili zonskog slučajnog uzorkovanja (De Leeuw et al., 2008). Okvir uzorkovanja je skup materijala ili procedura koji služi za identifikovanje i kontaktiranje jedinica istraživanja. Upravo zbog činjenice da spisak populacije nekada uopšte ne mora imati formu pravog spiska, termin okvir uzorkovanja čini se boljim. Drugi razlog zbog kojeg se termin okvir uzorkovanja čini boljim je i taj što se jedinice uzorkovanja i jedinice istraživanja ne moraju nužno poklapati. Na primer, prilikom istraživanja kupovine novih automobila jedinice uzorkovanja mogu biti saloni automobila (okvir uzorkovanja bi mogla biti lista svih prodajnih salona automobila), a jedinice istraživanja (događaji) kupovine.

Kada se radi o spiskovima u užem smislu, to mogu biti spiskovi članova određenih organizacija i udruženja, spisak stanovnika grada, spisak preduzeća u nekoj državi... Mogu biti manje ili više kompletni. Da bi se mogli koristiti za probabilističko uzorkovanje, moraju obezbediti da svaki element populacije ima neku, nenultu verovatnoću da bude izabran u uzorak. Takođe, kada govorimo o spiskovima na kojima se nalaze pojedinci, ustanove, organizacije, preduzeća i slično, da bi se oni mogli koristiti kao okviri uzorkovanja potrebno je da pored identifikacije (ime/naziv) člana populacije postoji i njegova ažurna kontakt informacija. Ako takva informacija ne postoji (ili ju je nemoguće nabaviti), onda jedinice uzorkovanja za koje odgovarajuća informacija ne postoji neće moći da budu kontaktirane, što je u velikoj meri slično kao da se član i ne nalazi na spisku. Ako se u uzorku nađe jedinica za koju u okviru uzorkovanja nemamo kontakt informacije i ne možemo ih pribaviti, to će rezultirati smanjenjem veličine realizovanog uzorka. Dostupne kontakt informacije mogu uticati na izbor modaliteta prikupljanja

38

POPULACIJA I UZORAK

podataka. Ukoliko u spisku populacije imamo adrese stanovanja, ali ne i brojeve telefona i imejl adrese članova populacije, onda u obzir ne dolazi telefonska anketa. Internet anketa bi bila izvodljiva tako što bi ispitanicima mogao klasičnom poštom biti poslat link na onlajn anketu, ali to bi znatno povećalo troškove ankete u odnosu na situaciju kada bi nam u spisku odmah bile dostupne ažurne imejl adrese. U ovom slučaju mogli bismo sprovesti anketu licem u lice, poštansku anketu ili anketu sa ličnim dostavljanjem upitnika. Ukoliko, s druge strane, u spisku (pored imena) imamo samo telefonske brojeve članova populacije, najverovatnije bismo se odlučili za telefonsku anketu. Takođe, mogli bismo se opredeliti da telefonskim putem saznamo druge potrebne podatke pa da anketu realizujemo licem u lice ili onlajn. Naravno, drugu opciju je ekonomičnije sprovesti u delo nakon što su članovi populacije već izabrani u uzorak (ažurirati podatke samo za uzorak, a ne za čitavu populaciju).

Nekada su istraživaču dostupni gotovi spiskovi, nekada ih mora konstruisati ispočetka, nekada može dobiti odgovarajući spisak kombinujući više postojećih, a nekada se mogu i kupiti od akademskih ili komercijalnih organizacija (Blair et al., 2014). Neki od najpoznatijih internet servisa namenjenih onlajn anketiranju, istraživačima pored ostalog nude ispitanike iz skupa svojih „profesionalnih“ ispitanika. Bez obzira koliko to može izgledati primamljivo, trebalo bi imati u vidu da su takvi uzorci bez obzira na korišćenu proceduru uzorkovanja ograničeni na korisnike interneta koji su se dobrovoljno prijavili da učestvuju u uzorku. Ako to posmatramo sa druge strane, možemo reći da članovi populacije koji nisu korisnici interneta i nisu se dobrovoljno prijavili za učešće u anketama, nemaju nikakve šanse da se nađu u ovakvim uzorcima (odnosno, njihova šansa je nulta). Spiskovi osoba sa kontakt podacima su retko dostupni kada je u pitanju opšta populacija. Takve podatke poseduju državne službe, a prema zakonima o zaštiti podataka o ličnosti (koje mnoge države poseduju) vrlo je ograničeno za čega se ti podaci mogu koristiti.

Prvo na šta se obično pomisli kada je istraživaču potreban spisak osoba/ domaćinstava sa adresama i brojevima telefona je telefonski imenik (fiksne telefonije). U njemu možemo naći identifikacije članova populacije i njihove kontakt podatke (adresu i telefon). Još ako postoji u elektronskoj formi, deluje savršeno, bar za određene načine prikupljanja podataka. Međutim, telefonski imenik ni na koji način nije potpun i ažuran spisak populacije. Pre svega, ne poseduju svi članovi populacije telefonski priključak. Neki ne poseduju ni stan, pa ne mogu ni imati fiksni telefon na svoje ime. Razlozi zbog kojih neko ne poseduje stan mogu biti različiti, ali obično su materijalne prirode. Osim toga, ni svi oni koji poseduju stan ne moraju posedovati fiksni telefon. Procenat domaćinstava koja poseduju fiksni telefon varira od zemlje do zemlje i krajem XX veka se kretao između 16 i 99%. U SAD, broj domaćinstava bez telefona bio je veći u ruralnim područjima, a telefon češće nedostaje u jednočlanim domaćinstvima, domaćinstvi-

39

OSNOVE ANKETNIH ISTRAŽIVANJA

ma u kojima ima nezaposlenih, „mlađim“ domaćinstvima, te u onim lošijeg materijalnog statusa (Dillman, Smyth, & Christian, 2014; Groves et al., 2001). Mada je poslednjih decenija XX veka rastao procenat domaćinstava koja poseduju telefon, razvojem i pojeftinjenjem usluga mobilne i VoIP telefonije (engl. Voice Over Internet Protocol), fiksna telefonija postaje prevaziđena i veliki broj, posebno mlađih domaćinstava, jednostavno nema potrebe za ovakvim vidom komunikacije 19. Sledeća stvar, ne manje bitna, je da čak i oni koji poseduju fiksne telefone ne moraju biti izlistani u telefonskom imeniku. Ljudi koji se opredele da im se broj ne nađe u telefonskom imeniku to čine iz određenih razloga. Često je to materijalni status (bolji) ili priroda posla kojim se bave. Bitno je uočiti da je svako od ovih izostajanja iz telefonskog imenika kao spiska populacije sistematsko.

Neki nedostaci telefonskog imenika kao okvira uzorkovanja mogu se za potrebe telefonskih anketa prevazići upotrebom RDD procedure (engl. Random Digit Dialing – slučajno biranje telefonskih brojeva). RDD je okvir uzorkovanja za slučajno biranje telefonskih brojeva. Ovaj okvir uzorkovanja je primer situacije kada spisak populacije nije zaista nikakav spisak, već se radi o proceduri. Da budemo precizni, postoji implicitni spisak svih mogućih brojeva koje bi operater fiksne telefonije mogao dodeliti korisnicima (Lepkowski, 2008). Slučajno biranje telefonskih brojeva implementirano je računarski, a softver za RDD slučajno bira i poziva zadati broj slučajno generisanih telefonskih brojeva u okviru određene mrežne grupe (pozivnog broja), a sa implicitnog spiska mogućih telefonskih brojeva. Uzorkovanjem na ovaj način u uzorak mogu biti birani i oni članovi populacije čiji se brojevi ne nalaze u telefonskom imeniku. S druge strane, procedurom u uzorak mogu ući i nelegitimne jedinice poput nepostojećih telefonskih brojeva ili telefonskih brojeva preduzeća u anketnom istraživanju domaćinstava. Još jedan problem u vezi sa ovom procedurom je to što korisnici mogu preneti svoj broj iz jedne mrežne grupe u drugu ne menjajući pozivni broj. Ako je istraživanje usmereno na populaciju jednog grada, na ovaj način u uzorak mogu biti birani i ispitanici iz drugog grada. To su takođe nelegitimne jedinice. Ova procedura ne menja činjenicu da članovi populacije koji nemaju telefone imaju nultu verovatnoću da budu izabrani u uzorak. Ukoliko su ovi razlozi izostajanja iz spiska populacije povezani sa predmetom istraživanja, to će dovesti do pristrasnih procena parametra koji je predmet istraživanja, bez obzira koja procedura uzorkovanja se koristi.

Na ovom mestu valja se osvrnuti i na okvire uzorkovanja namenjene internet anketiranju, a koji sadrže elektronske adrese jedinica populacije. Ovakvi okviri su retki i teško se kreiraju. Najčešće su nepotpuni, mogu sadržavati jedinice kojima tu nije mesto, jedna jedinica često ima više imejl adresa, a čest je slučaj i da više jedinica dele jednu 2006. u SAD 7,2% odraslih osoba posedovalo je samo mobilne telefone (Blumberg, Luke, & Cynamon, 2006). Prema nekim istraživanjima, 2017. u SAD taj procenat iznosio je 50,8%, a u starosnoj grupi 25–34 godine 70% (Kastrenakes, 2017). 19

40

POPULACIJA I UZORAK

adresu. Vrlo su česte i kombinacije poslednje dve slabosti. Za razliku od telefonskih brojeva koji se mogu slučajno generisati (RDD), elektronske adrese to ne dozvoljavaju (Groves, 2009).

Spiskove manjih populacija moguće je kreirati (npr. spisak zaposlenih, spisak studenata univerziteta, spisak članova udruženja...). Prilikom kreiranja ovakvih spiskova preporučljivo je da konsultujete važeći zakon o zaštiti podataka o ličnosti države ili država za čije stanovnike kreirate spisak. Na primer, tekući Zakon RS propisuje da je onaj koji prikuplja podatke dužan da lice na koje se podaci odnose (čije podatke prikuplja) prethodno obavesti o: svom identitetu (identitetu ustanove, firme...); svrsi prikupljanja podataka; načinu njihovog korišćenja; identitetu ili vrsti lica koje će koristiti podatke; obaveznosti i pravnom osnovu, odnosno dobrovoljnosti davanja podataka i obrade; pravu da pristanak za obradu opozove, kao i pravnim posledicama u slučaju opoziva; pravima koja joj pripadaju u slučaju nedozvoljene obrade... Ovako kreirani spiskovi smeju se koristiti samo u svrhe za koje su lica čiji se podaci nalaze u njemu dali informisani pristanak i ne smeju se prosleđivati trećim licima (D. Krivokapić et al., 2016; Zakon o zaštiti podataka o ličnosti, 2012). U tom smislu, prodaja i kupovina određenih podataka o ličnosti, uključujući kontakt podatke, bi se mogla smatrati kršenjem zakona.

Populacije mogu biti raznovrsne, pa samim tim i spiskovi populacija mogu sadržavati različite članove. Neki od ovakvih spiskova postoje i javno su dostupni. Na primer, spisak okruga, opština i naselja u R. Srbiji javno je dostupan na sajtu Republičkog zavoda za statistiku Srbije i on se može koristiti kao okvir uzorkovanja u nekoj od ranijih etapa višeetapnog uzorkovanja. Kada je u pitanju Republika Srbija, sajt Republičkog zavoda za statistiku 20 nudi i baze podataka iz kojih se u obliku izveštaja mogu izvući korisni spiskovi koji mogu sadržavati i dodatne informacije koje se mogu iskoristiti prilikom procesa uzorkovanja i evaluacije reprezentativnosti uzorka. Ukoliko ne postoji valjan spisak članova populacije, jedno od mogućih rešenja je zonsko biranje. Zonski okviri su vrsta okvira uzorkovanja koji dele oblast od interesa za istraživanje na geografske oblasti (zone) veće ili manje po obimu, koje se zatim koriste kao jedinice uzorkovanja. Ove geografske oblasti su u hijerarhijskom odnosu i u zavisnosti od vrste istraživanja i zemlje na koju se odnose mogu biti različite: pokrajine, okruzi, opštine, naselja, mesne zajednice, ulice... Obično su ove oblasti definisane tako da obuhvataju približno jednak broj krajnjih jedinica istraživanja (Turner, 2003). Zonski okviri mogu biti u obliku liste, mape, satelitske ili fotografije iz vazduha (Lavrakas, 2008).

U principu, kada se koriste zonski okviri obično se radi o višeetapnom biranju. Dobra strana ovog načina uzorkovanja je da ne mora postojati eksplicitni spisak jedinica istraživanja već izbor može biti prepušten anketaru na terenu. 20

http://www.stat.gov.rs

41

OSNOVE ANKETNIH ISTRAŽIVANJA

Ukoliko je to slučaj, anketar mora imati jasno definisanu proceduru (slučajnog) biranja jedinica istraživanja. Na primer, mora mu biti određeno odakle da krene, kako da se kreće (u smeru kazaljke na satu) i kako da bira objekte u koje će ulaziti (recimo, svaki deseti...). Ako se radi o anketnom istraživanju domaćinstava, mora mu biti definisan i način biranja stambenih jedinica, ako ih objekat u koji je ušao ima više. Konačno, anketar mora imati i definisan postupak biranja izvestioca (jedinice istraživanja) u odabranom domaćinstvu ukoliko neće biti ispitani svi njegovi članovi. U tom slučaju se često kao kriterijum koristi biranje osobe čiji je rođendan najbliži (Fajgelj, 2004), mogu se koristiti i Kišove tablice slučajnih brojeva ili neki drugi pristup slučajnog izbora. I sama procedura koju anketar koristi je deo okvira uzorkovanja. Generalno, kada ne postoje adekvatni spiskovi članova populacije može se koristiti višeetapno biranje. U tom slučaju, u početnim etapama uzorkovanja koriste se spiskovi koji su javno dostupni. Obično se radi o zonskim okvirima uzorkovanja. U krajnjim fazama se može ili kreirati spisak članova populacije u odabranim jedinicama višeg reda, ili se u okviru njih mogu slučajno birati jedinice na način koji ne zahteva pravljenje spiska.

Na primer, kada bismo želeli da anketiramo učenike srednjih škola, u prvoj etapi bismo prostim slučajnim biranjem mogli izabrati opštine sa postojećeg i dostupnog spiska opština u kojima postoje srednje škole. Zatim bismo u narednoj fazi mogli, sa spiska srednjih škola koje postoje u odabranim opštinama, slučajnim izborom odabrati škole, a zatim u narednoj fazi, odeljenja u tim školama. Svi potrebni spiskovi u dosadašnjim fazama su nam ili dostupni ili bi se lako mogli kreirati. Konačno biranje učenika bismo mogli izvršiti generisanjem slučajnih brojeva u rasponu od 1 do broja učenika u odeljenju. Ispitani bi bili učenici čiji redni brojevi u školskom dnevniku odgovaraju odabranim brojevima. Na taj način nam ne bi bio potreban spisak učenika koji pohađaju određeno odeljenje, a koji verovatno ni ne bismo mogli dobiti.

Ukoliko se neko profesionalno bavi anketnim istraživanjima ili planira više istraživanja treba da ima u vidu da se okvir uzorkovanja ne upotrebljava jednokratno. Stoga ima smisla da se posveti njegovom uređenju i unapređenju, bilo da se radi o spisku, proceduri ili kombinaciji jednog i drugog. 3.2.2.1.

Višestruki okviri uzorkovanja

Kada postoji spisak populacije ali je nepotpun ili neažuran, potrebno ga je dopuniti ukoliko je to moguće. Ukoliko to nije moguće, postoji mogućnost kombinovanja više spiskova populacije za potrebe uzorkovanja.

Višestruki okviri koriste se kada jedan okvir ne pokriva celokupnu ciljnu populaciju, kada želimo da ispitujemo retke populacije ili koristimo različite metode prikupljanja podataka (Pfeffermann & Rao, 2010). Osim toga, upotreba višestrukih okvira uzorkovanja je često jeftinija.

Drugim rečima, višestruki okviri uzorkovanja koriste se da bi se umanjile slabosti okvira uzorkovanja (poput nepokrivenosti i nelegitimnih jedinica), povećala efikasnost istraživanja i umanjili njegovi troškovi. Možemo zamisliti situaciju u kojoj bismo želeli da ispitamo zadovoljstvo koris-

42

POPULACIJA I UZORAK

nika mobilne telefonije brzinom mobilnog interneta. Pošto postoji više operatera, morali bismo da kombinujemo više posebnih spiskova korisnika. To mogu biti telefonski imenici, ali moguća je i upotreba RDD procedure 21. Ukoliko bismo koristili samo jedan spisak ne bismo pokrili celokupnu populaciju, a ta nepokrivenost bi bila sistematska

Slika 1 – Višestruki okviri uzorkovanja

(npr. nepokriveni korisnici jednog operatera). U meri u kojoj se korisnici različitih operatera razlikuju po zadovoljstvu brzinom mobilnog interneta, u toj meri bi i naša procena bila pristrasnija, odnosno u većoj meri pogrešna. Da bismo to izbegli prilikom uzorkovanja bismo kombinovali okvire uzorkovanja. Situaciju bismo mogli predstaviti kao na gornjoj slici (Slika 1). O1 predstavlja okvir uzorkovanja korisnika operatera 1, O2 predstavlja okvir uzorkovanja korisnika operatera 2, a u preseku su korisnici koji se nalaze u oba okvira. Međutim, moguća je i situacija kada je jedan okvir uzorkovanja podskup drugog okvira. Dve varijante te situacije prikazane su na narednoj slici (Slika 2).

U prvoj varijanti (Slika 2, varijanta A) cilj je željena pokrivenost retkih populacija. Naime, i kada postoji okvir uzorkovanja (Ou) koji pokriva celokupnu populaciju (recimo zonski), a značajno nam je i da u dovoljnoj meri pokrijemo neku retku populaciju (videti odeljak 3.1.1), koristićemo i specifični okvir uzorkovanja (Or) za retku populaciju.

Drugi slučaj (Slika 2, varijanta B) je kada za uzorkovanje koristimo jedan nepotpun okvir uzorkovanja (Ot) koji ipak pokriva veliki deo populacije, a da bismo ga dopunili koristimo okvir uzorkovanja koji pokriva celu populaciju (Oz). Iako bismo u startu mogli koristiti kompletniji okvir (Oz), zbog znatno viših troškova prikupljanja podataka na osnovu tog okvira uzorkovanja, opredeljujemo se da primarno koristimo nepotpun okvir, a kompletniji koristimo samo za dopunu. RDD se ne mora koristiti samo za telefonske ankete. Moguće je na taj način uzorkovati domaćinstva, a anketu sprovesti ličnim anketiranjem ili na neki drugi način. 21

43

OSNOVE ANKETNIH ISTRAŽIVANJA

Slika 2 – Višestruki okviri uzorkovanja

Ne treba zaboraviti da će način prikupljanja podataka u anketnom istraživanju zavisiti od kontakt informacija koje imamo u okviru uzorkovanja. Ako u okviru uzorkovanja nemamo telefonske brojeve članova populacije već samo adrese, umesto jeftinije telefonske ankete moraćemo da se opredelimo za lično anketiranje. To je skopčano sa većim troškovima vezanim za anketare, njihovu obuku, putne troškove... Takav slučaj bismo imali kada bi za uzorkovanje koristili RDD proceduru. Tim načinom bi ostao nepokriven deo populacije koji nema telefon. Dostupan zonski okvir pokriva i taj deo populacije i ako bismo se opredelili da koristimo njega, RDD procedura nam ne bi bila ni potrebna. Međutim, zonski okvir podrazumeva znatno veće troškove prikupljanja podataka, pa nam je ekonomičnije rešenje da uzorkovanje obavimo RDD procedurom (a anketiranje telefonskim putem). Kao dopunu uzorka za deo populacije koji ne poseduje telefon mogli bismo koristiti zonski okvir. Iz uzorka dobijenog zonskim uzorkovanjem bismo mogli isključiti one jedinice istraživanja koje su pokrivene RDD uzorkom, i na taj način smanjiti troškove.

Upravo smanjenje troškova sprovođenja anketnog istraživanja je dominantni razlog korišćenja višestrukih okvira uzorkovanja (Pfeffermann & Rao, 2010).

Podvrsta uzorkovanja pomoću više okvira uzorkovanja naziva se i uzorkovanje uz trijažu (engl. screening multiple-frame survey). Ovakav vid uzorkovanja koristi se u situaciji kada višestruke okvire uzorkovanja koristimo u svrhu dopune nepotpunih okvira (npr. Slika 1). U ovakvom vidu uzorkovanja, izbor jedinica uzorkovanja vrši se posebno za jedinice pokrivene samo jednim od okvira, a ne drugim, a posebno za jedinice pokrivene sa više okvira uzorkovanja. Drugim rečima, posebno bi bili uzorkovani korisnici operatera 1, posebno operatera 2, a posebno korisnici i jednog i drugog operatera. U situaciji sa pomenute slike to bi bilo isto kao da imamo tri zasebna okvira uzorkovanja koji se ne preklapaju. Pošto se okviri ne preklapaju, ovakav način uzorkovanja omogućava izračunavanje ukupnih pokazatelja sumiranjem pokazatelja za svaku od subpopulacija (Pfeffermann & Rao, 2010). Ukoliko se uklanjanje jedinica uzorkovanja koje se nalaze u više okvira uzorkovanja ne učini pre samog procesa biranja, moguće je dobiti korektne pokazatelje za subpopulacije i ukupnu populaciju njihovim uklanjanjem

44

POPULACIJA I UZORAK

ili ponderisanjem tokom analize podataka (više o tome u: Pfeffermann & Rao, 2010).

Varijanta uzorkovanja uz trijažu može se koristiti i za drugu namenu. Naime, ako nas zanimaju isključivo oni članovi populacije koji su deo okvira uzorkovanja Oz (Slika 2 B), ali ne i okvira Ot (na primer samo oni koji nemaju telefone), okvir Ot može da se koristi za identifikaciju i eliminisanje nelegitimnih jedinica iz okvira Oz. 3.2.2.2.

Ažuriranje okvira uzorkovanja

Kao što je već je napomenuto, da bi se neki spisak mogao koristiti kao okvir uzorkovanja on mora sadržavati odgovarajuće kontakt informacije članova populacije. No, ni to nije dovoljan uslov. Postojeće kontakt informacije moraju biti ažurne. Recimo, ako fakultet želi da obavi istraživanje svojih diplomiranih studenata kao okvir uzorkovanja može koristiti bazu podataka studentske službe. U bazi se pored imena i prezimena studenta i podataka vezanih za studiranje mogu naći razne kontakt informacije poput adrese stanovanja, adresa stanovanja tokom studiranja, broja fiksnog telefona, broja mobilnog telefona, imejl adrese... Ovo mnoštvo informacija čini ovakve spiskove pogodnim da budu upotrebljeni kao okviri uzorkovanja bez obzira na način prikupljanja podataka. Međutim, to su obično podaci koje studenti daju prilikom upisa. Od upisa do diplomiranja prođe najmanje tri godine (za osnovni nivo studija). Za te tri godine mnoge od ovih informacija mogu postati zastarele, a studenti na osnovu njih nedostupni. Takođe, nemaju svi studenti sve navedene podatke. Kada postoji više kontakt informacija, problem je manji jer se jedna kontakt informacija može iskoristiti da se ažurira druga. Na primer, ukoliko želimo da pozive na anketu studentima šaljemo elektronskom poštom, možemo telefonom kontaktirati potencijalnog ispitanika i ažurirati podatak koji nije tačan ili eventualno nedostaje. Kada su elektronske adrese u pitanju, one se najlakše mogu proveriti slanjem poruke. Ukoliko poruka bude odbijena (engl. bounce), onda se najverovatnije radi o adresi koja nije validna i trebalo bi je korigovati. Postoje i internet servisi koji to mogu uraditi umesto istraživača.

I drugi okviri uzorkovanja mogu imati greške koje su u velikoj meri predvidive, a tiču se ažurnosti. Okviri koji sadrže klijente ili zaposlene neke firme često ne sadrže novije klijente firme koji još nisu upisani u spisak. Isto važi i za zaposlene. S druge strane, vrlo često ovakvi spiskovi će sadržavati klijente i zaposlene koji to više nisu (prestali su da sarađuju sa firmom / dobili ili dali otkaz).

Kada su u pitanju okviri uzorkovanja za organizacije (poput preduzeća, crkvi, bolnica, zatvora...) problemi su slični, ali imaju i neke svoje specifičnosti. Na primer, okviri uzorkovanja koji se sastoje od spiska kompanija sadrže kompanije različitih veličina. Tu se mogu naći multinacionalne korporacije, ali i male kompanije sa malim prihodom i nekolicinom zaposlenih. Ovakvi okviri obično favorizuju velike kompanije, dok su male češće nepokrivene. Velike organizacije često osim sedišta imaju i ispostave, dok male vrlo često imaju samo jednu lokaciju. Velike organizacije će se stoga u okviru uzorkovanja javljati više puta. U svakom konkretnom istraživanju potrebno je doneti

45

OSNOVE ANKETNIH ISTRAŽIVANJA

odluku šta je zaista jedinica istraživanja: pravno lice ili fizičke lokacije i u tom smislu ažurirati okvir uzorkovanja. Velika organizacija može predstavljati jedno pravno lice, a imati više fizičkih lokacija (kao što i jedna osoba može posedovati više stambenih jedinica). S druge strane, postoje pravna lica koja nemaju fizičku lokaciju, ali i situacije kada više pravnih lica dele jednu fizičku lokaciju (Groves, 2009). Osim toga, okviri uzorkovanja ne moraju pratiti organizacionu dinamiku, nastanak novih i gašenje postojećih organizacija, podele i spajanje kompanija...

Nekada su predmet istraživanja događaji, odnosno ciljna populacija je populacija događaja (poseta bioskopu, venčanja, bolesti, putovanja, saobraćajnih nesreća...). Ovakva istraživanja često koriste okvire uzorkovanja čije su jedinice osobe. Međutim, u ovakvim okvirima neke osobe nisu doživele događaj koji nas zanima, dok su neke druge doživele više njih. Drugi način da se pristupi ovakvim istraživanjima su vremenski okviri uzorkovanja. U ovakvom načinu uzorkovanja svakom događaju se pridružuje jedna vremenska tačka (npr. vreme napuštanja tržnog centra). Moguć je i pristup sa uzorkom vremenskih tačaka. U ovom pristupu određuju se blokovi od nekoliko minuta (5, 10...) i pokušava se ispitivanje onih koji u okviru tih vremenskih blokova iskuse događaj od interesa za istraživanje (npr. napuštaju železničku stanicu).

Ovakva istraživanja, osim populacije događaja može zanimati populacija osoba koja je događaj doživela. U tom slučaju javljaju se problemi poput „ko je zaista doživeo događaj“. Da li je novi automobil kupio onaj na koga će biti registrovan ili celo domaćinstvo (svaki njegov član) koje će ga koristiti? Okvire uzorkovanja bi trebalo ažurirati u skladu sa potrebama istraživanja, ali je preporuka da to bude što češće. 3.2.2.2.1. Postupak poluotvorenih intervala

Ukoliko je okvir uzorkovanja nepotpun, kao što to može biti slučaj kod okvira uzorkovanja nekih retkih populacija, on se može dopunjavati u toku samog istraživanja. Tada se koristi postupak poluotvorenih intervala (engl. half-open interval). U ovom načinu dopune okvira uzorkovanja istraživač od ispitivanog člana populacije dobija informacije o članovima populacije koji se ne nalaze u okviru, a koji takođe mogu biti ispitani. Ispitanik i članovi populacije čine mrežu. Problem sa ovakvim načinom dopune okvira uzorkovanja je u tome što se članovi jedne mreže mogu naći u uzorku više puta, odnosno dolazi do pojave dupliranja. Naime, element populacije se može naći u uzorku na osnovu inicijalnog okvira uzorkovanja, ali i kao deo mreže. Ovakve situacije rešavaju se ponderisanjem. Odgovori članova mreže ponderišu se recipročnom vrednošću veličine grupe (ako grupa broji 4 člana onda je ponder ¼, odnosno 0,25). Ovaj metod uzorkovanja i ponderisanja naziva se još uzorkovanjem mnoštva (engl. multiplicity sampling) (Groves, 2009). Međutim, treba voditi računa da je i izveštavanje jedinica koje se nalaze u uzorku o jedinicama koje ne pokriva okvir uzorkovanja podložno različitim tipovima grešaka, kako nesistematskim tako i sistematskim, odnosno, da može uticati na preciz-

46

POPULACIJA I UZORAK

nost i pristrasnost anketnih statistika. 3.2.2.3.

Slabosti okvira uzorkovanja

Osim nevalidnih podataka okviri uzorkovanja mogu imati i drugih slabosti koje će ovde biti nabrojane. S druge strane, neki okviri mogu sadržavati i dodatne informacije (pol, starost...) koje se mogu iskoristiti za unapređenje ankete (Dillman et al., 2014).

Ukoliko planiramo anketno istraživanje bazirano na nekom načinu probabilističkog uzorkovanja, jedno od centralnih pitanja koje treba da postavimo pre kreiranja uzorka je, koliko dobro dostupni spisak populacije reprezentuje populaciju od interesa. U idealnom okviru uzorkovanja elementi populacije su preslikani jedan-na-jedan. Na žalost, ovakvi okviri uzorkovanja ne postoje ili su izuzetno retki (Groves, 2009). Najčešće slabosti spiskova populacije su: nepokrivenost, dupliranje, grupisanje i nelegitimne jedinice. Moguće je da u jednom okviru uzorkovanja postoji više vrsta nedostataka simultano (i grupisanje i dupliranje, i nepokrivene i nelegitimne jedinice) te da neke od njih budu vezane za iste elemente populacije.

Greške koje mogu nastati kao rezultat slabosti nekog okvira uzorkovanja nisu vezane za konkretno anketno istraživanje već su moguće u svim anketnim istraživanjima koja se baziraju na tom okviru uzorkovanja. 3.2.2.3.1. Nepokrivenost

Sa aspekta pokrivenosti, jedinice ciljne populacije mogu biti pokrivene ili nepokrivene (Groves, 2009). Ukoliko se neki član populacije nalazi na spisku populacije (u okviru uzorkovanja) on je pokriven. Analogno tome, elemenat populacije koji se ne nalazi na spisku populacije je nepokriven. Pokriveni članovi populacije imaju neku nenultu verovatnoću da budu izabrani u uzorak, dok je za nepokrivene članove populacije ta verovatnoća nulta. Ukoliko je izostajanje elemenata iz okvira uzorkovanja slučajno, to ne bi trebalo da utiče na procene parametara koje su rezultat istraživanja zasnovanog na tom okviru uzorkovanja. Međutim, ukoliko je mehanizam izostajanja članova populacije iz okvira uzorkovanja sistematski povezan sa predmetom istraživanja, to može dovesti do pristrasnih procena parametara (videti poglavlje 5.2). 3.2.2.3.2. Nelegitimne jedinice

U vezi sa ovim problemima je i problem nelegitimnih jedinica. Nelegitimne jedinice su elementi spiska populacije koji nisu članovi ciljne populacije. Dakle, ovde je pitanje da li bi neka jedinica trebalo da se nalazi na spisku populacije ili ne? Ukoliko se nalazi, a ne bi trebalo, govorimo o nelegitimnoj jedinici. To su na primer telefonski brojevi preduzeća, ako se u istraživanju domaćinstava kao okvir uzorkovanja koristi telefonski imenik ili procedura slučajnog biranja telefonskih brojeva. U istom istraživanju to bi mogli biti i telefonski brojevi koji su van funkcije. U istraživanjima koja koriste zonski okvir, nelegitimne jedinice su jedinice koje se nalaze izvan zone interesovanja

47

OSNOVE ANKETNIH ISTRAŽIVANJA

anketnog istraživanja itd.

Postojanje nelegitimnih jedinica u okviru uzorkovanja može rezultirati realizovanim uzorkom koji će biti manji od planiranog pošto nelegitimne jedinice moraju biti odbačene. Ovaj problem se može izbeći prečišćavanjem okvira pre samog procesa uzorkovanja. Međutim, najčešće ovakve jedinice budu identifikovane tek kada započne prikupljanje podataka. Kada je unapred poznata bar približna proporcija nelegitimnih jedinica u okviru uzorkovanja, moguće je korigovati broj uzorkovanih jedinica kako bi se nadoknadile jedinice koje će biti odbačene. 𝑛𝑛𝑘𝑘𝑘𝑘𝑘𝑘 = 𝑛𝑛𝑝𝑝 /(1 − 𝑝𝑝𝑛𝑛𝑛𝑛 )

[2]

gde je nkor broj jedinica koje je potrebno uzorkovati (korigovana veličina uzorka) da bi se realizovala planirana veličina uzorka np uzimajući u obzir proporciju nelegitimnih jedinica pnl u okviru uzorkovanja. Ako smo planirali da obavimo anketno istraživanje na uzorku od 1500 domaćinstava koristeći proceduru slučajnog biranja telefonskih brojeva (RDD), a poznato nam je da ćemo na taj način uzorkovati i 20% (pnl=0,2) nelegitimnih jedinica (telefonski brojeva preduzeća, institucija... nepostojećih brojeva) račun bi bio sledeći: nkor=1500/(1-0,2)=1500/0,8=1875 Znači, bilo bi potrebno da uzorkujemo i pozovemo 1875 telefonskih brojeva kako bismo posle odbacivanja nelegitimnih jedinica realizovali planirani uzorak od 1500 domaćinstava (18751500=375 što je 20% nelegitimnih jedinica od 1875).

Pored podatka da li se neka jedinica populacije nalazi u okviru uzorkovanja ili ne, bitno je i pitanje da li neka legitimna jedinica na osnovu datog okvira uzorkovanja ima šansu da bude izabrana u uzorak proporcionalno svojoj zastupljenosti u populaciji 22. U vezi sa ovim pitanjem su problemi dupliranja i grupisanja. 3.2.2.3.3. Dupliranje

Dupliranje se javlja kada je neka jedinica u okviru uzorkovanja zastupljena više puta. Drugim rečima, dupliranje je situacija kada jednoj jedinici ciljne populacije odgovara više elemenata okvira uzorkovanja. Primer bi bila domaćinstva sa više telefonskih linija u situaciji kada se kao okvir uzorkovanja u istraživanju domaćinstava koristi telefonski imenik ili procedura slučajnog biranja telefonskih brojeva.

Jedinice ciljne populacije koje se u okviru uzorkovanja javljaju više puta mogu biti nadreprezentovane, odnosno imaće veći značaj nego što bi trebalo da bude slučaj I probleme pokrivenosti i nelegitimnih jedinica možemo posmatrati kao posebne slučajeve ovog problema. Nepokrivene jedinice bi trebalo da imaju neku nenultu verovatnoću da budu izabrane u uzorak, a kod njih je ta verovatnoća 0. Nelegitimne jedinice bi trebalo da imaju nultu verovatnoću, ali imaju veću. 22

48

POPULACIJA I UZORAK

na osnovu njihove zastupljenosti u populaciji. Dupliranje ne mora biti veliki problem i ne mora uticati na procene parametara koje se dobijaju anketnim istraživanjem, ako nije povezano sa predmetom istraživanja. Dupliranje će uticati na pristrasnost parametara i statistika dobijenih anketnim istraživanjem u slučaju da postoji sistematska povezanost. Sa pojavom dupliranja može se izboriti na više načina.

Pre uzorkovanja moguće je prečistiti spisak populacije. Ovo može biti lako izvodljivo ako je spisak u elektronskoj formi, dok u drugim slučajevima može biti dugotrajno i neekonomično. Ako je dupliranje uočeno u toku uzorkovanja, rešenje je da se samo jedno javljanje elementa populacije u spisku tretira kao legitimno (obično prvo), a ostala se tretiraju kao nelegitimne jedinice i zanemaruju prilikom uzorkovanja. Sličan je postupak i kada se dupliranje uoči u fazi prikupljanja podataka, ali ovo može rezultirati smanjenjem realizovanog uzorka.

U fazi analize podataka efekat dupliranja se može korigovati ponderisanjem. U tom slučaju odgovori jedinice populacije koja ima duplirane elemente u spisku populacije ponderišu se recipročnom vrednošću broja elemenata spiska populacije koji su vezani za tu jedinicu. Na primer, ako neko domaćinstvo ima dva broja telefona izlistana u telefonskom imeniku koji se koristi kao spisak populacije, odgovori prikupljeni u tom domaćinstvu će biti ponderisani sa 0,5 odnosno ½.

3.2.2.3.4. Grupisanje

Druga strana ovog problema je grupisanje (engl. clustering), odnosno situacija kada je više jedinica ciljne populacije vezano za jedan element okvira uzorkovanja. U situaciji iz prethodnog primera to bi bio slučaj kada bi više domaćinstava koristilo jedan telefonski broj.

Kada se javi grupisanje moguća su dva načina postupanja: ispitati sve elemente klastera ili izabrati uzorak unutar klastera. Oba ova načina imaju svoje dobre i loše strane.

Ukoliko se opredelimo da ispitamo sve elemente klastera, broj jedinica nije pod našom kontrolom osim ako veličine klastera nisu poznate unapred (Groves, 2009). Osim toga, pokušaj da se ispita više jedinica unutar klastera može dovesti do veće stope neodgovora (posebno ako su u pitanju telefonske ankete). Ako to nije slučaj, u zavisnosti od veličine klastera nekada je anketiranje potrebno obaviti u više vremenskih tačaka (termina). To ostavlja prostor članovima klastera da razgovaraju o temi istraživanja i svesno ili nesvesno vrše uticaj jedni na druge. Ovo se dešava čak i kada se radi o pitanjima koja se tiču činjenica – ne samo stavova i uverenja.

49

OSNOVE ANKETNIH ISTRAŽIVANJA

Drugi način postupanja u slučaju pojave grupisanja je da iz klastera izaberemo slučajni uzorak, odnosno jedinicu koju ćemo uključiti u istraživanje. U ovom slučaju spisak legitimnih jedinica, članova klastera, predstavlja okvir uzorkovanja za konkretni klaster. Jedinica koja će učestvovati u anketi bira se nekim načinom koji neće narušiti principe slučajnog biranja. Anketar mora unapred imati definisan način biranja u ovim slučajevima. Često se (u istraživanju domaćinstava) kao učesnik bira osoba čiji je rođendan najbliži, a moguća je i upotreba Kišovih (Kish) tablica slučajnih brojeva. Na taj način se eliminiše uticaj članova klastera jednih na druge, a broj ispitanika drži se pod kontrolom. Međutim, to rađa drugi problem. Naime, verovatnoća biranja koju elementi osnovnog okvira uzorkovanja imaju (a obično je jednaka za sve elemente) biće umanjena za jedinice koje su elementi klastera. Ovo umanjenje verovatnoće biće veće kod jedinica koje su članovi većih klastera, odnosno, verovatnoća biranja jedinice koja je deo nekog klastera biće manja što je klaster veći. Članovi klastera biće podreprezentovani. Opet, ovo samo po sebi ne mora uticati na pristrasnost pokazatelja, ali može ako je grupisanje povezano sa predmetom istraživanja. Npr. ako ispitujemo konstrukt koji je povezan sa materijalnim statusom, a grupisanje elemenata populacije je povezano sa lošijim materijalnim statusom (siromašnija domaćinstva dele telefonsku liniju, bolje stojeća – ne), biće nam podreprezentovan sloj ispitanika sa lošijim materijalnim statusom.

Problem podreprezentacije se takođe može korigovati ponderisanjem tokom analize. Odgovori podreprezentovanih jedinica obično će biti ponderisani brojem legitimnih jedinica u klasteru.

3.2.3. Planirani i realizovani uzorak

Retka je situacija kada se planirani uzorak zaista i realizuje. U tom smislu možemo napraviti razliku između planiranog i realizovanog uzorka. Kao što samo ime govori, planirani uzorak je onaj koji smo želeli da ostvarimo, a realizovani uzorak je onaj koji smo zaista i ostvarili.

Realizovani uzorak se od planiranog može razlikovati po veličini, po strukturi ili i po veličini i po strukturi. Razlozi zbog kojih istraživači ne uspevaju da ostvare planirani uzorak mogu biti razni. Uobičajeno i očekivano je da će se prilikom prikupljanja podataka istraživač susresti sa određenom stopom neodgovora 23 (ispitanik nije kod kuće, odselio se, umro, ne želi da odgovara...). Svi ovi činioci mogu delovati slučajno, ali mogu biti i sistematski. Zaposleni češće nisu kod kuće od nezaposlenih, mlađi se u potrazi za poslom i boljim životom češće sele od starijih, smrtnost je češća u određenim starosnim grupama, oni koji se osećaju

Ovakav nedostatak se može preduprediti uračunavanjem očekivane stope neodgovora u planiranu veličinu uzorka. Za ove potrebe moguće je koristiti prikazanu formulu za korigovanu veličinu uzorka [ 2 ]. 23

50

POPULACIJA I UZORAK ugroženim mogu odbiti da odgovaraju na ankete o osetljivim pitanjima, stari će češće prihvatati razgovor sa anketarom od mlađih, otvoreniji od rezervisanih...

Ova stopa će zavisiti i od metode prikupljanja podataka i manja je kod metoda koje uključuju veći stepen interakcije anketar-ispitanik. Metoda prikupljanja podataka može biti sistematski povezana sa neodgovorima. Na primer, veći broj neodgovora starijih može se javiti u internet anketama, a kod mlađih u telefonskim anketama.

Mogući razlozi mogu biti i više sile poput elementarnih nepogoda, ratova i sl. U ovom slučaju istraživač neće biti u mogućnosti da prikupi podatke od ispitanika iz oblasti pogođenim ovim pojavama. Ako je oblast u kojoj ispitanici žive povezana sa predmetom istraživanja, ovo može uticati na sistematske greške anketnih statistika.

Pogrešno planiranje ankete takođe može rezultirati odstupanjem realizovanog od planiranog uzorka. Ako istraživač planira anketu u jeku poljoprivrednih radova, vrlo je verovatno da neće uspeti da prikupi podatke od ispitanika koji se bave ovom granom privrede. I u ovom slučaju imamo sistematski činilac koji utiče i na poremećaj strukture realizovanog uzorka.

Slično, ako istraživač planira istraživanje u doba nekog verskog praznika (recimo Uskrsa) to može uticati da manji broj vernika odgovori na anketu. Ukoliko se istraživanje radi u multikonfesionalnoj sredini, a datumi verskih praznika se razlikuju, to može uticati na izostajanje ispitanika jedne konfesije, a druge ne. Opet će biti poremećena i struktura uzorka.

Ako je realizovani uzorak manji od planiranog to će rezultirati većim standardnim greškama statistika koje ćemo dobiti na osnovu istraživanja, odnosno, njihovom manjom preciznošću. Ako tom prilikom nije došlo do poremećaja u strukturi uzorka, ovo smanjenje neće uticati na pristrasnost dobijenih statistika (ali hoće na preciznost).

Međutim, ako do poremećaja u strukturi ipak dođe, statistici će biti i pristrasni. O poremećaju strukture možemo govoriti kada grupe ispitanika nisu zastupljene u realizovanom uzorku proporcionalno svojoj zastupljenosti u planiranom uzorku (koji bi trebalo da odražava njihovu zastupljenost u ciljnoj populaciji). Ovo je situacija prikazana u gornjim primerima sa anketama planiranim u jeku poljoprivrednih radova ili verskih praznika. Naravno, moguće je i vrlo često da se realizovani uzorak razlikuje i po veličini i po strukturi, što rezultira nepreciznijim i pristrasnim anketnim statisticima.

Kada se ovo desi, može se delovati na različite načine. Moguće su statističke korekcije nedostajućih podataka (imputacije i/ili ponderisanja o kojima će biti reči kasnije) ili dopuna realizovanog uzorka uz prethodnu analizu njegovih manjkavosti. Cilj ovakve analize je da se utvrdi koje grupe ispitanika nedostaju, odnosno kojim ispitanicima je potrebno dopuniti uzorak.

Ovakve korekcije zahtevaju dosta truda, znanja, kapaciteta i finansijskih sredstava, a efekti su im ograničeni. Mogu pomoći u slučaju malih odstupanja, kod kojih su i

51

OSNOVE ANKETNIH ISTRAŽIVANJA

efekti na anketne statistike mali. U ovom slučaju ne postoje velike razlike u anketnim statisticima između onih dobijenih na korigovanom i nekorigovanom uzorku, pa praktično nisu ni potrebne. Ukoliko su razlike planiranog i realizovanog uzorka velike, domet korekcija je mali, pa su korekcije u praksi retke (Fajgelj, 2004). Zbog toga je najuputnije u toku samog terenskog rada pratiti realizaciju planiranog uzorka i korektivno reagovati na vreme. Najbolji način borbe protiv neodgovora je dodatno angažovanje na prikupljanju odgovora od ispitanika koji su prvobitno izabrani u uzorak. To uključuje ponovne pokušaje kontakta i uveravanje ispitanika da ipak pristanu da učestvuju u anketnom istraživanju. Više o tome u poglavlju 8.

52

UZORKOVANJE

4. Uzorkovanje

Više puta smo ponovili da je jedna od osnovnih karakteristika anketnih istraživanja da se obavljaju na uzorku.

Ako zanemarimo greške koje mogu nastati u beleženju i obradi i tačnost podataka koje dobijamo od jedinica istraživanja, ukoliko bismo ispitali celu populaciju statistik koji bismo na taj način izračunali bio bi jednak pravoj vrednosti u populaciji. S druge strane, statistik dobijen na uzorku uvek je samo manje ili više tačna procena parametra populacije. Bez obzira kako se bira uzorak, vrednosti procena izračunatih na uzoračkim podacima razlikovaće se od pravih vrednosti parametara u populaciji.

Kada bismo iz neke populacije veličine N izvukli (prostim slučajnim biranjem) n uzoraka iste veličine i na njima izračunali procene nekog parametra X, svaki put bismo dobili različite vrednosti. Te vrednosti bi se u svim slučajevima razlikovale od prave vrednosti tog parametra u populaciji, odnosno, bile bi manje ili više dobre procene parametra. Nije nam svejedno da li su te procene dobre ili loše. Ukoliko na osnovu loše procene donesemo odluku, posledice pogrešne odluke mogu biti značajne (u svakom smislu). Zato je potrebno da znamo koliko je neka procena dobra, odnosno, zanima nas kolika je standardna greška parametra.

Standardna devijacija uzoračkih procena parametra oko njegove prave vrednosti u populaciji naziva se standardnom greškom parametra, ili u terminima anketnih istraživanja – greškom uzorkovanja ili uzoračkom greškom (engl. sampling error). Analogno standardnoj devijaciji i varijansi, kvadrat standardne greške parametra je varijansa uzoračke distribucije parametra (engl. variance of the sampling distribution). Standardna greška parametra se može iskoristiti za građenje intervala poverenja, odnosno intervalne procene parametra (engl. interval estimate) 24. Intervali poverenja grade se dodavanjem i oduzimanjem određenih umnožaka procene standardne greške na procenjeni parametar (više o tome u odeljku 5.1). Što su ovi intervali uži, to je timate).

24

Za razliku od samog statistika koji predstavlja procenu tačke (engl. point es-

53

OSNOVE ANKETNIH ISTRAŽIVANJA

procena bolja. Naravno, ovo važi samo ako je uzorak reprezentativan za ciljnu populaciju i distribucija posmatrane varijable (približno) normalna. Na primer, ako bismo želeli da procenimo prosečnu visinu svih odraslih stanovnika Srbije procenjujući je na slučajnom uzorku posetilaca fudbalskog derbija, verovatno je da interval poverenja ne bi obuhvatao pravu vrednost u populaciji. S obzirom da su posetioci derbija u velikoj većini muškog pola, koji su po pravilu viši, verovatno je da bismo dobili nerealno visoku procenu.

Problem je, što je za izračunavanje standardne devijacije uzoračkih procena parametara oko njegove prave vrednosti, potrebno poznavati tu pravu vrednost. Da nam je ta vrednost već poznata ne bi ni bilo potrebe za sprovođenjem anketnog istraživanja. Standardnu grešku ipak možemo proceniti na osnovu varijabilnosti posmatrane pojave u uzorku i veličine uzorka. Naime, standardna greška parametra zavisiće od toga koliko posmatrana pojava varira i koliko smo tog varijabiliteta uspeli da zahvatimo uzorkom. Zbog toga, u jednom istom istraživanju (anketi), na uzorku iste veličine, različite varijable (pitanja) mogu imati različite standardne greške i potrebno ih je računati za svaku varijablu posebno. O tome je potrebno voditi računa i prilikom planiranja potrebne veličine uzorka, i ravnati se prema varijabli sa najvećim varijabilitetom. Ukoliko neka pojava ne bi varirala, već na osnovu jednog ispitanika bismo mogli znati pravu vrednost parametra u populaciji. Bez obzira koji i koliki uzorak bio, uvek bismo dobili istu vrednost procene, a ona bi bila jednaka vrednosti parametra u populaciji. Greške ne bi bilo, bar ne one koja zavisi od uzorka. Tačnost procene ne bi zavisila od veličine uzorka.

Međutim, u anketnim istraživanjima pojave obično u manjoj ili većoj meri variraju (ili nisu interesantne). Što neka pojava više varira, potreban je veći uzorak da bi se zahvatili svi njeni različiti modaliteti (vrednosti) i došlo do tačnije procene. Ove zakonitosti se ogledaju i u izrazu za standardnu grešku procene parametra: 𝑠𝑠𝑠𝑠𝑀𝑀 = �

𝑠𝑠 2 𝑠𝑠 = 𝑛𝑛 √𝑛𝑛

[3]

gde je s2 varijansa, a s standardna devijacija procenjivane varijable u uzorku veličine n. Kvadrat standardne greške procene parametra je varijansa uzoračke distribucije parametra, odnosno varijansa 25 uzoračkih procena oko prave vrednosti parametra. Formula [ 3 ] je namenjena za kontinuirane varijable, ali se može lako modifikovati za binarne varijable (proporcije). Potrebno je izraz za varijansu kontinuirane varijable s2 zameniti izrazom za varijansu binarne varijable pq, gde je p proporcija javljanja jedne alternative, a q proporcija javljanja druge 26. Izraz p(1-p) je ekvivalentan izrazu pq, pošto se proporcije alternativa binarne varijable sabiraju do 1. Izraz je tada moguće napisati i ovako Prosečno kvadrirano odstupanje. Ako je uzorak manji od 20, za računanje varijanse binarne varijable bolje je 𝑛𝑛𝑛𝑛(1−𝑝𝑝) (Levy & Lemeshow, 1999). koristi izraz 𝑠𝑠 2 = 25 26

54

𝑛𝑛−1

UZORKOVANJE

(Fajgelj, 2004, 2013):

𝑝𝑝(1 − 𝑝𝑝) 1 𝑠𝑠𝑠𝑠𝑃𝑃 = � =� 𝑛𝑛 𝑝𝑝(1 − 𝑝𝑝)

[4]

Veličina koja je u ovim izrazima pod kontrolom istraživača je veličina uzorka. Varijabilnost pojave u populaciji je takva kakva je i na nju ne možemo uticati. Potrebno ju je prilikom planiranja uzorka samo dobro proceniti. To se može uraditi na osnovu rezultata prethodnih istraživanja na istoj ili sličnoj populaciji, pilot istraživanja ili ju je moguće postaviti na maksimum (nešto više o tome u odeljku 4.5).

Međutim, prethodni izrazi ne mogu se sa jednakim poverenjem primeniti na sve tipove uzoraka (videti poglavlje: 4.3 Probabilističko i neprobabilističko uzorkovanje). Osim toga, varijabilnost pojave u uzorku zavisiće i od primenjenog nacrta uzorkovanja (poglavlje 4.3.1). Ovo je svakako potrebno uzeti u obzir prilikom definisanja nacrta uzorkovanja.

4.1. Nacrt uzorkovanja

Nacrt uzorkovanja (engl. sample design) obuhvata plan uzorkovanja (engl. sampling plan) i procedure procene (engl. estimation procedures) (Levy & Lemeshow, 1999).

Plan uzorkovanja čini metodologija izbora uzorka iz populacije (odnosno spiska populacije).

Procedure procene su statistički modeli odnosno tehnike koje će biti korišćene za procenu parametara populacije i njihovih grešaka na osnovu podataka dobijenih na uzorku.

Željena preciznost procena parametara 27 populacije zavisiće od tipa odluka koje će biti donošene na osnovu njih, i samim tim od potreba i želja krajnjeg korisnika rezultata, odnosno naručioca istraživanja.

Zbog toga je prilikom definisanja nacrta uzorkovanja potrebna saradnja i razmena informacija između statističara, osoba zaduženih za sprovođenje ankete i krajnjih korisnika rezultata. U tom smislu, korisnici rezultata moraju definisati koje podatke žele da dobiju, te kolika preciznost i validnost im je potrebna za donošenje odluka na osnovu njih. Takođe, korisnici bi trebalo da odrede vremenski okvir i finansijska sredstva koja su na raspolaganju za realizaciju ankete. Osobe koje se bave sprovođenjem ankete trebalo bi da pruže informacije o ceni sprovođenja različitih modaliteta istraživanja i predlože alternativne načine realizacije. Na osnovu tih podataka statističari predlažu nacrt uzorkovanja koji će omogućiti realizaciju postavljenih ciljeva (Levy & Lemeshow, 1999). Ovaj postupak se može odigravati u više iteracija. 27

Veličina recipročna grešci procene parametra.

55

OSNOVE ANKETNIH ISTRAŽIVANJA

Preciznost anketnih statistika, odnosno procena parametara populacije, pre svega zavisi od veličine uzorka, ali i od metodologije uzorkovanja. Procene će biti pouzdanije što je uzorak veći i heterogeniji. Međutim, i cena istraživanja zavisi od istih faktora. S obzirom da je cena vrlo bitan ograničavajući faktor, problem postaje očigledan. Nacrt istraživanja, pa i nacrt uzorkovanja, obično predstavlja kompromis željenih svojstava anketnog istraživanja i mogućnosti koje zavise od budžeta.

Pored preciznosti, bitna karakteristika anketnih statistika je i njihova nepristrasnost. Da bi anketni statistici bili nepristrasni potrebno je da uzorak bude reprezentativan za populaciju na koju želimo da izvršimo generalizaciju. Ovo bi se moglo reći i na drugačiji način: anketni statistici će biti nepristrasne procene parametara za onu populaciju za koju je uzorak reprezentativan. Reprezentativnost uzorka se, opet, obezbeđuje njegovom dovoljnom veličinom i načinom biranja. Ne postoji kvantitativni pokazatelj reprezentativnosti uzorka. Ona je pre svega kvalitativno svojstvo i može se proveravati poređenjem nekog obeležja čija je distribucija u populaciji poznata sa njegovom distribucijom u uzorku (Fajgelj, 2004). Međutim, to rađa nove probleme i dileme. Sami istraživači ne mogu potvrditi reprezentativnost uzorka zato što oni i vrše istraživanje i uzorkuju kako bi nešto saznali o stvarnosti. Ova cirkularnost se još naziva paradoksom uzorkovanja (engl. sampling paradox). Istraživači često reprezentativnost uzorka pokušavaju da potvrde poredeći ga sa podacima popisa. Popisi uglavnom sadrže demografske varijable koje ne pokrivaju skup varijabli po kojima je nekada potrebno da uzorak bude reprezentativan. Osim toga, popisi se obavljaju periodično u intervalima od nekoliko godina 28. Oni su najtačniji u trenutku kada je popis obavljen, a kako vreme prolazi sve slabije odražavaju pravo stanje u populaciji (Lavrakas, 2008).

Da bi uzorak što bolje reprezentovao ciljnu populaciju potrebno je: 1) da posedujemo adekvatan okvir uzorkovanja, 2) da jedinice populacije u uzorak biramo slučajno, i 3) da imamo neki način kontrole koji će obezbediti da ključne podgrupe populacije budu adekvatno reprezentovane (Groves, 2009).

Naime, nijedan način uzorkovanja neće obezbediti reprezentativnost uzorka ukoliko okvir na osnovu kojeg vršimo uzorkovanje ne pokriva adekvatno ciljnu populaciju. Ako postoje elementi populacije koji se ne nalaze u okviru uzorkovanja, oni nemaju šansu da budu izabrani u uzorak. Ako su takvi nedostaci okvira uzorkovanja sistematski, može se desiti da čitave podgrupe populacije budu isključene. Ovi nedostaci javiće se u svakom istraživanju zasnovanom na takvim okvirima uzorkovanja i ne zavise od metode uzorkovanja. Slučajno biranje je najbolji način da se eliminišu pristrasnosti prilikom uzorkovanja, ali samo po sebi ne garantuje da će uzorak biti reprezentativan, odnosno ne obe28

56

U Republici Srbiji popisi stanovništva se vrše na svakih 10 godina (otprilike).

UZORKOVANJE

zbeđuje da će sve ključne grupe biti adekvatno reprezentovane. Da bi se to obezbedilo, najčešće se koristi mehanizam stratifikacije (odeljak 4.3.1.3). Ovaj mehanizam se bazira na podeli populacije na ključne stratume i uzorkovanje unutar njih. Veličina uzorka je bitna iz više razloga. Pored činjenice da od nje zavisi preciznost anketnih statistika, od nje zavisi i šansa pojedinih grupa da uopšte budu reprezentovane u uzorku. Da pojednostavimo, ukoliko je zastupljenost neke grupe u populaciji 1 promil, u uzorku od 500 ispitanika bi trebalo da bude 0,5 takvih slučajeva, što je nemoguće. Sasvim je moguće i da u duplo većem uzorku ostvarenom slučajnim biranjem nećemo naći nijednog ispitanika koji pripada toj grupi.

4.2. Pouzdanost, validnost i preciznost uzorkovanja

validne.

Uzorci bi trebalo da budu takvi da daju procene koje su pouzdane, precizne i

Pouzdanost procena odnosi se na njihovu ponovljivost, odnosno reproducibilnost. Uzorkovanje rezultira pouzdanim procenama parametara populacije ako u ponovljenim ispitivanjima dobijamo vrednosti koje se ne razlikuju previše. Ukoliko ne bi postojala greška merenja (poglavlje 5.4), pouzdanost bi bila obrnuto proporcionalna varijansi uzorkovanja, odnosno standardnoj grešci. Validnost procena se ogleda u tome koliko prosek ponovljenih procena na različitim uzorcima odstupa od prave vrednosti tog parametra u populaciji. Da nema greške merenja validnost bi zavisila samo od pristrasnosti procene.

Preciznost ili tačnost procene se odnosi na to koliko je, u proseku, određena vrednost procene udaljena od prave vrednosti tog parametra u populaciji. Procenjuje se na osnovu srednjeg kvadriranog odstupanja, ili njegovog kvadratnog korena, pri čemu niže vrednosti znače veću preciznost (Levy & Lemeshow, 1999).

4.3. Probabilističko i neprobabilističko uzorkovanje

Možemo razlikovati dve šire grupe metoda uzorkovanja: probabilističke (verovatnosne) i neprobabilističke (neverovatnosne).

Za razliku od neprobabilističkih uzoraka, za probabilističke uzorke je karakteristično da svaki element u populaciji ima poznatu, nenultu verovatnoću da bude izabran u uzorak. Zbog ove osobine probabilističkih uzoraka moguće je na osnovu podataka dobiti nepristrasne procene parametara populacije koji su linearna transformacija opaženih podataka. Takođe, uz uslov da je poznata združena verovatnoća uključivanja u uzorak bilo koje dve jedinice populacije, moguće je izračunati i standardne greške ovih procena (Levy & Lemeshow, 1999). Kod neprobabilističkih uzoraka ovo nije moguće. Odnosno, iako je možda matematički moguće to uraditi, nemamo prava da na osnovu tih zaključaka donosimo zaključke sa određenim stepenom poverenja.

57

OSNOVE ANKETNIH ISTRAŽIVANJA

Fajgelj (2004) na sledeći način rezimira razlike između probabilističkih i neprobabilističkih uzorka: 1. 2.

3.

Neprobabilistički uzorci ne podležu zakonima teorije verovatnoće pošto ne koriste pravilo jednakih verovatnoća prilikom biranja elemenata uzorka. Zbog toga se na njima ne mogu primeniti pravila inferencijalne statistike i izračunati pokazatelji kvaliteta poput preciznosti, validnosti. Samim tim ne mogu se testirati ni hipoteze.

I pored toga, neprobabilistički uzorci se često koriste zato što su manje zahtevni, kako po pitanju vremena, tako i po pitanju cene.

Osim toga, nekada se realizovani uzorci nastali na osnovu probabilističkog i neprobabilističkog uzorkovanja po svojim osobinama mogu toliko približiti da razlike postanu neznatne (Fajgelj, 2004). Ovde pre svega mislimo na neprobabilističko kvotno uzorkovanje o kojem će biti reči kasnije. Naime, čak i ako je primenjena neka od metoda probabilističkog uzorkovanja, neodgovori (posebno ako su sistematski) mogu učiniti da realizovani uzorak ne bude reprezentativan za ciljnu populaciju, odnosno da ne odslikava njenu strukturu. Osim neodgovora, na reprezentativnost probabilističkih uzoraka utiču i druge greške koje nisu vezane za sam nacrt uzorkovanja (na primer, greška pokrivenosti kao rezultat nekompletnog spiska populacije)(Lavrakas, 2008). S druge strane, kvotni uzorak, ukoliko se anketa na terenu sprovede pravilno i nema sistematskih neodgovora, može istu tu ciljnu populaciju bolje reprezentovati. Ovo je tačnije u slučaju kada se ispituju stavovi ispitanika, a manje tačno kada su u pitanju tzv. tvrda obeležja (činjenični, objektivni podaci).

Kada se sve to ima u vidu, te da zbog nedostataka u toku sprovođenja istraživanja pravi probabilistički uzorci u realnosti praktično ne postoje, nije neobično što se ne poštuje strogo statističko pravilo da se na neprobabilističkim uzorcima ne mogu računati standardne greške i testirati hipoteze. Sa aspekta statistike, sasvim je svejedno da li je uzorak izvorno neprobabilistički ili ne, ako ga realizacija čini takvim. U oba slučaja, procene parametara, grešaka i testiranje hipoteza biće samo aproksimacije i dovodiće do pogrešnih zaključaka.

Ako bi dosledno bila poštovana sva pravila statističkih modela ne bi ostalo prostora za bilo kakve relevantnije zaključke. To je razlog zbog kojeg se vrlo često susrećemo sa računanjem navedenih pokazatelja i testiranjem hipoteza na neprobabilističkim uzorcima. Ono što opravdava korišćenje statističkih pokazatelja i testova je reprezentativnost, a ne način uzorkovanja. Ako se može dokazati da je uzorak reprezentativan u zadovoljavajućem stepenu, onda je takva upotreba opravdana (Fajgelj, 2004). Kao što je već na početku poglavlja rečeno, dobar (probabilistički) nacrt uzorkovanja bi u obzir trebalo da uzme da li se njime ostvaruje potrebna preciznost procene parametara, budžet istraživanja i njegovu cenu, potrebno i raspoloživo vreme za spro-

58

UZORKOVANJE

vođenje takvog nacrta i izvodljivost. Nijedan nacrt istraživanja, bez obzira na potencijalnu cenu i preciznost, neće biti dobar ukoliko nije izvodljiv (Levy & Lemeshow, 1999).

U nastavku biće prikazani neki postupci probabilističkog i neprobabilističkog uzorkovanja.

4.3.1.

4.3.1.1.

Probabilističko uzorkovanje

Prosto slučajno uzorkovanje

Prost slučajni uzorak 29 je onaj u kojem svaki od svih mogućih uzoraka veličine n iz neke populacije N ima jednaku verovatnoću biranja (Levy & Lemeshow, 1999).

Ovaj vid uzorkovanja predstavlja prototip slučajnog uzorkovanja. Postupak je jednostavan. Potrebno je na neki od načina generisati spisak slučajnih brojeva veličine n (odnosno željene veličine uzorka) u rasponu od 1 do N (veličine populacije). Ova procedura mora obezbediti da se slučajno generisani brojevi ne ponavljaju. Ukoliko se ipak ponove, drugo javljanje istog broja potrebno je zanemariti. Nakon toga se sa spiska populacije u uzorak biraju jedinice čiji se redni brojevi nalaze u generisanom skupu slučajnih brojeva.

Generisanje skupa slučajnih brojeva se može uraditi pomoću tablica slučajnih brojeva, kalkulatora sa generatorom slučajnih brojeva, mobilnih aplikacija, ili računarski u okviru paketa za statistička i tabelarna izračunavanja (R, IBM SPSS, Statistica, Microsoft Excel i njegovi besplatni pandani iz paketa LibreOffice, OpenOffice...). U okviru softvera za statistička izračunavanja moguće su dve varijante postupka. U prvoj varijanti, potrebno je u okviru matrice podataka koja sadrži okvir uzorkovanja, kreirati varijablu koja će za svakog ispitanika sadržati slučajno generisan broj. Potom se podaci sortiraju po toj varijabli i izabere prvih ili poslednjih n ispitanika (može i srednjih). U drugoj varijanti softveru se može zadati da iz matrice podataka (okvira uzorkovanja) slučajnim izborom izdvoji poduzorak veličine n. Što se tiče paketa za tabelarna izračunavanja poput Microsoft Excela, u njemu se koristi prva varijanta.

Prosečni pokazatelj za sistematske slučajne uzorke može se jednostavno izračunati kao: 𝑥𝑥̅𝑝𝑝𝑝𝑝𝑝𝑝

𝑛𝑛

1 = � 𝑥𝑥𝑖𝑖 𝑛𝑛 𝑖𝑖=1

[5]

gde indeks psu označava da je pokazatelj dobijen na prostom slučajnom uzorku, indeks

Ovde, a i u nastavku knjige, govorićemo o uzorkovanju bez povrata, pošto je to dominantni način uzorkovanja. U ovakvom uzorkovanju svaki član populacije može samo jednom biti izabran u uzorak. U uzorkovanju uz povrat članovi populacije mogu biti izabrani u uzorak više puta. Kada su populacije velike, nema značajnih razlika između ova dva vida uzorkovanja. 29

59

OSNOVE ANKETNIH ISTRAŽIVANJA

i označava pojedinačni rezultat, a n je veličina uzorka.

Varijansa distribucije dobijene na prostom slučajnom uzorku je: 𝑣𝑣𝑝𝑝𝑝𝑝𝑝𝑝 = �

1 − 𝑓𝑓 2 � 𝑠𝑠 𝑛𝑛

[6]

gde je f proporcija uzorkovanja, odnosno odnos veličine uzorka n i populacije N (f=n/N), a s2 varijansa posmatrane varijable u uzorku, dobijena na standardni način:

U izrazu [ 6 ] deo �

𝑛𝑛

1 𝑠𝑠 = � � �(𝑥𝑥 − 𝑥𝑥̅ ) 𝑛𝑛 − 1 2

1−𝑓𝑓 𝑛𝑛

𝑖𝑖=1

[7]

� je korekcija za veličinu populacije. Korekcija je značajna

ako je proporcija uzorkovanja velika, odnosno populacija mala. Ovom korekcijom umanjuje se i vrednost procene varijanse distribucije uzorkovanja i samim tim vrednost greške uzorkovanja koja je njen kvadratni koren. 4.3.1.1.Slučajno sistematsko biranje sa jednakim verovatnoćama

Postupak sistematskog slučajnog biranja je donekle drugačiji. Kada utvrdimo potrebnu veličinu uzorka potrebno je izračunati interval uzorkovanja, odnosno korak. Interval uzorkovanja je odnos veličine populacije i željene veličine uzorka. Dobijamo ga kada veličinu populacije N podelimo potrebnom veličinom uzorka n: 𝑘𝑘 = 𝑁𝑁/𝑛𝑛

Ukoliko je k decimalan broj, uzima se ceo broj pre decimale.

[8]

Na primer, ako iz populacije N=40.000 želimo da izaberemo uzorak veličine n=800, korak će iznositi k=40.000/800=50. Ukoliko bismo želeli da izaberemo uzorak n=1.150 interval uzorkovanja će iznositi k=40.000/1.150=34,78. Pošto je to decimalan broj kao vrednost koraka uzećemo ceo broj pre decimale, odnosno 34. Postoje i mogućnost da se decimalni broj zaokruži na više (na najbliži ceo broj).

Nakon toga slučajno se generiše broj između 1 i k. Izbor elemenata vrši se počev od tog slučajno generisanog broja (ovo se čini kako bi se eliminisao mogući efekat redosleda elemenata na spisku), a zatim se bira svaki k-ti element sa spiska populacije. Metoda se još naziva biranjem po koraku, jer se jedinice biraju po koraku k od slučajno odabranog početka (Fajgelj, 2004). Pretpostavka ovog načina biranja je da spisak populacije ne sme biti poređan po redosledu koji ima veze sa posmatranom pojavom. Uobičajeno je da bude sortiran azbučno ili abecedno po nazivima (imenima) jedinica. Ukoliko je princip sortiranja jedinica na spisku povezan sa posmatranom pojavom, to može biti uzrok pristrasnosti. Do pristrasnosti može doći i ukoliko je spisak populacije osim po nazivima jedinica poređan i po nekim drugim kriterijumima, pri čemu nazivi nisu prvi kriterijum sortiranja. U tom slučaju se periodičnosti u spisku mogu poklopiti sa korakom, što može dove-

60

UZORKOVANJE

sti do podreprezentovanja jednog dela populacije, a nadreprezentovanja drugog.

Kao rešenje za takve situacije može se koristiti ponovno sortiranje spiska po nazivima, što je prilično lako ako je spisak populacije dostupan u elektronskoj formi. Kada to nije moguće, ili ne možemo odbaciti sumnje da u spisku populacije postoje periodičnosti povezane sa ispitivanom pojavom, može se koristiti varijanta ovog uzorkovanja koja se naziva sistematsko biranje sa višestrukim uzorcima (Fajgelj, 2004). U ovom postupku se umesto jednog bira m manjih uzoraka. Prvo se određuje m slučajnih početnih brojeva između 1 i m·k (po jedan za svaki od poduzoraka). Biranje svakog od poduzoraka kreće od odgovarajućeg slučajnog broja, a kao korak se uzima vrednost m·k, sve dok se ne dođe do kraja spiska. Zatim se uzima sledeći slučajni početni broj i po koraku m·k bira novi poduzorak.

Varijacija ovakvog načina uzorkovanja je da se generiše samo jedan slučajan početni broj, a dalje se biranje članova populacije u uzorak nastavlja po koraku m·k. Kada se dođe do kraja spiska, biranje se nastavlja od početka spiska. Svaki prolazak kroz spisak populacije tretira se kao posebni poduzorak. Dodatna prednost ovakvog načina biranja je to što prosek parametara populacije procenjenih na većem broju manjih uzoraka predstavlja bolju procenu nego jedan parametar procenjen na većem uzorku (Fajgelj, 2004).

Važno je napomenuti da, ukoliko interval uzorkovanja k=N/n nije ceo broj, dobijene procene parametara mogu biti pristrasne. Razlog je možda najlakše objasniti preko ponovljenog uzorkovanja iz iste populacije. Naime, u zavisnosti od slučajnog početnog broja, sistematsko slučajno uzorkovanje na osnovu zaokruženog decimalnog intervala uzorkovanja, rezultiraće uzorcima različite veličine (ne one koja je planirana). U uzorcima različite veličine relativni doprinos pojedinačnog rezultata je različit i to je izvor pristrasnosti. Naravno, što je uzorak veći, ta pristrasnost će biti manja, ali će ipak postojati.

Kako bi se ovo izbeglo moguća je modifikacija sistematskog slučajnog uzorkovanja ukoliko je veličina populacije poznata. U tom slučaju, posle određivanja intervala uzorkovanja (koraka) koji je decimalan broj, kao vrednost k uzima se ceo broj pre decimale. Slučajni početni broj se ne određuje u intervalu između 1 i k kao u osnovnoj varijanti, već u intervalu između 1 i N. Zatim se slučajni početni broj deli intervalom uzorkovanja, a kao početni broj koristi se ostatak. Pojasnićemo na primeru: Ukoliko je veličina populacije N=400, a želimo da odaberemo 30 ispitanika, interval uzorkovanja će biti k=400/30=13,33. Vrednost k zaokružićemo na 13. Zatim ćemo izabrati slučajni broj između 1 i 400 kao početnu tačku uzorkovanja. Recimo da je to broj 363. Podelićemo ga sa k. 363/13=27,92 Pošto 363 nije deljiv bez ostatka sa 13, dobićemo ostatak 12 jer je: 363-(27∙13)=363-351=12

61

OSNOVE ANKETNIH ISTRAŽIVANJA

Kao slučajnu početnu tačku uzorkovanja uzećemo broj 12. Ukoliko bi slučajna početna tačka sistematskog slučajnog uzorkovanja bila u intervalu između 1 i k, prethodni račun ne bi bio potreban. Drugi način da se pristupi ovom problemu je da se decimalna vrednost k zaokruži na veći broj. U tom slučaju, kako bismo ostvarili planiranu veličinu uzorka potrebno je spisak populacije tretirati kao cirkularan. Naime, kada se dođe do kraja spiska (a nije odabran potreban broj ispitanika), brojanje je potrebno nastaviti od početka. U prethodnom primeru to bi značilo da k zaokružujemo na 14. Izaberemo slučajni početak između 1 i 14 i od njega biramo svakog 14 ispitanika. Recimo da je slučajni početak broj 6. Biraćemo ispitanike pod rednim brojem 6, 20, 34... Do rednog broja 398 biće odabrano 29 ispitanika. Nedostajaće nam 1 ispitanik do željenog broja. U tom slučaju nastavićemo brojanje dalje. Pošto nam je do broja 400 ostalo samo 2 ispitanika, počećemo brojanje od početka spiska i doći do broja 12 (jer je 14-2=12). Kao poslednjeg ispitanika odabraćemo 12. na spisku.

Na sistematsko slučajno uzorkovanje može se gledati i kao na lakši način da se sprovede stratifikovano slučajno uzorkovanje (Fajgelj, 2004; Groves, 2009). Za to je potrebno da spisak populacije sadrži dodatne podatke o obeležjima po kojima želimo da stratifikujemo uzorak. Ako takvi podaci postoje, potrebno je spisak sortirati po tom obeležju (ili više njih), a tek unutar njega po imenima (nazivima) elemenata populacije. Dalje postupak teče uobičajeno, a broj ispitanika iz pojedinih stratuma biće proporcionalan zastupljenosti stratuma na spisku populacije. O stratifikovanom slučajnom uzorkovanju biće više reči u nastavku. 4.3.1.2.

Klaster uzorkovanje

Klaster uzorkovanje je vid uzorkovanja u kojem se metodom slučajnog biranja uzorkuju klasteri. Klasteri su grupe ili celine jedinica iste vrste (razredi su klasteri učenika, preduzeća su klasteri zaposlenih...). Oni prirodno i prostorno objedinjuju jedinice iste vrste. Upravo zbog toga (manjeg prostornog raspršenja) ovaj način uzorkovanja rezultira nižom cenom i vremenski kraćim prikupljanjem podataka i jedan je od najčešće korišćenih metoda uzorkovanja (Fajgelj, 2004). Osim toga, okviri uzorkovanja čije su jedinice klasteri, a ne npr. pojedinci, su mnogo dostupniji ili ih je lakše kreirati.

Čak i kada nam je cilj da uzorkujemo samo neke jedinice od kojih se klasteri sastoje, a ne same klastere, ovaj način uzorkovanja može umanjiti cenu i vreme potrebno za kreiranje odgovarajućeg okvira uzorkovanja. Kao što je već rečeno, adekvatni okviri uzorkovanja koji se sastoje od pojedinaca ili domaćinstava najčešće nisu dostupni, a cena kreiranja jednog takvog okvira za neku veću populaciju bi bila velika. Ukoliko nam je takav okvir neophodan, moguće je taj posao pojeftiniti i skratiti tako što ćemo u prvoj fazi iskoristiti mnogo dostupnije i jeftinije okvire čije su jedinice klasteri. Slučajnim uzorkovanjem možemo izabrati uzorak klastera, a okvir sa manjim jedinicama uzorkovanja kreirati samo za uzorak klastera, a ne celu populaciju. Dalje se proces uzorkovanja nastavlja nekom metodom slučajnog biranja jedinica unutar odabranih klastera (nekim od ranije opisanih načina), na osnovu novokreiranog okvira uzorkova-

62

UZORKOVANJE

nja. Iz svakog odabranog klastera bira se onoliko jedinica koliko je potrebno da bi se ostvarila željena proporcija uzorkovanja (f). Ovakav način uzorkovanja naziva se dvofazno jednostavno klaster uzorkovanje. Prosečni pokazatelj za jednostavne klaster uzorke možemo izračunati na sledeći način (Groves, 2009): 𝐵𝐵 ∑𝐾𝐾 𝑘𝑘=1 ∑𝑖𝑖=1 𝑥𝑥𝑖𝑖𝑖𝑖 𝑥𝑥̅𝑘𝑘𝑘𝑘𝑘𝑘 = [9] 𝐾𝐾𝐾𝐾

gde je xik pojedinačni rezultat jedinice (ispitanika) i iz klastera k, B broj ispitanika u klasterima, a K broj klastera.

Dakle, potrebno je prvo sabrati skorove ispitanika unutar klastera, zatim sabrati sume dobijene na klasterima, i na kraju podeliti ih ukupnim brojem ispitanika (proizvod broja ispitanika po klasteru i broja klastera). Pretpostavka je da su svi klasteri jednake veličine. Ukoliko nisu jednaki, umesto veličine B moguće je koristiti prosečnu veličinu klastera. Preporuka je da prilikom klaster uzorkovanja, klasteri budu približno jednake veličine. Ukoliko klasteri nisu jednake veličine može se koristiti i sledeći izraz: 𝑥𝑥̅𝑘𝑘𝑘𝑘𝑘𝑘

𝐾𝐾

𝑏𝑏𝑗𝑗

𝑘𝑘=1

𝑖𝑖=1

1 𝐵𝐵𝑘𝑘 = � � � � � � 𝑥𝑥𝑖𝑖𝑖𝑖 𝐾𝐾 𝑏𝑏𝑘𝑘

[ 10 ]

gde je K broj klastera, indeks k označava određeni klaster, Bk je broj jedinica u klasteru k (veličina klastera), bk je broj jedinica u uzorku koje potiču iz klastera k, a xik je vrednost posmatranog obeležja pojedinačnog ispitanika i iz klastera k. Uzoračka varijansa klaster uzorka dalje se može izračunati kao: 1 − 𝑓𝑓𝐾𝐾 2 𝑣𝑣𝑘𝑘𝑘𝑘𝑘𝑘 = � � 𝑠𝑠𝐾𝐾 𝐾𝐾

[ 11 ]

gde je 𝑠𝑠𝐾𝐾2 varijansa prosečnih skorova svih klastera oko zajedničke aritmetičke sredine, a K broj klastera.

Varijansa prosečnih skorova svih klastera oko zajedničke aritmetičke sredine računa se na sledeći način: 𝐾𝐾

1 𝑠𝑠𝐾𝐾2 = � � �(𝑥𝑥̅𝑘𝑘 − 𝑥𝑥̅𝑘𝑘𝑘𝑘𝑘𝑘 )2 𝐾𝐾 − 1 𝑘𝑘=1

[ 12 ]

U prethodnom izrazu 𝑥𝑥̅𝑘𝑘 je prosečna vrednost u klasteru k, a 𝑥𝑥̅𝑘𝑘𝑘𝑘𝑘𝑘 je prosek dobijen izrazom [ 9 ]. Vrednost fK u izrazu [ 11 ] dobija se kao odnos veličine uzorka klastera i populacije klastera (fK=K/NK). Standardna greška klaster uzoraka može se izračunati kao:

63

OSNOVE ANKETNIH ISTRAŽIVANJA

𝑠𝑠𝑠𝑠𝑘𝑘𝑘𝑘𝑘𝑘 =

𝜎𝜎𝑘𝑘𝑘𝑘𝑘𝑘 √𝐾𝐾

gde je 𝜎𝜎𝑘𝑘𝑘𝑘𝑘𝑘 standardna devijacija klaster uzorka, a k broj klastera u uzorku.

Standardna devijacija klaster uzorka se može izračunati na sledeći način: 𝜎𝜎𝑘𝑘𝑘𝑘𝑘𝑘 = �

2 ∑𝐾𝐾 𝑁𝑁𝑘𝑘 𝑘𝑘=1(𝑥𝑥̅𝑘𝑘 − 𝑥𝑥̅𝑘𝑘𝑘𝑘𝑘𝑘 ) � 𝐾𝐾 − 1 𝑁𝑁𝑘𝑘 − 1

[ 13 ]

[ 14 ]

Efekat nacrta (engl. design effect) uzorkovanja na uzoračku varijansu parametra, definiše se kao odnos varijanse distribucije uzorkovanja izračunate metodom za primenjeni nacrt uzorkovanja i metodom za proste slučajne uzorke (Groves, 2009). Označava se sa d2 i računa na sledeći način: 𝑣𝑣𝑘𝑘𝑘𝑘𝑘𝑘 𝑑𝑑 2 = [ 15 ] 𝑣𝑣𝑝𝑝𝑝𝑝𝑝𝑝

S obzirom da se radi o efektu na varijansu distribucije uzorkovanja, efekat na standardnu devijaciju uzorkovanja (standardnu grešku parametra) možemo dobiti ako izračunamo kvadratni koren iz d2.

d2 može biti jednak 1, ako su dve varijanse distribucije uzorkovanja jednake, odnosno – klasterizacija nema efekta. Efekat nacrta može biti veći od 1 kada postoji efekat klasterizacije i ona doprinosi povećanju uzoračke greške. Ukoliko je efekat manji od 1, onda klasterizacija smanjuje uzoračku grešku (vrlo retko). Na primer, ukoliko su na uzorcima (jednom klaster i jednom prostom slučajnom) veličine nklu=npsu=500 dobijene sledeće varijanse uzoračke distribucije za neku varijablu vklu=6,25 i 2 vpsu=1,83, onda je d =6,25/1,83=3,42. U tom slučaju klaster uzorkovanje bi povećalo interval 2 poverenja i standardnu grešku parametra za 85% jer je kvadratni koren iz d 1,85.

Efekat nacrta možemo iskoristiti i da procenimo smanjenje preciznosti procena parametara u terminima veličine uzorka (Groves, 2009). Ako veličinu klaster uzorka podelimo efektom nacrta (d2), dobićemo veličinu prostog slučajnog uzorka koji bi imao istu preciznost, odnosno efektivnu veličinu uzorka (engl. effective sample size). U prethodnom primeru to bi izgledalo ovako: 2

neu=nklu/d =500/3,42=146,20 Dakle, veličina prostog slučajnog uzorka koja bi dala istu preciznost (istu standardnu grešku parametra) kao klaster uzorak nkl=500 je neu=146. To istovremeno znači da ukoliko želimo da postignemo istu preciznost koju bismo dobili sa npsu=500, potreban nam je značajno veći klaster uzorak (3,42 puta veći).

Efekat nacrta je veći, odnosno klaster uzorkovanje povećava varijansu distribucije uzorkovanja u većoj meri, što su klasteri heterogeniji među sobom, a homogeniji unutar sebe. Osim toga, što su klasteri međusobno različitiji, to će biti relativno homo-

64

UZORKOVANJE

geniji unutar sebe.

Postoje nalazi koji ukazuju da unutrašnja homogenost klastera zavisi i od njihove veličine. Klasteri su obično homogeniji što su manji (Valliant, Dever, & Kreuter, 2013).

Kao pokazatelj homogenosti klastera koristi se stopa homogenosti. Stopa homogenosti je vrsta intraklasnog koeficijenta korelacije koji meri povezanost mera na nekoj varijabli unutar klastera u odnosu na povezanost elemenata u ukupnoj populaciji. Za jednostavne klaster uzorke može se izračunati na sledeći način: 𝐼𝐼𝐼𝐼𝐼𝐼 = 𝜌𝜌 =

𝑏𝑏

𝑏𝑏

𝑘𝑘 𝑘𝑘 𝐾𝐾 ∑𝑁𝑁 𝑘𝑘=1 ∑𝑖𝑖 ∑𝑗𝑗≠𝑖𝑖 (𝑥𝑥𝑘𝑘𝑘𝑘 − 𝑥𝑥̅𝑘𝑘𝑘𝑘 )�𝑥𝑥𝑘𝑘𝑘𝑘 − 𝑥𝑥̅𝑘𝑘𝑘𝑘 �

(𝑁𝑁𝐾𝐾 𝑏𝑏𝑘𝑘 − 1)(𝑏𝑏𝑘𝑘 − 1)𝑆𝑆 2

[ 16 ]

gde je NK broj klastera u populaciji, bk broj jedinica u k-tom klasteru, i i j su indeksi za različite jedinice (ispitanike), indeks k označava konkretni klaster, 𝑥𝑥̅𝑘𝑘𝑘𝑘 je populacijski prosek za klaster k, a S2 je varijansa konačne populacije. Ona se računa na sledeći način: 2

𝑁𝑁𝐾𝐾 𝑏𝑏𝑘𝑘

𝑆𝑆 = � � 𝑘𝑘=1 𝑖𝑖=1

(𝑥𝑥𝑘𝑘𝑘𝑘 − 𝑥𝑥̅𝑃𝑃 )2 𝑁𝑁𝐾𝐾 𝑏𝑏𝑘𝑘 − 1

[ 17 ]

gde je 𝑥𝑥̅𝑃𝑃 populacijski prosek parametra x. U praksi se tražene populacijske vrednosti (koje često nisu dostupne) zamenjuju procenama na osnovu podataka iz uzorka. Stopa homogenosti, odnosno intraklasni koeficijent korelacije, može se izračunati i iz nacrta analize varijanse 30, na sledeći način: 𝐼𝐼𝐼𝐼𝐼𝐼 = 𝜌𝜌 =

𝑏𝑏𝑘𝑘 𝑆𝑆𝑆𝑆𝑆𝑆 𝑏𝑏𝑘𝑘 − 1 𝑆𝑆𝑆𝑆𝑆𝑆

[ 18 ]

gde je SSW suma kvadrata unutar grupa (engl. sum of squares within groups), a SST ukupna suma kvadrata (engl. total sum of squares)(Lavrakas, 2008).

Stopa homogenosti može uzimati vrednosti od −1/(𝑏𝑏𝑘𝑘 − 1) do 1. Klaster uzorkovanje će rezultirati većom preciznošću od prostog slučajnog uzorkovanja kada se stopa homogenosti kreće u rasponu od −1/(𝑏𝑏𝑘𝑘 − 1) do 0. Što je vrednost ρ bliža 1, homogenost po posmatranom obeležju će biti veća unutar klastera nego kada se posmatra populacija u celini (Lavrakas, 2008). To će uzrokovati smanjenu preciznost procene parametra populacije, odnosno njenu veću standardnu grešku. Zašto je stopa homogenosti još bitna? Ona stoji u sledećem odnosu sa efektom nacrta uzorkovanja:

torom).

30

𝑑𝑑 2 = 1 + (𝑏𝑏𝑘𝑘 − 1)𝜌𝜌

[ 19 ]

Jednosmerna ANOVA sa klasterima kao jedinom nezavisnom varijablom (fak-

65

OSNOVE ANKETNIH ISTRAŽIVANJA

𝜌𝜌 =

i

𝑑𝑑 2 − 1 𝑏𝑏𝑘𝑘 − 1

[ 20 ]

To znači da će efekat nacrta biti veći što je stopa homogenosti ρ veća, ali i što je veći broj elemenata klastera u uzorku (bk). Ako je stopa homogenosti 0, d2 će biti jednak 1, odnosno neće biti efekta nacrta. Ako je stopa homogenosti manja od 0, efekat nacrta će biti manji od 1 i klaster uzorkovanje će biti efikasnije od prostog slučajnog biranja. Međutim, najčešća situacija je da se stopa homogenosti nalazi u intervalu između 0 i 1. Što je bliža 1, efekat nacrta biće veći, a klaster uzorak manje efikasan od prostog slučajnog uzorka iste veličine (Groves, 2009).

Ako ne možemo uticati na stopu homogenosti, možemo na broj elemenata koje ćemo birati iz svakog klastera. Poduzorkovanjem u okviru klastera može se smanjiti efekat nacrta klaster uzorkovanja. Drugim rečima, u slučaju kada je 0