Curs 9 Metode de Esantionare [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

Metode şi tehnici de eşantionare. Organizarea unui sondaj statistic O noţiune fundamentală în statistică este aceea de „populaţie”. Populaţia reprezintă o colectivitate, o colecţie de unităţi statistice (subiecţi, evenimente, fenomene) ce împărtăşesc o caracteristică comună. Specificarea unităţilor populaţiei studiate constituie o etapă importantă în desfăşurarea unei cercetări. În funcţie de criteriul unităţilor incluse, cercetarea poate fi: - cercetare totală, exhaustivă (tip recensământ); - cercetare selectivă, a unei părţi reprezentative din populaţie (selecţie, eşantion); - cercetare a unei colecţii de cazuri (loturi sau grupuri)1. - cercetare a unui caz / unitate socială (studiu de caz); În practică, de regulă se preferă studierea eşantionul. Această opţiune oferă o serie de avantaje: 1) costul mult mai mic; 2) operativitatea obţinerii informaţiei (timpul necesar este mult mai mic); 3) acurateţea rezultatelor (se reduc foarte mult erorile de culegere a datelor, pentru că volumul de activitate este mai mic şi se poate folosi personal calificat); 4) oferă posibilitatea studierii unor populaţii pentru care observaţia totală este imposibilă (ex. populaţia fumătorilor); Populaţia reprezintă întregul grup care ne interesează, iar eşantionul grupul cu care lucrăm efectiv, unităţile de informaţie care sunt selecţionate pentru a fi efectiv studiate. Ex. dacă vrem să realizăm un studiu privind situaţia socio-familială a minorilor cu abandon şcolar din Argeş, populaţia este reprezentată de toţi aceşti minori iar eşantionul de cazurile selecţionate pentru a fi efectiv studiate. Scopul studierii eşantionului nu este propriu-zis de a cunoaşte eşantionul, ci de a cunoaşte populaţia din care acesta provine. Rezultatele obţinute pe eşantion sunt extinse la nivelul întregii populaţii de interes2. constituite printr-o manieră de eşantionare mai puţin sistematică ( „eşantionare de oportunitate”) raţionamentul statistic este următorul: concluziile obţinute pe eşantion sunt extrapolate, în anumite condiţii şi folosind anumite proceduri specializate, la întreaga populaţie 1 2

Pentru a putea face această generalizare, trebuie ca eşantionul să fie reprezentativ pentru respectiva populaţie - să reproducă cât mai fidel structura şi caracteristicile sale. Reprezentativitatea este cerinţa de bază pe care trebuie să o satisfacă eşantionul. Reprezentativitatea este o noţiune relativă, graduală, în sensul că un eşantion este mai mult sau mai puţin reprezentativ, nu doar reprezentativ sau nereprezentativ.

a. b.  

c.

Gradul de reprezentativitate al eşantionului depinde de următoarele aspecte: caracteristicile populaţiei ce urmează a fi studiate: populaţie omogenă vs. eterogenă (nivelul dispersiei indivizilor în jurul mediei); mărimea eşantionului – elemente orientative: mărimea eşantionului nu se determină ca proporţie din colectivitatea totală; sporul de reprezentativitate nu este direct proporţional cu creşterea volumului eşantionului; există formule teoretice de determinare a mărimii unui eşantion, care ţin cont de nivelul probabilităţii cu care se face estimarea şi de mărimea erorilor de estimare; acestea sunt diferite pentru variabilele numerice / nonnumerice; procedura (schema) de eşantionare folosită: modul de construire, de structurare a eşantionului; acest aspect influenţează considerabil reprezentativitatea unui eşantion.

Procedee de eşantionare Distincţia clasică care se face când se discută tipurile de eşantionare este între eşantionarea aleatoare (probabilistică) şi eşantionarea nealeatoare (neprobabilistică). În eşantionarea aleatoare, selecţia unităţilor statistice se face „întâmplător”3, fiecare individ din populaţie având o şansă calculabilă şi non-nulă de a fi inclus în eşantion. Tehnicile de eşantionare aleatoare sunt: - eşantionare simplă aleatorie: are ca prototip loteria (tragerea la sorţi); prezintă dezavantajul că se pot extrage eşantioane nereprezentative; - eşantionare prin stratificare: colectivitatea generală se împarte în clase (grupe, straturi), după un anumit criteriu (ex. gen, nivel educaţional); se extrage un subeşantion din fiecare strat, iar eşantionul final este suma acestor subeşantioane; dar atenţie, este vorba de „întâmplător” în sens matematic (ex. dacă vreau să realizez un studiu pe adulţi tineri şi ies în curtea facultăţii şi „la întâmplare” aleg 25 de studenţi, nu am constituit un eşantion aleatoriu…studenţii reprezintă un eşantion deja selecţionat din populaţia generală a adolescenţilor) 3

prezintă avantajul de a asigura reprezentarea tuturor claselor în eşantion şi deci un grad crescut de reprezentativitate al eşantionului; - eşantionare multistadială sau grupală (sondajul de serie): se selectează grupuri, nu indivizi (ex. aleg nu studenţi, ci grupe de studenţi); este tehnica folosită în aproape toate cercetările concrete ce vizează populaţii extinse, pentru că presupune costuri mai mici şi un timp mai scurt de realizare; prezintă însă dezavantajul că eşantionul obţinut este mai puţin reprezentativ (la volum egal) decât unul simplu aleatoriu. În eşantionarea nealeatoare (dirijată, neprobabilistică), unităţile eşantionului sunt stabilite conform unor criterii prestabilite, obiective. Este procedura cel mai des folosită în realizarea de anchete şi sondaje, deşi NU permite, stricto sensu, calculul reprezentativităţii. Cea mai cunoscută tehnică de eşantionare nealeatoare este eşantionarea pe cote. Formal, procedeul se aseamănă cu eşantionarea prin stratificare (se folosesc şi aici, în linii mari, aceiaşi factori de stratificare), numai că aici se indică „cote” (frecvenţa indivizilor ce prezintă anumite însuşiri); cotele pot fi: a. independente, ex. pt. gen: 52% F, 48% B (astfel, la 1000 persoane, vom avea: 520 F, 480 B) b.”cote legate” (încrucişate), ex.: B F Urban 300 300 Rural 180 220 O modalitate de construcţie a unui eşantion naţional 1. se stabileşte volumul eşantionului; OBS. în majoritatea cercetărilor cantitative la nivel naţional, volumul eşantionului este de 1200 subiecţi; 2. se foloseşte procedeul de stratificare, luându-se în calcul dispersia populaţiei pe zone geografice şi medii de provenienţă: 2.1. zone geografice / euroregiuni – ex. Euroregiunile României:  Nord-Est: Suceava, Botoşani, Neamţ, Iaşi, Bacău, Vaslui  Sud Est: Buzău, Vrancea, Galaţi, Brăila, Tulcea, Constanţa  Sud: Prahova, Argeş, Teleorman, Călăraşi, Ialomiţa, Giurgiu  Sud-Vest: Olt (Craiova), Vâlcea, Gorj, Dolj, Mehedinţi  Vest: Caraş, Timiş (Timişoara), Hunedoara, Arad  Nord-Vest: Bihor, Satu Mare, Maramureş, Cluj, Sălaj, Bistriţa  Centru: Sibiu, Braşov, Covasna, Harghita, Mureş, Alba (Alba Iulia)  Bucureşti- Ilfov (Bucureşti) 2.2. tipul localităţii de domiciliu; de regulă, se disting patru categorii de localităţi:

- comune rurale; - oraşe mici (sub 20.000 locuitori); - oraşe mijlocii (20.000- 99.999); - oraşe mari (peste 100.000) OBS: Pe fiecare euroregiune, se iese din procedeul de stratificare şi se foloseşte eşantionarea multistadială. Se selectează 2- 3 judeţe (inclusiv judeţul regional). Apoi în fiecare judeţ se selectează de ex. două oraşe (din care unul –reşedinţa de judeţ) şi două sate; urbanul se împarte în “centru” şi “periferie”, iar ruralul în „centru comună” şi „sat aparţinător”. Trebuie acordată atenţie următoarelor aspecte: - pe fiecare euroregiune / judeţ, se calculează ponderea fiecărei subpopulaţii4; - pe lângă cotele pe rural / urban, există cote pe gen şi vârstă - ponderarea pe urban - rural într-un judeţ: trebuie raportată la ponderea urban rural din populaţia respectivului judeţ; - mărimea urbanelor; urban reşedinţă de judeţ nu poate avea un număr de respondenţi egal cu urban 2- de regulă un orăşel; - în Bucureşti trebuie acoperite toate cele 6 sectoare, atât la centru cât şi la periferie; 3. se precizează modalitatea de selecţie a gospodăriilor / indivizilor - ex. într-un sat, se selectează gospodăriile de pe partea dreaptă a drumului, folosind pasul statistic 1 (casele se iau la rând); într-o gospodărie, se selectează persoana care are vârsta de peste 18 ani şi care îşi serbează prima ziua de naştere. Erorile în cercetarea statistică Acurateţea datelor este afectată de eroare. Erorile sunt de două mari tipuri: erori de observare şi erori de reprezentativitate. Erorile de observare (de măsurare, de culegere a datelor) sunt specifice oricărui tip de cercetare statistică (sondaj, cercetare totală), cu menţiunea că în cazul sondajului au o pondere mai mică (pentru că se foloseşte personal calificat pentru culegerea datelor).

4

folosind datele din Anuarul Statistic al României

Erorile de reprezentativitate (de selecţie, de eşantionare) sunt specifice cercetării prin sondaj. Ele vizează reprezentativitatea eşantionului (traduce faptul că eşantionul nu reprezintă identic structura populaţiei din care a fost obţinut) şi sunt legate de modalitatea de eşantionare. Pot fi de două tipuri: a) erori sistematice: - provin din acţiunea constantă a unor factori sistematici, care produce o „deplasare” a valorilor înregistrate într-un sens sau altul (se produc într-un singur sens); ex. întrebând studenţii cât de des citesc cărţi, aceştia vor avea tendinţa de a supraevalua în raportări; abordând teme sensibile (ex. violenţa în familie), oamenii vor tinde să nu răspundă sau vor încerca să disimuleze - afectează reprezentativitatea eşantionului într-un mod flagrant, şi de aceea influenţează profund rezultatele b) erori întâmplătoare: - sunt rezultatul acţiunii unor factori aleatori; ex. la introducerea datelor, în loc de 25 de ani la „vârsta respondentului” operatorul tastează greşit şi introduce „23”; - producându-se în ambele sensuri, au tendinţa să se compenseze (astfel, nu mai influenţează rezultatele); - nu pot fi evitate (ele există tot timpul), chiar dacă se respectă riguros procesul de selecţie; dar: pot fi estimate probabilistic şi micşorate Reprezentativitate şi erori de eşantionare Reprezentativitatea este cu atât mai bună cu cât avem de-a face cu erori de eşantionare mai mici. În exprimarea cantitativă a gradului de reprezentativitate a unui eşantion, intervin două entităţi: 1) eroarea maximă („d”), ce exprimă diferenţa cea mai mare pe care o acceptăm să apară între o valoare găsită pe eşantion şi valoarea corespunzătoare din populaţie; cu ajutorul ei, se construieşte un interval, în interiorul căruia se va găsi valoarea căutată; 2) nivel de probabilitate sau nivel de încredere („p”); care arată ce şanse sunt ca eroarea reală comisă, să nu depăşească limita „d”; limita minimă de acceptabilitate este p= 0,95 Obs. cele două mărimi, d şi p, nu sunt independente; fixând una din ele, cealaltă rezultă din calcul. Nu putem creşte simultan şi precizia estimării şi siguranţa acesteia