58 0 2MB
UNIVERSITATEA BABEŞ-BOLYAI CLUJ-NAPOCA CENTRUL DE FORMARE CONTINUĂ, ÎNVĂŢĂMÂNT LA DISTANŢĂ ṢI CU FRECVENŢĂ REDUSĂ
Specializarea : Asistenţă Socială Conf.dr. CORNELIA MUREȘAN
PROIECTAREA ȘI ANALIZA BAZELOR DE DATE SOCIALE
C.F.C.I.D
ANUL III
Cluj-Napoca 2018
CUPRINS Programa analitică ........................................................................................... 4 Partea I. Pachetul statistic SPSS .................................................................. 8 Capitolul 1. Introducere ........................................................................................ 8 1.1. Baze de date sociale şi SPSS ..................................................................................... 8 1.2. Procesul de analiză statistică a datelor în SPSS ....................................................... 10
Capitolul 2. Introducere în SPSS sub Windows ................................................ 12 2.1. Pornirea SPSS .......................................................................................................... 12 2.2. Sistemul de meniuri ................................................................................................. 13 2.3. Linia de pictograme ................................................................................................. 14 2.4. Casetele de dialog .................................................................................................... 14 2.5. Asistenţa “on-line”................................................................................................... 15
Capitolul 3. Proiectarea unei baze de date sociale ............................................ 16 3.1. Utilizarea Editorului de date SPSS .......................................................................... 16 3.2. Un exemplu.............................................................................................................. 16 3.3. Proiectarea schemei de codificare ............................................................................ 17 3.4. Definirea variabilelor ............................................................................................... 17 3.5. Atribuirea numelui variabilei ................................................................................... 17 3.6. Schimbarea tipului variabilei ................................................................................... 18 3.7. Adăugarea etichetelor descriptive pentru variabile şi valori .................................... 19 3.8. Atribuirea valorilor omise ........................................................................................ 21 3.9. Valori omise sistem şi valori omise utilizator .......................................................... 22 3.10. Schimbarea formatului coloanei ............................................................................ 23 3.11. Definirea variabilelor adiţionale ............................................................................ 23 3.12. Introducerea datelor .............................................................................................. 24 3.13. Editarea datelor ...................................................................................................... 24 3.14. Examinarea informaţiilor în Editorul de date ........................................................ 24 3.15. Utilizarea etichetelor variabilelor în proceduri ...................................................... 25 3.16. Salvarea fişierului de date ...................................................................................... 25 3.17. Diferenţa dintre Save As şi Save ........................................................................... 26 3.18. Ieşirea din SPSS ..................................................................................................... 26
Capitolul 4. Căutarea erorilor şi analize statistice exploratorii ....................... 28 4.1. Procedura Frequencies ............................................................................................. 28 4.2. Procedura Crosstabs................................................................................................. 29 4.3. Procedura Descriptives ............................................................................................ 31 4.4. Procedura Means ..................................................................................................... 31 4.5. Procedura Explore ................................................................................................... 32 4.6. Depistarea erorilor ................................................................................................... 34
Partea a II –a. Analiza statistică inferenţială .............................................. 37 Capitolul 5. Căutarea confirmării ipotezelor .................................................... 37 5.1. Testarea ipotezelor .................................................................................................. 37 5.2. Explicatii alternative ............................................................................................... 38 5.3. Respingerea explicaţiei şansei prin testele statistice ............................................ 39 5.4. Dovezi suficiente şi semnificaţie .......................................................................... 42 5.5. Relaţii statistic semnificative şi rezultate substanţiale ......................................... 44 5.6. Rezumat ................................................................................................................... 44 5.7. Întrebări pentru studiu ............................................................................................ 45
Capitolul 6. Selectarea unui test statistic ......................................................... 46 6.1. Importanţa selectării unui test statistic potrivit ................................................... 46 6.2. Consecinţele folosirii unui test statistic necorespunzător ................................... 46 6.3. Consideraţii care influenţează alegerea unui test ................................................ 47 6.4. Teste parametrice şi neparametrice ....................................................................... 49 6.5. Căpătarea deprinderilor de folosire a testelor statistice ...................................... 50 6.6. Rezumat ................................................................................................................... 50
2
6.7. Întrebări pentru studiu ............................................................................................ 50
Capitolul 7. Asocierea .......................................................................................... 52 7.1. Ce caută să determine asocierea .......................................................................... 53 7.2. Logica tabelelor de asociere .................................................................................... 53 7.3. Când să nu utilizăm asocierea .............................................................................. 60 7.4. Asocierea cu trei sau mai multe variabile .......................................................... 62 7.1. Exemplu din micro-practică................................................................................... 63 7.6. Exemplu din macro-practică .................................................................................. 66 7.7. Rezumat ................................................................................................................... 68 7.8. Întrebări pentru studiu ............................................................................................ 68
Capitolul 8. Corelaţia........................................................................................... 70 8.1. Conceptul de corelaţie ........................................................................................... 70 8.2. Logica corelaţiei ..................................................................................................... 73 8.3. Corelaţia cu trei sau mai multe variabile ........................................................... 79 8.4. Exemplu din micro-practică................................................................................... 79 8.5. Exemplu din macro-practică .................................................................................... 82 8.6. Rezumat ................................................................................................................... 84 8.7. Întrebări pentru studiu ............................................................................................ 84
Capitolul 9. Compararea mediilor...................................................................... 86 9.1. Popularitatea statisticii t ......................................................................................... 86 9.2. Logica statisticii t ..................................................................................................... 87 9.3. Calcularea şi interpretarea valorilor lui t............................................................. 88 9.4. Prezentarea statisticii t ............................................................................................. 91 8.5. Când nu se foloseşte testul t .................................................................................... 92 8.6. Exemplu din micro-practică.................................................................................... 93 9.7. Exemplu din macro-practică ................................................................................... 95 9.8. Rezumat ................................................................................................................... 98 9.9. Intrebări pentru studiu ............................................................................................ 98
Capitolul 10. Alte teste statistice .................................................................... 100 10.1. Alternative pentru testele de asociere ................................................................. 100 10.2. Alte teste pentru măsurători de nivel ordinal ....................................................... 102 10.3. Rezumat ............................................................................................................... 107 10.4. Întrebări pentru studiu .......................................................................................... 107
BIBLIOGRAFIE ................................................................................................ 109
3
Programa analitică Date de contact ale titularului de curs Nume: Lect. dr. Paul Teodor Hărăguş Tutore: drd. Sergiu Raiu Birou: Bdul 21 Decembrie 1989, nr. 128130
Date de identificare curs şi contact tutori Proiectarea si Analiza Bazelor de Date Sociale Codul cursului – ALR 2603
Telefon: 40.264-42.46.74 Fax: 40.264-42.46.74 E-mail: [email protected] Consultaţii: Luni, orele 10 – 12
Anul III, sem. II Tipul cursului: obligatoriu
Condiţionări şi cunoştinţe prerechizite: Nu sunt impuse condiţionări pentru participarea la acest curs. Este un curs fundamental pentru specializarea în domeniul asistenţei, ce urmăreşte familiarizarea studenţilor cu domeniul şi particularităţile asistenţei sociale ca profesie. Descrierea cursului: Intentia cursului este de a ajuta studentii de la asistenta sociala, in special studentii in anii terminali sa isi dezvolte abilitati de a folosi proceduri statistice, si sa inteleaga rezultatele acestor proceduri. Alte aspecte pe care cursul incearca sa le acopere sunt: invatarea lucrului cu calculatorul pentru introducerea datelor, analiza datelor, si aprofundarea unor abilitati de programare folosind softul SPSS. Acest curs constituie o introducere in analiza si interpretarea datelor, asa cum este folosita in practica asistentei sociale iar printre avantajele pe care studentii le vor dobandi se numara si cele legate de abilitatea lor de a conduce cercetari stiintifice, dar si de a evalua critic alte cercetari sau chiar practica asistenţei sociale. La sfârşitul acestui curs studentul trebuie să: 1. îşi dezvolte abilitatea de a gândi critic, mai ales când vine vorba despre producerea, analiza şi interpretarea datelor relevante pentru practica asistenţei sociale. 2. analizeze şi să interpreteze datele folosind calculatorul şi softurile statistice dedicate (SPSS) 3. sa acumuleze abilitati legate de folosirea datelor existente dar si de producerea altora noi, folositoare practicii asistentei sociale, adaptate la nevoile specifice ale clientilor, contextelor etc. 4. identifice si sa formuleze probleme de cercetare, sa inteleaga diferitele abordari teoretice asupra cercetarii, sa inteleaga diferitele abordari asupra designului cercetarii, sa poata utiliza diferite metode statistice pentru analiza datelor. 5. construiasca un program de cercetare care sa fie capabil sa evalueze practica asistentei sociale.
Temele abordate în cadrul cursului: Familiarizarea cu tematica cursului. Ce este cercetarea stiintifica? De ce trebuie sa facem cercetare stiintifica? La ce foloseste? Rolul si functiile cercetarii in asistenta sociala. Identificarea unei probleme: ce studiem? Intrebarea de cercetare. Conceptualizare si masurare. Esantioane si tipuri de esantioane. Designul cercetarii. Unitati de analiza. Design experimental, cvasi-experimental si nonexperimental. Perspective diferite asupra cercetarii. Literatura de specialitate. Softuri pentru analiza bazelor de date: prezentare generala SPSS, STATA etc. 4
Mediul de lucru in SPSS. Familiarizarea cu sistemul de meniuri si optiuni. Exercitii practice. Folosirea SPSS pentru generarea unei baze de date. Cum construim o baza de date? Reguli generale si specifice. Explorarea datelor. Etichete. Etichetele variabilelor. Valori omise. Sabloane. Cataloage de coduri. Cautarea erorilor in baza de date. Exercitii practice. Crearea de noi variabile: masuri compuse. Variabile tip „index”. Reducerea variantelor de raspuns. Variabile de tip „dummy”. Optiunile Recode, Compute. Exercitii practice. Verificare intermediara: prezentare schitei proiectului de cercetare. Analiza datelor. Analiza univariata. Prezentarea grafica a datelor. Analiza bivariata. Prezentarea rezultatelor. Interpretarea rezulatetelor. Dileme si posibile solutii. Analiza multivariata. Cauze multiple. Prezentarea rezultatelor: raportul de cercetare. Elemente constitutive. Exemple practice. Sarcinile cursantului: 1. Evaluarea continua a activităţii studentului în cadrul cursului: - comentarii pe baza unor lecturi - interventii/comentarii pe tema cursului 20% 2. interventii/comentarii la prezentarile colegilor Verificare parţială (schiţă a proiectului de cercetare) în săptămâna a 6-a 30% 3. Proiect de cercetare (predat in ultimele saptamani de scoala) 50%
Prezentarea conţinuturilor tematice 1. Introducerea. Familiarizarea cu tematica cursului. Ce este cercetarea stiintifica? De ce trebuie sa facem cercetare stiintifica? La ce foloseste? Rolul si functiile cercetarii in asistenta sociala. 2. Identificarea unei probleme: ce studiem? Intrebarea de cercetare. Conceptualizare si masurare. Esantioane si tipuri de esantioane. 3. Designul cercetarii. Unitati de analiza. Design experimental, cvasi-experimental si non-experimental. Perspective diferite asupra cercetarii. Literatura de specialitate. 4. Softuri pentru analiza bazelor de date: prezentare generala SPSS, STATA etc. Mediul de lucru in SPSS. Familiarizarea cu sistemul de meniuri si optiuni. Exercitii practice. 5. Folosirea SPSS pentru generarea unei baze de date. Cum construim o baza de date? Reguli generale si specifice. Explorarea datelor. 6. Etichete. Etichetele variabilelor. Valori omise. Sabloane. Cataloage de coduri. Cautarea erorilor in baza de date. Exercitii practice. 7. Crearea de noi variabile: masuri compuse. Variabile tip „index”. Reducerea variantelor de raspuns. Variabile de tip „dummy”. Optiunile Recode, Compute. Exercitii practice. 8. Verificare intermediara: prezentare schitei proiectului de cercetare. 9. Analiza datelor. Analiza univariata. Prezentarea grafica a datelor. 10. Analiza bivariata. Prezentarea rezultatelor. Interpretarea rezulatetelor. Dileme si posibile solutii. 11. Analiza multivariata. Cauze multiple. 12. Prezentarea rezultatelor: raportul de cercetare. Elemente constitutive. Exemple practice. 13. Prezentarea proiectului de cercetare. 14. Prezentarea proiectului de cercetare. Incheierea cursului. Bibliografie obligatorie: 1. Babbie Earl R., Halley Fred, Zaino Jeanne (2000). Adventures in social research. Thousand Oaks, Calif : Pine Forge Press. 2. Babbie, Earl R. (2010). Practica cercetarii sociale. Iasi: Polirom.
5
3. Blaxter, L., Hughes, C., Tight, M. (2001). How to research. 2nd Ed., Open Univ. Press. 4. Field, Andy (2007). Discovering statistics using SPSS. 2nd Ed, Thousand Oaks, Ca: Sage. 5. Morris, Teresa (2006). Social work research methods: four alternative paradigms. Thousand Oaks, Ca: Sage. 6. Tutty, L.M., Rothery, M., Grinell, R.M Jr. (2005). Cercetarea calitativă în asistenţa socială. Faze, etape şi sarcini. Iaşi: Polirom. 7. Rotariu T., Badescu G., Culic I., Mezei E., Muresan C. (1999). Metode statistice aplicate in stiintele sociale. Iasi: Polirom. 8. Rotariu, T., Iluţ, P. (1997). Ancheta sociologică şi sondajul de opinie, Iaşi: Polirom. Bibliografie opţională 1. Chelcea, Septimiu (2005). Cum sa redactam o lucrare de licenta, o teza de doctorat, un articol stiintific in domeniul stiintelor socio-umane. Bucuresti: Comunicare.ro. 2. Culic, I. (2004). Metode avansate in cercetarea sociala. Analiza multivariata de interdependenta, Iasi: Polirom. 3. Eco, U. (2000). Cum se face o teza de licenta. Constanta: Pontica 4. Freedman, D., Pisani, R., Purves, R. (1997). Statistics. 3rd Ed, WW Norton. 5. Howitt Dennis, Cramer Duncan, Popescu Andrei (2006). Introducere în SPSS pentru psihologie. Iaşi : Polirom. 6. Jaba Elisabeta, Grama Ana (2004). Analiza statistica cu SPSS sub Windows. Iasi: Polirom. 7. King G., Keohane, R., Verba, S (2000). Fundamentele cercetarii sociale. Iasi: Polirom. 8. King, R.F. (2005). Strategia cercetării. Treisprezece cursuri despre elementele ştinţelor sociale. Iaşi: Polirom. 9. Krueger, R.A, Casey, M.A. (2005). Metoda focus grup. Ghid practic pentru cercetarea aplicată. Iaşi: Polirom. 10. Lungu, Ovidiu (2001). Ghid introductiv pentru SPSS 10.0. Iasi : Erota. 11. Mucchielli, Ales (2002). Dictionar al metodelor calitative in stiintele socioumane. Iasi: Polirom 12. Pah Iulian (2004). Introducere în SPSS. Cluj-Napoca : Eikon. 13. Popa, Marian (2008). Statistică pentru psihologie. Iaşi: Polirom. 14. Singly, F., Blanchet, A., Gotman, A., Kaufmann, J-C. (1998). Ancheta şi metodele ei: chestionarul, interviul de producere a datelor, interviul comprehensiv, Iaşi: Polirom 15. Strauss, A., Corbin, J. (1998). Basics of qualitative research: techniques and procedures for developing grounded theory. Thousand Oaks, Ca: Sage 16. Williams, L., Dunsmuir A. (1999). How to do social research. London: Harper Collins Publ. Materiale şi instrumente necesare cursului: Pentru parcurgerea în bune condiţii a pregătirii necesare promovării cursului studentul ar avea nevoie de următoarele resurse: calculator conectat la internet (pentru a accesa baze de date resurse electronice suplimentare dar şi pentru a participa la secvenţele de formare interactivă on-line) acces la resursele bibliografice (prin legitimaţie la biblioteca Centrală a Universităţii Babeş-Bolyai)
6
acces la imprimantă, pentru realizarea temelor, acces la echipamente de fotocopiere Elemente de deontologie academică: Plagiatul sau frauda se pedepseşte în conformitate cu reglementările în vigoare (poate implica exmatricularea studentului). Plagiatul este prezentarea unor ideilor, argumente, forme de exprimare, date, figuri, tabele etc. scrise sau elaborate de către o alta persoană ca aparţinând propriei persoane, fără o corectă menţionare a sursei (prin citare, referire sau notă bibliografică). Prin urmare, este vorba de plagiat în situaţia în care cuvintele unei alte persoane sunt reproduse fără menţionarea sursei, cât şi atunci când ideile sau argumentele altei persoane sunt parafrazate astfel încât cititorul ar putea crede că ele aparţin autorului textului. Pentru standardele de redactare a bibliografiilor puteţi consulta: Standardele APA pentru redactarea bibliografiilor (salvat în data de 29 august 2005, de pe adresa http://psihologie.esential.ro/APA%20bibl.html.) Solicitarea de ajutor prin e-mail: Este necesar să includeţi numele dumneavoastră complet în subiectul fiecărui e-mail pe care mi-l trimiteţi, precum şi numele cursului/disciplinei pentru care formulaţi intrebări/doriţi clarificări. Studenţii sunt rugaţi să foloseacă platforma ID a universităţii. Studenţi cu nevoi speciale: Titularul cursului îşi exprimă disponibilitatea, în limita constrângerilor tehnice şi de timp, de a adapta conţinutul şi metodele de transmitere a informaţiilor, precum şi a modalităţilor de evaluare (ex.: examen oral pentru studenţii cu probleme de vedere) în funcţie de tipul dizabilităţii cursantului. Strategii de studiu recomandate: Având în vedere caracteristicile învăţământului la distanţă, se recomandă studenţilor o planificare riguroasă a secvenţelor de studiu individual, coroborată cu secvenţe de dialog prin internet cu tutorele şi titularul disciplinei. Parcurgerea fiecarui modul, rezolvarea la timp a temelor facilitează înţelegerea conţinutului tematic şi promovarea, în bune condiţii, a disciplinei.
7
Partea I. Pachetul statistic SPSS
Capitolul 1. Introducere
1.1. Baze de date sociale şi SPSS În istoria dezvoltării sistemelor de gestiune a bazelor de date ultimele tipuri apărute, dar şi cele care au devenit cele mai populare, gestionează aşa-numitele “baze de date relaţionale”. Acestea se prezintă întotdeauna sub formă de tabele, în care liniile reprezintă cazurile, iar coloanele reprezintă variabilele statistice. La intersecţia rândului cu coloana se va găsi valoarea unei variabile pentru un caz particular. Bazele de date relaţionale seamănă mult cu tabelele ce s-ar putea construi într-o foaie de calcul, desigur respectând anumite structuri de date apriori definite. Pachetul statistic Statistical Package for Social Sciences (SPSS), în varianta lui sub Windows, este dotat cu un Editor pentru date care permite construirea unui fişier de date specific domeniului ştiinţelor sociale. Aici volumul datelor nu este atât de impresionant ca în cazul domeniului economic, legăturile între diverse fişiere de date nu sunt chiar atât de complexe, problemele de securitate legate de accesul partajat între mai mulţi utilizatori în timp real nu se pun cu atâta acuitate, dar celelalte probleme legate de facilităţile oferite în mod tradiţional de un sistem de gestiune a bazelor de date sunt rezolvate cu succes şi de SPSS. În plus, SPSS este dotat cu o serie de programe statistice extrem de puternice, special construite pentru analiza statistică a datelor din domeniul social. Iată de ce considerăm că pentru profesiunea de asistent social, unde se culeg, prelucrează şi interpretează date sociale, este avantajoasă însuşirea pachetului SPSS, chiar dacă pentru început suntem interesaţi doar de partea de management al datelor. Odată definite structurile necesare, apoi completate fişierele cu informaţiile adecvate, vom putea beneficia atât de partea de management al datelor oferite de Editorul de date cât şi de partea de analiză statistică atât de necesară în orice cercetareintreprinsă în domeniul social.
8
Figura 1.1. Procesul de cercetare
Teorie & Practică
Ipoteze
Conceptualizare Operaţionalizare
Selectarea subiecţilor
Design observaţional
Design experimental
Analiza documentelor Interviuri Anchete pe bază de chestionare
Grupuri experimentale, grupuri de control Observaţii / administrare teste sau chestionare
Colectare date
Analiză date (SPSS)
Interpretare rezultate
9
1.2. Procesul de analiză statistică a datelor în SPSS
În principal, SPSS a fost conceput pentru ajuta utilizatorul în ducerea la capăt a unei cercetări. Desigur, în procesul cercetării analiza statistică intervine mult mai târziu. Înainte de a ne aşeza în faţa unui calculator şi a folosi Editorul de date (modulul Data Editor) al SPSS pentru a introduce datele, se presupune că am parcurs deja paşi importanţi în procesul unei cercetări. Principalele faze ale unei cercetări sunt schiţate în Figura 1.1. Computerul şi pachetul de programe SPSS intervine doar în partea de analiză a datelor. În faţa calculatorului activitatea se desfăşoară practic în patru paşi care, de obicei, se reiau de mai multe ori (vezi figura 1.2).
Aducerea datelor în memoria internă
Pas 1
Selectarea unei proceduri
Pas 2
Selectarea variabilelor Transformări fişier de date
Pas 3
Interpretarea rezultatelor
Pas 4
Figura 1.2. Procesul de analiză a datelor
Pasul care ne interesează în prima fază este cel de introducere a datelor într-un fişier de date sau, după caz, de aducere al datelor în memoria internă.
10
1. Aducerea datelor în memoria internă
Datele de gestionat (sau, după caz, de analizat) pot fi date salvate anterior într-un fişier de date SPSS.
Se pot citi date din fişiere proprii altor produse software. Cele mai cunoscute sunt bazele de date dBASE, FoxPro sau Access; fişierele tip foaie de calcul produse cu tabelatorul Excel; sau fişiere simple de tip text ASCII, produse cu orice editoare de texte. Desigur, pentru a “importa” astfel de date, trebuie respectate nişte reguli clare şi trebuie furnizate informaţii suplimentare de conversie, în cadrul procedurilor iniţiate de SPSS.
Se pot introduce direct datele în formatul propriu fişierelor de date SPSS cu ajutorul modulului Data Editor.
2. Selectarea unei proceduri Sistemul de meniuri al SPSS oferă o gamă de comenzi care permit selectarea şi declanşarea a patru categorii de proceduri:
Proceduri de gestionare a datelor
Proceduri de obţinere a listelor şi rapoartelor
Proceduri de construire a tabelelor statistice, de calcul a unor indicatori statistici, de căutare a unor modele explicative
Proceduri pentru crearea unor grafice
3. Selectarea variabilelor Cele mai multe din procedurile SPSS cer precizarea variabilelor. Acestea sunt listate în casetele de dialog ale procedurilor, iar utilizatorul va trebui să indice variabilele care intră în analiză. 4. Interpretarea rezultatelor După ce toate elementele de informaţii necesare execuţiei unei proceduri au fost precizate de către utilizator, procedura se va declanşa şi va produce rezultatele. Ele trebuie privite cu atenţie şi interpretate. O şedinţă de lucru cu SPSS constă în mai multe reluări a celor patru faze: în mai multe operaţiuni de management al datelor, sau mai multe proceduri de analiză a datelor. De multe ori ceea ce hotărâm să facem în continuare depinde de rezultatele unei operaţiuni anterioare. Utilizatorul (sau după caz, cercetătorul) foloseşte SPSS ca un asistent docil, dar foarte puternic şi capabil, ale cărui performanţe depind de abilitatea cercetătorului de a lua deciziile cele mai potrivite.
11
Capitolul 2. Introducere în SPSS sub Windows SPSS sub Windows funcţionează sub controlul unui mediu grafic GUI (Graphical User Interface), utilizând un sistem de meniuri descriptive şi casete de dialog care uşurează mult interfaţa om-calculator. Cele mai multe operaţiuni sunt declanşate şi duse la capăt prin punctare şi clic cu mouse-ul, chiar dacă lucrul cu tastatura este oricând o a doua alternativă.
2.1. Pornirea SPSS Ca orice produs sub Windows, SPSS se porneşte prin dublu-clic pe pictograma sa aflată fie pe ecranul dispay-ului, fie în lista de Programe al meniului Start.
Figura 2.1. Ferestrele Data Editor şi Output Navigator Ceea ce vom vedea prima dată va fi modulul Data Editor (vezi figura 2.1). În afara acestui modul, SPSS mai are încă două: modulul Output Navigator – modul care se ocupă de afişarea rezultatelor prelucrărilor, precum şi de modificarea aspectului lor - şi modulul Chart Editor – modul care facilitează manipularea şi gestionarea graficelor obţinute prin SPSS. Fiecare fereastră are o linie de titlu. Sub ea se găseşte meniul principal al aplicaţiei. Fereastra Editorului de date conţine datele de analizat sub forma unui tabel asemănător unei foi de calcul, iar orice rezultat produs de o procedură SPSS se va
12
introduce în fereastra Output al Navigatorului de rezultate. Iniţial se va deschide doar fereastra Editorului de date. Fereastra Navigatorului de rezultate se deschide îndată ce vreo procedură produce rezultate. In afara acestor două ferestre mai pot apare, la nevoie, alte două ferestre: fereastra Editorului de grafice sau fereastra Sintax (pentru păstrarea comenzilor SPSS în vederea repetării lor într-o altă şedinţă de lucru).
2.2. Sistemul de meniuri SPSS v7.5 poate lucra într-o varietate de moduri, dar majoritatea procedurilor pot fi accesate făcând selecţii din meniuri. Meniul principal al Editorului de date, cea mai utilizată componentă a pachetului, conţine nouă meniuri: File. Se utilizează pentru a crea fişiere noi SPSS, pentru a deschide fişiere existente, pentru a citi fişiere de tip spreadsheet sau bază de date create cu alte programe software. Meniul File se mai utilizează pentru crearea şi deschiderea altor fişiere SPSS, adică fişiere de grafice, de rezultate sau de sintaxă. Edit. Se utilizează pentru a modifica sau copia texte din ferestrele de rezultate sau de sintaxă. View. Se utilizează pentru a modifica aspectul ecranului în funcţie de opţiunile utilizatorului. Data. Se utilizează pentru a face schimbări globale la fişierul de date, cum ar fi agregarea datelor din mai multe fişiere, împărţirea cazurilor în subseturi. Aceste schimbări sunt doar temporare şi nu afectează fişierul permanent cu excepţia cazului când se cere explicit acest lucru (prin salvare). Transform. Se utilizează pentru a face schimbări variabilelor selectate din fişierul de date şi pentru a calcula variabile noi pe baza valorilor existente în alte variabile. Nici aceste schimbări nu afectează fişierul permanent decât dacă schimbările se salvează în mod explicit. Statistics. Procedurile statistice se selectează din acest meniu. Cele mai comune proceduri statistice sunt: tabelele de frecvenţe, tabelele de asociere, calculul indicatorilor statistici descriptivi, analiza varianţei, corelaţia sau regresia liniară. Graphs. Meniul Graphs se foloseşte pentru a crea diagrame de bare, diagrame circulare, histograme, diagrame de împrăştiere şi alte grafice în culori şi de mare rezoluţie. Chiar şi unele proceduri statistice pot genera grafice. Orice grafic poate fi îmbunătăţit cu ajutorul Editorului de grafice (Chart Editor). Utilities. Se foloseşte pentru a afişa informaţii despre variabilele din structura fişierului de date, pentru a defini şi utiliza seturi restrânse de variabile, sau pentru a deschide un index al comenzilor SPSS. Window. Se utilizează pentru a aranja, a selecta şi a controla atributele diverselor ferestre SPSS. 13
Help. Acesta deschide ferestre de asistenţă “on-line” cu manuale electronice, demonstraţii, sfaturi contextuale şi programe de învăţare asistată de calculator de tip “tutorial”.
2.3. Linia de pictograme Cele mai comune comenzi SPSS, folosite în mod uzual, pot fi accesate prin intermediul unor pictograme situate imediat sub linia de meniuri, în linia de pictograme (Tool Bar). Această linie este prezentă la oricare din ferestrele modulelor SPSS, dar poate conţine pictograme diferite, adaptate situaţiei (vezi figura 2.1). Unele din pictograme s-ar putea întâmpla să nu fie eligibile în anumite situaţii chiar dacă apar pe ecran. O scurtă explicaţie a ceea ce reprezintă ele poate fi obţinută foarte simplu prin plasarea indicatorului mouse-ului pe ele.
2.4. Casetele de dialog Cele mai multe proceduri SPSS afişează casete de dialog prin intermediul cărora adună toate informaţiile necesare ducerii la bun sfârşit a operaţiunilor cerute de utilizator. Pentru că aceste casete oferă informaţii utile în alegerile pe care utilizatorul le are de făcut şi pentru că aceste casete sunt foarte asemănătoare între ele, să aruncăm o privire, de exemplu, pe cea folosită la deschiderea unui fişier: figura 2.2 Această casetă conţine o zonă etichetată Look in unde va apare directorul curent (BazeDate, în exemplu). Dacă fişierul căutat nu este în directorul curent, acesta poate fi schimbat cu ajutorul pictogramelor din această zonă. Fişierele sunt listate în zona cea mai întinsă a casetei de dialog. De exemplu, în figura 2.2 putem vedea patru fişiere. Oricare dintre ele poate fi deschisă. Alegerea se face prin pointare şi clic pe butonul stâng al mouse-ului. Numele fişierului selectat va apare in zona File name. Această informaţie poate fi şi tastată dacă se doreşte folosirea tastaturii şi nu a mouse-ului. Nu toate fişierele din directorul curent sunt listate în casetă. Ele sunt filtrate cu ajutorul extensiilor consacrate pentru diverse tipuri de fişiere. Observăm că în exemplu, toate cele trei fişiere au extensia .sav. Zona Files of type oferă însă posibilitatea selectării altor tipuri inclusiv a tuturor tipurilor, deci posibilitatea neutilizării filtrelor. În partea dreapta jos a casetei se găsesc “butoanele”, adică acele zone care declanşează acţiuni. Clic pe butonul Open produce deschiderea fişierului selectat. Clic pe butonul Paste produce doar un text cu comanda de deschidere a fişierului selectat, comandă ce se va scrie într-un fişier de tip sintaxă, în vederea folosirii lui ulterioare. Butonul Cancel anulează operaţiunea în curs, fără să declanşeze procedura pentru care se făceau pregătirile. După acţionarea butoanelor casetele de dialog dispar de pe ecran. Figura 2.2. Caseta de dialog Open File
14
În majoritatea casetelor de dialog apare şi butonul Reset. Selectarea lui va anula toate specificările făcute în caseta de dialog afişată, fără ca acesta să fie ştearsă de pe ecran. Utilizatorul va putea face deci alte selecţii. Unele casete de dialog pot conţine “butoane radio” şi / sau “căsuţe pentru bifare” (check box). Ele nu declanşează acţiuni imediate dar permit optarea pentru anumite variante ale procedurilor. Butoanele radio se deosebesc de căsuţele pentru bifare prin faptul că numai unul dintr-o zonă poate fi ales şi una din alegeri este obligatorie. În cazul căsuţelor pentru bifare, acestea pot fi bifate sau nu, indiferent câte sunt într-o casetă de dialog. Butoanele radio au o aparenţă circulară iar opţiunea alesă se marchează cu un punct (). Căsuţele pentru bifare au aparenţă pătratică şi opţiunile alese vor fi marcate cu [] .
2.5. Asistenţa “on-line”
Figura 2.3. Fereastra Tutorialului SPSS
Meniul Help oferă multiple posibilităţi de a obţine ajutor interactiv. Procedura Topics permite accesul în manualul electronic pe baza unor opţiuni tematice, procedura Tutorial este indicată pentru un prin contact cu SPSS (vezi figura 2.3), iar procedura Statistics coach este un meditator pentru procedurile statistice. Unele din proceduri conţin demonstraţii interactive, cele mai multe conţin ilustraţii şi toate conţin explicaţii textuale în limba engleză.
15
Capitolul 3. Proiectarea unei baze de date sociale
3.1. Utilizarea Editorului de date SPSS Editorul de date (Data Editor) este un modul SPSS care afişează o fereastră tip spreadsheet (foaie de calcul) utilizată la crearea şi editarea fişierelor de date SPSS. El se foloseşte atât la introducerea datelor direct de pe un chestionar cât şi la vizualizarea informaţiilor deja introduse, cum ar fi fişe medicale, baze de date cu angajaţii sau clienţii unor agenţii, rezultate obţinute în urma unor testări şi multe altele. Fereastra Editorului de date se deschide automat la începutul unei şedinţe de lucru SPSS, vezi figura 2.1. Dacă nu se deschide un alt fişier de date, Editorul de date rămâne gol. Înainte de a introduce date trebuie să avem în vedere câteva lucruri: Liniile reprezintă cazuri Fiecare linie reprezintă un caz, o observaţie sau un individ statistic. În fişierul de date folosit de noi ca exemplu, vezi fundalul figurii 2.3, fiecare linie reprezintă un respondent. Coloanele reprezintă variabile Fiecare coloană reprezintă o variabilă, o caracteristică sau o însuşire a individului statistic. În exemplul nostru chestionarul a avut 133 itemi de completat. De aceea Editorul de date va avea 133 de variabile. Celulele conţin valori O celulă conţine o singură valoare a unei variabile pentru un caz. De exemplu, prima celulă din exemplul nostru conţine numărul de identificare al primului respondent. Celulele conţin numai valori numerice, şiruri de caractere şi date calendaristice. Spre deosebire de foile de calcul, celulele din Editorul de date nu conţin formule.
3.2. Un exemplu Datele utilizate în acest curs aparţin bazei de date Martie97.sav. Ea conţine 1.298 cazuri, reprezentând un eşantion naţional al populaţiei României, iar variabilele conţinute se referă la întrebări de opinie legate de situaţia socială, economică, politică a României, reprezentând Barometrul de opinie editat de Fundaţia pentru o Societate Deschisă. Fişierul de date conţine şi câteva caracteristici de identificare a subiecţilor şi gospodăriilor din care fac parte (gen, vârstă, naţionalitate, domiciliu, nivel de educaţie etc.). Ancheta de teren a avut loc în martie 1997. Variabilele din Barometru acoperă toate scalele nivelelor de măsură şi permit exemplificarea celor mai variaţi indicatori şi proceduri statistice.
16
3.3. Proiectarea schemei de codificare Răspunsurile la câteva întrebări sunt numere: de exemplu, vârsta, numărul de membrii în gospodărie, distanţa în kilometrii faţă de cel mai apropiat oraş, etc. Alte câteva întrebări cer alegerea unor opţiuni din mai multe posibile (de exemplu ultima şcoală absolvită, ocupaţia etc.) şi fac necesară întocmirea unei scheme de codificare. O schemă de codificare este un mod de a asocia anumite valori unor răspunsuri din chestionar. Codurile sunt ceea ce se introduce efectiv în fişierul de date. În general schemele de codificare sunt arbitrare. De exemplu pentru întrebarea “Sunteţi de sex masculin sau feminin?” codurile ar putea fi (1) pentru masculin şi (2) pentru feminin. O altă posibilitate ar putea fi “m” pentru masculin şi “f” pentru feminin. Ori de câte ori este posibil se recomandă folosirea codurilor numerice şi nu a caracterelor alfanumerice (de exemplu literele). Ar fi fără sens a cere obţinerea mediei unui grup de litere. (SPSS poate converti codurile alfabetice în coduri numerice prin utilizarea procedurii Automatic Recode din meniul Transform).
3.4. Definirea variabilelor Există 133 de itemi în chestionarul nostru. Aceasta înseamnă 133 de variabile pentru Editorul de date. Cu alte cuvinte 133 coloane. Primul item este codul de identificare (sau cod) şi constă în până la 4 caractere numerice. Al doilea item este genul respondentului (sau gen) şi constă într-un cod alfabetic “m” sau “f”. Al treilea item este vârsta respondentului (sau varsta) care constă în două cifre. Al patrulea item este nivelul şcolii absolvite (sau ulscoala) care, dat fiind că există doar 5 posibilităţi de răspuns, constă într-un caracter numeric. Al cincilea item este localitatea de domiciliu (sau localit). În caseta de dialog Define Variable din meniul Data putem gestiona 5 categorii de informaţii: numele variabilei, tipul variabilei, etichetele, valorile omise şi formatul coloanei. Aceste informaţii sunt tot atâtea aspecte ale structurii bazei de date şi se definesc pentru fiecare variabilă în parte.
3.5. Atribuirea numelui variabilei Înainte de a introduce informaţiile din chestionar în celulele Editorului de date, trebuie furnizate nume unice de maximum 8 caractere pentru fiecare coloană din fişier. Acesta va permite o referire uşor de memorat pentru fiecare coloană, sau variabilă, legată de un item de chestionar. Prima coloană din Editorul de date este legată de un item ce nu este inclus în chestionar, dar care va fi utilă în identificarea respondenţilor – codul numeric al respondentului. Pentru a atribui un nume variabilei: -
faceţi clic pe orice celulă din prima coloană
-
faceţi clic pe meniul Data din meniul principal
-
faceţi clic pe Define Variable din meniul Data
Va apare o casetă de dialog ca în figura 3.1. Figura 3.1. Caseta de dialog Define Variable
17
SPSS arată definiţiile curente pentru variabilă; în acest caz numele implicit al variabilei este VAR00001. Până ce acesta este selectat se poate înlocui cu un nume nou, mai uşor de recunoscut, ca reprezentând numărul de identificare al respondentului. Tastaţi “cod” în căsuţa Variable Name. Există câteva reguli ce trebuie respectate atunci când se atribuie nume variabilelor. O parte din ele sunt:
Numele trebuie să înceapă cu o literă
Lungimea unui nume nu trebuie să depăşească 8 caractere
Utilizarea spaţiilor şi a caracterelor speciale (! ? “ *) este interzisă
Fiecare nume de variabilă trebuie să fie unică
Apoi se poate face clic pe butonul OK pentru a se schimba efectiv numele variabilei în Editorul de date. Urmează acum alte schimbări ale caracteristicilor implicite ale variabilei.
3.6. Schimbarea tipului variabilei Caseta de dialog folosită pentru schimbarea numelui variabilei (Define Variable) poate fi utilizată şi pentru specificarea tipului variabilei. Tipul variabilei se referă la forma în care apar valorile în coloană (de exemplu când o informaţie este de tip text sau una din formatele numerice) dar şi la dimensiunea memoriei alocată pentru stocarea informaţiei. În figura 3.2 putem vedea că tipul variabilei “cod” este Numeric8.2.
Figura 3.2 Caseta de dialog Define Variable Type
18
Acesta este formatul implicit, definit în SPSS, şi semnifică faptul că informaţiile sunt afişate numeric cu maximum 8 poziţii care includ un punct şi două cifre pentru partea zecimală. De exemplu “1” se va afişa ca “1.00”. Aceasta mai înseamnă şi că formatul de afişare a rezultatelor obţinute în urma procedurilor SPSS se vor afişa tot cu 8 poziţii şi 2 cifre pentru zecimale. Pentru a schimba formatul de afişare al variabilei se face clic pe căsuţa de dialog Type. Apoi se poate schimba lungimea variabilei cod la 4 poziţii, fără cifre zecimale, ca în figura 3.2. După schimbări se va acţiona butonul Continue, iar schimbarea poate fi acum sesizată în caseta Define Variable (vezi figura 3.3).
Figura 3.3. Definiţii modificate pentru variabila “cod”
3.7. Adăugarea etichetelor descriptive pentru variabile şi valori Adăugarea etichetelor descriptive este foarte utilă, chiar dacă se poate lucra şi fără ele. Etichetele adăugate variabilelor şi valorilor lor îmbunătăţesc mult listingurile cu rezultate şi uşurează analiza. Etichetele pentru variabile sunt extensii ale numelor variabilelor şi permit ataşarea unor informaţii mai descriptive decât permit cele maximum 8 caractere impuse pentru un nume de variabilă. Limita maximă pentru o etichetă de variabilă este de 120 caractere, dar trebuie să ţinem totuşi cont că multe proceduri afişează mai
19
puţin de 120 caractere şi deci este bine să folosim o etichetă de o lungime cât mai scurtă. Etichetele de valori se ataşează valorilor specifice ale variabilelor. Acestea sunt avantajoase mai ales atunci când codurile valorilor nu au legături intrinseci cu categoriile reprezentate de acestea. De exemplu, trebuie să codificăm ultima şcoală absolvită de respondent utilizând coduri de la 1 la 5, dar fără utilizarea etichetelor pentru valori va fi dificil să ţinem minte ce grup am codificat cu un anume număr. Etichetele de valori trebuie să fie de maxim 60 caractere, dar şi aici este recomandabil să utilizăm denumiri mai scurte pentru că multe proceduri nu pot afişa aceste etichete în extenso. Tabelul 3.1 rezumă informaţiile descriptive pentru o parte a variabilelor din baza de date Martie97. Un astfel de tabel se numeşte catalog de coduri. Tabel 3.1. Catalog de coduri pentru câteva variabile ale Barometrului Variabila
Eticheta pentru variabilă
Etichete pentru valori
Tip variabilă
cod gen
Serie chestionar Genul
Numeric 4.0 String 1
varsta ulscoala
Varsta Ultima şcoală absolvită
localit
Localitatea de reşedinţă
nu m = masculin f = feminin x = non-raspuns Nu 1 = maxim şc. generală 2 = şc. profesională 3 = liceu 4 = şc. postliceală 5 = învăţământ superior nu
Numeric 2.0 Numeric 1.0
String 15
Adăugarea etichetelor pentru variabile şi valorile lor se face tot prin intermediul casetei de dialog Define Variable (figura 3.3), anume prin acţionarea butonului Labels. Se va deschide o nouă casetă de dialog, ca cea din figura 3.4. După specificarea valorii şi a etichetei corespunzătoare se utilizează butonul Add pentru a adăuga atribuirea în lista de atribuiri. Se repetă adăugarea atribuirilor până se epuizează lista de valori, iar la urmă se acţionează butonul Continue. Figura 3.4. Caseta de dialog Define Labels pentru variabila “ulscoala”
20
Observaţie. Etichetarea se face de obicei la început, înainte de introducerea datelor în fişier, dar această operaţiune poate fi cerută oricând în cadrul unei şedinţe de lucru, fie pentru corectarea unor greşeli, fie pentru o etichetă mai grăitoare. Pentru a face astfel de schimbări se va selecta atribuirea în cauză prin clic, se vor face modificările în zonele Value sau Value Label , iar apoi se va acţiona butonul Change.
3.8. Atribuirea valorilor omise Una din consecinţele cele mai nedorite ale colectării datelor prin intermediul chestionarelor este lipsa unor informaţii sau incorectitudinea altora. Aceste situaţii pot apare din diverse motive printre care ar fi: incapacitatea subiectului de a răspunde la o întrebare, furnizarea unor răspunsuri inadecvate, omisiuni făcute de cei care codifică datele etc.
Figura 3.5. Declararea valorii omise prin caseta de dialog Define Missing Values O altă situaţie in care lipsesc valori este cea în care chiar chestionarul permite răspunsuri ca “nu ştiu” sau “refuz să răspund” sau “nici unul din răspunsurile de mai sus”. Şi pentru astfel de informaţii trebuie prevăzute coduri care să servească introducerii în fişierul de date. Cu toate acestea vom dori să excludem aceşti subiecţi din anumite analize sau anumite tabele. De exemplu, se întâmplă deseori ca o anumită proporţie a respondenţilor să răspundă cu “nu ştiu” la o întrebare privind o opinie politică. Deşi această proporţie este interesantă prin ea însăşi, putem cere un tabel care să arate informaţii numai despre cei care şi-au exprimat o opinie. Indiferent din ce raţiune, avem nevoie să înregistrăm apariţia uneia din aceste situaţii prin atribuirea unei valori “omise”. O alternativă ar fi să lăsăm liberă celula Editorului de date, dar acesta va genera o altă problemă potenţială: aceea de a nu mai 21
fi capabili să distingem între situaţiile ca cele descrise mai sus şi erorile făcute cu ocazia introducerii datelor. În exemplul nostru puteam să fi fost puşi în situaţia ca un respondent să nu-şi fi declarat genul. Vom atribui eticheta “non-raspuns” valorii “x” a variabilei gen pentru aceşti respondenţi şi vom face clic pe butonul Missing Values… a casetei de dialog Define Variable. Caseta de dialog Define Missing Values prevede o mulţime de situaţii alternative pentru definirea valorilor omise. Implicit SPSS tratează toate valorile ca fiind valide. Putem declara până la trei valori distincte, discrete, ca fiind valori omise, sau putem specifica un interval (range în lb.engleză) de valori ca fiind omise, sau un interval şi o valoare discretă. În exemplul nostru avem o valoare omisă “x”, dar pentru că este o variabilă de tip şir (string în lb.engl.), este bine să atribuim şi valoarea blank (spaţiu) ca valori omise. Aceasta este necesară pentru că spaţiul (blankul) este un caracter legitim pentru variabilele de tip şir, spre deosebire de variabilele numerice, iar atribuirea lui ca valoare omisă va preveni situaţiile în care cazurile invalide vor fi incluse în tabelele de analiză. Observaţie. Valorile omise, ca şi etichetele variabilelor şi ale valorilor sunt senzitive la majuscule, aşa că o valoare “X” nu va fi recunoscută ca valoare omisă şi nici nu va purta eticheta “non-raspuns”.
3.9. Valori omise sistem şi valori omise utilizator Valorile omise pot fi de două tipuri diferite: sistem, care apar de fapt atunci când există omisiuni în setul de date, şi utilizator, care sunt declarate ca atare în Editorul de date. Nici una din ele nu sunt utilizate în analizele statistice. Valori omise sistem Când o celulă dintr-o variabilă numerică este lăsată necompletată, SPSS plasează automat un punct zecimal în aceea celulă. Acest punct este referit întotdeauna ca valoare omisă sistem. Cazurile cu valori omise sistem sunt excluse din majoritatea procedurilor de analiză statistică şi de transformare a datelor. Valori omise utilizator Deseori este util a se face distincţia între motivele pentru care valorile sunt omise. De exemplu, pentru variabila “mservici” din Barometrul opiniei publice din Martie97 s-a atribuit valoarea omisă 0 , cu eticheta “NS / NR / NC” (abrevieri de la “nu ştiu”, “non-raspuns” si “nu comentez”). Aceste situaţii sunt bine determinate şi nu coincid cu acelea în care informaţia privind mulţumirea faţă de serviciu nu a fost în mod eronat introdusă în baza de date. În figura 3.6, care este listingul cu rezultate din fereastra Navigatorului de rezultate, putem vedea că sunt semnalate 643 cazuri de non-răspuns , dar şi 3 cazuri cu valori omise sistem, care au apărut cu siguranţă prin neatenţia celui care a introdus datele în calculator.
22
Figura 3.6. Tabel de frecvenţe care arată tratarea valorilor omise sistem şi utilizator
3.10. Schimbarea formatului coloanei Înainte de a termina definirea variabilei “gen” mai avem de explorat un ultim buton al casetei de dialog Define Variable, şi anume Column Format. Această opţiune controlează afişarea coloanei în Editorul de date. Fixând tipul variabilelor (deci şi lungimea lor) lăţimea coloanelor din Editorul de date se schimbă în mod automat, iar, de cele mai multe ori, numele variabilelor nu mai pot fi distinse din cauză că ele sunt de obicei mai lungi decât lungimea declarată a variabilei. Pentru a rectifica această situaţie, putem face următoarele:
Clic pe Column Format Schimbăm 1 în 7 Clic pe Continue
De regulă, cel mai bine este să declarăm lăţimea coloanei cu un caracter mai lung decât numele variabilei, sau cu un caracter mai lung decât valoarea cea mai lungă. Dacă avem variabile de tip şir lung (Long String), s-ar putea să nu dorim să vedem tot textul afişat, aşa că vom alege o lăţime a coloanei mai mică. Putem să schimbăm, pe această cale, inclusiv alinierea textului în coloană.
3.11. Definirea variabilelor adiţionale Înainte de a introduce datele va trebui să definim şi celelalte variabile. Pentru a defini celelalte 3 variabile din exemplul nostru (varsta, ulscoala şi localit) vom utiliza fie aceeaşi procedură utilizată până acum (adică clic pe Data, Define Variable…) fie vom putea alege o variantă mai rapidă, anume dublu-clic pe capul coloanei. 23
Se va deschide caseta de dialog Define Variable, unde vom completa mai în întâi numele variabilei, apoi tipul, lungimea, etichetele pentru variabilă şi pentru valori, formatul coloanei, valorile omise. În cazul variabilei localit, care este de tip şir lung, vom vedea că butonul Missing Values pentru valoarea omisă nu este un buton eligibil. Există o regulă în SPSS şi anume că variabilele de tip şir lung (adică peste 8 caractere lungime) nu pot avea valori omise. În multe alte situaţii în care contextul este de aşa natură că anumite opţiuni nu au sens, SPSS face ineligibile anumite butoane şi zone din casetele de dialog, spre avantajul utilizatorului care astfel este împiedicat să facă declaraţii fără sens.
3.12. Introducerea datelor Odată ce variabilele au fost definite în concordanţă cu catalogul de coduri (tabelul 3.1), datele vor putea fi introduse fără nici o problemă. Cursorul se fixează pe celula ţintă şi se introduc date direct din chestionar. Pentru deplasarea la câmpul următor se poate folosi tasta Tab. Pentru un alt caz, procedeul se repetă. Dacă într-o celulă nu se introduce nimic, iar aceasta aparţine unei variabile numerice, va apare un punct zecimal şi se va atribui o valoare omisă sistem.
3.13. Editarea datelor SPSS nu previne utilizatorul când acesta introduce date eronate. Singura validare pe care totuşi o face este să nu permită introducerea caracterelor alfabetice în câmpurile numerice. Dacă observaţi o informaţie greşit introdusă puneţi cursorul pe celula în care apare acea informaţie şi retastaţi informaţia în mod corect. Dacă doriţi să faceţi o corectură celula trebuie deschisă iar corectura se face în linia de editare (echivalentă liniei pentru formule dintr-un tabelator). Deschiderea celulei active se face fie prin dublu-clic , fie prin apăsarea tastei F2.
3.14. Examinarea informaţiilor în Editorul de date Cea ce s-a introdus până acum în fişierul de date sunt codurile valorilor din chestionar. Etichetele, deşi definite, nu sunt de fapt afişate. Pentru a vedea etichete în loc de coduri se poate cere comanda Value Labels din meniul Utilities. Chiar şi în această situaţie, trebuie să reţinem că pentru introducerea datelor noi folosim întotdeauna codurile şi nu etichetele. Avem însă o alternativă: să alegem o etichetă de valoare dintr-o listă afişată pe ecran după ce facem clic pe celula în care vrem să introducem informaţia cu butonul din dreapta al mouse-ului. Urmăriţi de exemplu lista afişată pentru o celulă din coloana ulscoala, în figura 3.7. Figura 3.7. Etichete de valori în Editorul de date
24
3.15. Utilizarea etichetelor variabilelor în proceduri Etichetele pentru valori sunt utile nu numai în vizualizarea mai explicitată a semnificaţiei codurilor valorilor în Editorul de date ci şi în rezultatele procedurilor. În figura 3.6 aţi putut vedea cum etichetele pentru valorile variabilei mservici mulţumirea faţă de locul de muncă al respondenţilor au apărut în locul codurilor în tabelul de frecvenţe produs de SPSS.
3.16. Salvarea fişierului de date Dacă părăsiţi SPSS în acest punct al şedinţei de lucru, toate datele şi informaţiile adiţionale atribuite variabilelor, valorilor variabilelor şi valorilor omise, se pierd. Toate aceste informaţii put lua însă o formă permanentă dacă salvaţi fişierul de date după ce aţi definit variabilele şi informaţiile adiţionale de descriere a lor. Pentru a salva un fişier de date, fereastra Editorului de date trebuie să fie fereastra activă. Salvarea pentru prima oară se face cu comanda Save As din meniul File, pentru că acesta permite specificarea numelui fişierului în caseta de dialog care se deschide (vezi figura 3.8). extensia implicită pentru un fişier de date SPSS este .sav. Ca să fim siguri că salvăm un fişier de date şi nu unul din celelalte tipuri permise de SPSS trebuie să ne asigurăm că zona Save as Type are ca şi conţinut SPSS (*.sav).
Figura 3.8. Caseta de dialog Save Data As Dacă dorim să salvăm fişierul într-un alt director decât cel curent, care apare în zona Save in, o putem face schimbând directorul prin intermediul butoanelor din partea de sus a casetei de dialog.
25
3.17. Diferenţa dintre Save As şi Save Comanda Save As a meniului File se utilizează când se doreşte schimbarea numelui fişierului afişat în linia de titlu al Editorului de date sau când se doreşte schimbarea formatului fişierului, de exemplu pentru a crea o versiune care să poată fi citită în Microsoft Excel. Deasemenea dacă se doreşte schimbarea directorului în care se salvează, altul decât cel definit implicit de SPSS se foloseşte tot Save As. Save se foloseşte pentru a salva o versiune îmbunătăţită a fişierului curent, adică cu ocazia actualizărilor bazei de date.
3.18. Ieşirea din SPSS Pentru a termina o şedinţă de lucru şi a părăsi SPSS se va alege comanda Exit SPSS din meniul File.
Figura 3.9. Cerere de salvare a fişierului cu rezultate Output1 SPSS ţine evidenţa ferestrelor deschise în timpul şedinţei. Dacă ceva din ceea ce s-a produs nu a fost salvat, SPSS întreabă explicit dacă se doreşte salvarea. De exemplu, dacă am declanşat procedura Frequencies pentru a obţine o tabelă de frecvenţe, acesta s-a afişat în fereastra Output1al Navigatorului de rezultate. De aceea SPSS ne va întreba dacă dorim să salvăm fişierul cu rezultate, vezi figura 3.9. Extensia implicită pentru fişierele cu rezultate este .spo.
26
27
Capitolul 4. Căutarea erorilor şi analize statistice exploratorii Vom explora în cele ce urmează câteva din cele mai comune căi de a descrie datele dintr-o bază de date prin intermediul procedurilor de statistică elementară Frequencies şi Descriptives. De foarte multe ori vom vedea că aceste două proceduri sunt suficiente pentru a răspunde la multe din întrebările cercetării. Procedurile Crosstabs şi Means sunt utile în investigarea unor posibile relaţii între două variabile. Aceste patru proceduri, la care se adaugă şi procedura Explore, nu sunt numai tehnici puternice descriptive, dar constituie tot atâtea mijloace de investigaţie necesare înaintea întreprinderii unor analize statistice mai sofisticate.
4.1. Procedura Frequencies
Figura 4.1. Procedura Frequencies Procedura Frequencies, furnizează tabele statistice şi reprezentări grafice. Implicit, ea va genera o distribuţie de frecvenţe sub formă de tabel, în care pentru fiecare valoare distinctă a variabilei selectate, se va afişa numărul de apariţii, procentul pe care acesta-l reprezintă din întregul eşantion şi procentul cumulativ. Ca opţiuni, pot fi selectate grafice ca diagrama de bare, histograma (care vor fi alese în funcţie de tipul variabilei), valorile pentru anumite percentile sau indicatori statistici descriptivi.
28
În tabela de frecvenţe sau în diagramele de bare, valorile distincte pot fi ordonate în ordine crescătoare sau descrescătoare. Generarea / afişarea tabelei de frecvenţe poate fi eliminată dacă variabila are prea multe valori distincte. Unităţile de măsură folosite în diagrame şi grafice pot fi sub formă de frecvenţe numerice (implicit) sau procente. Indicatori statistici ce pot fi ceruţi: media, mediana, modul, suma, abaterea standard, varianţa, amplitudinea, minimum şi maximum, eroarea standard a mediei, oblicitatea (skewness) şi ascuţimea (kurtosis) (cu erorile lor standard), cuartile şi percentile definite de utilizator, frecvenţe, procente, procente cumulate. Pentru declanşarea procedurii se va alege din meniu: Statistics, Summarize, Frequencies
Figura 4.2. Procedura Crosstabs
4.2. Procedura Crosstabs În cazul în care dorim să studiem o relaţie de asociere între variabile categoriale, va fi utilă o tabelă care conţine frecvenţele combinaţiilor valorilor (categoriilor) celor două variabile. Acestea sunt tot tabele de frecvenţe, dar se generează nu doar pentru o variabilă, ci pentru combinaţia a două variabile. Vom numi o astfel de tabelă, tabelă de frecvenţe între două variabile, tabelă de asociere sau tabelă de contingenţă. Ea se obţine din meniu, alegând: Statistics, Summarize, Crosstabs… Pentru exemplificare, vom utiliza fişierul Martie97.sav, care conţine variabilele gen şi mservici (satisfacţia in munca).
29
Putem studia relaţia între mservici şi venit, sau între orice alte variabile între care bănuim că ar putea exista o legătură.
m
i
C
e a t p l u o o t t t t u u u u t G m 2 1 0 6 9 f 0 0 8 5 3 T 2 1 8 1 2
Figura 4.3. Tabel de asociere între gen şi satisfacţia în muncă (frecvenţe absolute) Conţinutul celulelor aşa cum apare sub formă de frecvenţe absolute (figura 4.3) nu exprimă relaţia dintre cele două variabile. Pentru a putea compara diversele grupuri între ele, trebuie să folosim o măsură independentă de numărul cazurilor cuprinse în grupul respectiv; fiecare grup având un număr diferit de cazuri (359 persoane de sex masculin şi 293 persoane de sex feminin). O exprimare în procente a frecvenţelor din fiecare celulă permite comparaţiile dorite (figura 4.4).
m
it
d e o s e p t a l u o r r T u l l l l t o t t t u u u u t G m C 5 2 1 0 6 9 % G % % % % % r e f C e 9 0 0 8 5 3 % G % % % % % r e T C 5 2 1 8 1 2 % G % % % % % r e
Figura 4.4. Tabel de asociere între gen şi satisfacţia în muncă (frecvenţe procentuale) Procentajul pe coloane ne arată distribuţia variabilei de pe linii pentru fiecare categorie a variabilei de pe coloane (ce procent din totalul cazurilor de pe o coloană este distribuit pe fiecare linie). Tabelul din figura 4.4 nu afişează astfel de procente. Procentajul pe linii ne arată distribuţia variabilei de pe coloane pentru fiecare categorie a variabilei de pe linii (ce procent din totalul de cazuri de pe o linie este distribuit în fiecare coloană). În tabelul din figura 4.4 putem vedea, de exemplu, că 8,9% din persoanele de sex masculin (variabila gen este variabila de pe linii) se declară deloc mulţumiţi de serviciul pe care îl au (variabila de pe coloane), 17% nu sunt prea mulţumiţi, 52,9% sunt mulţumiţi şi 21,2% sunt foarte mulţumiţi. Observaţie: Cum putem spune dacă într-un astfel de tabel procentele din celule reprezintă procentajul pe linii sau pe coloane? Dacă în coloana numită Total procentul înscris în fiecare celulă este 100%, avem de-a face cu
30
procente pe linii. Dacă pe linia numită Total procentul înscris în fiecare celulă este 100%, avem de-a face cu procente pe coloane.
4.3. Procedura Descriptives Această procedură calculează şi afişează indicatori statistici univariaţi (o variabilă la un moment dat) pentru diferite variabile şi poate calcula valorile standardizate (scoruri Z) pentru fiecare caz. Implicit, pentru fiecare variabilă ce se selectează se vor calcula media, abaterea standard, minimum, maximum (vezi căsuţele bifate din caseta de dialog Descriptives Options din figura 4.5.). Opţional mai pot fi cerute varianţa, amplitudinea, eroarea standard a mediei, oblicitatea şi ascuţimea. Observaţie: Mediana, modul, cuartilele şi percentilele nu pot fi calculate aici, ele se determină cu procedura Frequencies.
Figura 4.5. Procedura Descriptives Declanşarea procedurii se face din linia de meniu cu: Statistics, Summarize, Descriptives
4.4. Procedura Means Într-un grup de subiecţi putem distinge subgrupuri de cazuri în funcţie de diverse criterii, subgrupuri între care este util să facem comparaţii în scopul stabilirii unor diferenţe ce merită exploatate mai îndeaproape.
31
Putem studia de exemplu media notelor la matematică obţinute într-o clasă, separat pentru fete şi băieţi. Sau putem studia diferenţele privind media de vârstă pentru femei şi bărbaţi într-un eşantion reprezentativ al populaţiei României (vezi figura 4.6). Subgrupurile pot fi formate atunci când cazurile pot fi divizate pe baza uneia sau mai multor variabile de grupare. Variabila sub studiu este deci de tip interval iar variabila de grupare este categorială. Declanşarea procedurii se face prin intermediul liniei de meniu: Statistics, Compare Means, Means Figura 4.6. Procedura Means
Rezultatul este o tabelă care afişează pentru variabila în cauză media, abaterea standard şi efectivul fiecărei categorii de grupare. În cazul în care se doreşte definirea grupurilor în funcţie de mai multe variabile de grupare, variabilele categoriale vor fi puse în “straturi” (Layers) diferite.
4.5. Procedura Explore Figura 4.7. Caseta de dialog al procedurii Explore
32
Poate fi folosită pentru a studia distribuţia unei variabile:
Calculează indicatori statistici descriptivi pentru toate cazurile sau pentru subgrupuri de cazuri.
Identifică valorile extreme. Acestea se datorează uneori introducerii greşite a datelor în calculator. Dacă sunt reale, atunci ele pot influenţa puternic deciziile pentru analiza statistică ulterioară, de aceea este util să fie depistate.
Calculează percentilele distribuţiei variabilei, atât pentru toate cazurile cât şi pentru subgrupuri de cazuri;
Generează o varietate de reprezentări grafice a datelor (stem and leaf, boxplot, histograme) care ne arată vizual cum se distribuie valorile datelor. Pentru declanşare vom alege din linia de meniu: Statistics, Summarize, Explore
În Dependent List se trece variabila pe care dorim s-o explorăm (variabilă tip interval). Variabila factor este o variabilă de grupare, care se alege în cazul în care dorim să calculăm statistici pentru subgrupuri de cazuri ale variabilei numerice studiate.
100
834 766
968 90
80
1105 1097
953 1117
1007 943
60
40
vârsta
20
0 N=
72
121
338
deloc multumit
121
destul de multumit nu prea multumit
foarte multumit
Multumit de - serviciu
Fig.4.8. Grafic boxplot pentru legătura dintre satisfacţia în muncă şi vârstă (Martie97) În figura 4.8 putem vedea o diagramă “boxplot” produsă de procedura Explore având ca şi variabilă factor mservici (satisfacţia în muncă) iar ca variabilă dependentă vârsta. Caseta de dialog al procedurii Explore a fost completată ca în figura 4.7.
33
4.6. Depistarea erorilor Este important să fim siguri că datele noastre sunt corecte. Avem aşadar interesul să căutăm cât mai multe tipuri de erori posibile. Câteva din cele mai des utilizate metode sunt tratate în cele ce urmează. Erorile pot apare din mai multe motive şi în mai multe faze ale unei cercetări. Cu cât există mai multe faze cu atât posibilitatea apariţiei unui nou tip de erori creşte. Erorile pot apare încă din faza de aplicare a chestionarului: respondentul sau operatorul de interviu bifează o altă căsuţă decât cea corectă. În etapa de codificare a chestionarului, în cazurile când codificarea nu apare direct pe formularul chestionar, se pot introduce erori suplimentare. O altă sursă de erori este etapa de introducere a datelor în baza de date. Cele mai des utilizate proceduri de localizare a erorilor sunt Case Summaries, Frequencies şi Descriptives. Dar şi procedurile Crosstabs şi Explore pot fi utile. Comanda Frequencies poate fi utilizată pentru a localiza valori inadecvate pentru variabile cu un număr mic de categorii distincte (caz tipic pentru variabilele de tip nominal şi ordinal). În exemplul din figura 4.9 se poate vedea un tabel de frecvenţe pentru variabila temere1 (temerile românilor) unde apare un cod (9) care nu face parte din valorile prevăzute.
m
m a u l q r r r u c c c e V 1 8 6 7 7 2 9 7 7 5 3 8 6 7 2 4 4 3 4 5 5 3 3 4 9 6 1 2 2 1 7 2 5 5 5 8 8 4 4 9 9 1 1 1 0 T 4 6 0 M 0 5 4 T 5 4 T 9 0
Figura 4.9. Tabel de frecvenţe pentru ”temere1” Problema constă în faptul că în afara celor 8 valori admisibile (codificate de la 1 la 8) mai apar şi valorile 0 şi 9. Valoarea 0 este atribuită valorilor omise, deci este acceptabilă. În schimb valoarea 9 trebuie să fie o eroare de un fel sau altul. Soluţia ideală ar fi să se caute valorile şi să se înlocuiască valoarea eronată cu versiunea corectă. În multe cazuri acest lucru nu este posibil şi atunci se poate atribui codului 9 rolul valorii omise (vezi secţiunea 9 din modulul 3). Această valoare omisă poate fi una de tip utilizator sau una de tip sistem (vezi modulul 6). În acest mod valoarea incorectă va fi exclusă din majoritatea analizelor statistice care utilizează variabila temere1.
34
e
t d e N i m m a V 8 8 2 0 5 N 9 0 4 4 8 V 8
Figura 4.10. Indicatori statistici descriptivi pentru variabilele “vârsta” şi “nringosp” Comanda Descriptives este utilă pentru depistarea erorilor similare, dar pentru variabile continue, măsurate pe scale de nivel interval sau rapoarte. Această procedură furnizează valorile minime şi cele maxime întâlnite în baza de date şi astfel putem vedea dacă apar valori neplauzibile. De exemplu, dacă ştim că eşantionul era compus din indivizi majori (cum este cazul la Barometrul opiniei publice), o vârstă minimă de 10 ani nu putea să apară decât dintr-o eroare. Un nivel de educaţie de 0 ani este la fel de improbabil (deşi nu imposibil). În cazul exemplului din figura 4.10 vârstele minimă (18) şi maximă (92) întâlnite în eşantion sunt plauzibile, dar pentru variabila nringosp (număr de indivizi în gospodărie) valoarea zero (0) nu are sens. Comanda Case Summaries este un instrument extrem de util prin faptul că permite listarea valorilor mai multor variabile pentru fiecare caz. Aceasta permite o abordare a căutării erorilor mai sofisticată, pentru găsirea cazurilor în care fiecare variabilă are valori perfect justificate, dar pentru care combinaţia de valori pentru două sau mai multe variabile este ridicolă. Aşa de exemplu, pentru cineva în vârstă de 10 ani ar fi ridicol să apară că ar conduce maşina 50.000 km pe an. Comanda Case Summaries permite detectarea erorilor de acest tip. Utilizarea acestei metode este mare consumatoare de timp, aşa că se preferă de multe ori listarea numai a anumitor părţi din baza de date. Pentru declanşarea procedurii se utilizează meniul principal: Statistics, Summarize, Case Summaries În figura 4.11 se poate vedea un exemplu de listare a variabilelor autoturi, mcuraten şi mtranspo pentru 15 cazuri.
35
u
a m
l t u v n e i a t e t o u c r 1 2 3 2 2 2 3 4 3 2 3 1 4 2 2 1 5 1 3 2 6 1 1 1 7 2 2 2 8 1 2 3 9 2 4 2 1 0 2 1 3 1 1 2 3 2 1 2 2 3 2 1 3 2 2 1 1 4 2 3 2 1 5 1 2 3 T N o 1 5 5 5 a L
Figura 4.11. Lista a 4 variabile pentru un set de 15 cazuri Ce putem face dacă găsim erori Unele erori pot fi tratate mai uşor decât altele. În exemplul de la procedura Frequencies, dacă am fi găsit o vârstă de 99 ani, probabil că problema se putea rezolva prin declararea codului 99 ca valoare omisă. Acest tip de eroare este uşor de corectat. Erorile apărute în etapa de codificare sau în cea de introducere a datelor pot fi corectate prin reexaminarea chestionarelor originale, dacă ele mai există. Pentru aceste cazuri este importantă includerea unui număr de serie atât pe formularul de chestionar cât şi în fişierul de date, astfel ca valorile să poată fi controlate. Dacă nu avem un astfel de număr (sau cod) de identificare, localizarea formularelor pentru cazurile cu valori eronate este deosebit de dificilă. Dacă nu putem descoperi nicicum adevărata valoare care ar fi trebuit să fie în fişier, cea mai bună metodă este cea de introduce în locul ei valoarea omisă sistem (punctul zecimal) tuturor valorilor suspecte.
36
. i
Partea a II –a. Analiza statistică inferenţială1 Capitolul 5. Căutarea confirmării ipotezelor Statistica elementară studiată în anul I s-a ocupat de organizarea, tabelarea şi rezumarea datelor colectate despre caracteristicile unei populaţii statistice. Procedurile de rezumare sunt destinate să prezinte datele într-o formă care să fie cât mai sugestivă pentru cititorii interesaţi de cunoaşterea realităţii prin intermediul variabilelor statistice. Deşi, pentru un observator atent, prezentările grafice şi indicatorii statistici descriptivi pot sugera legături între variabule, totuşi ele nu pot confirma şi nici verifica astfel de legături. Ele nu ne permit să generalizăm nici un fel de constatări dincolo de eşantioanele pe care le-am studiat. Pentru astfel de generalizări, avem nevoie să dezvoltăm ipoteze şi să le testăm în concordanţă cu principii ştiinţifice.
5.1. Testarea ipotezelor Formularea ipotezelor în cercetarea şi practica de asistenţă socială este extrem de importantă. Fie că sunt validate sau nu, ipotezele ne permit să abordăm în mod sţiinţific practica de asistenţă socială. Ipotezele sunt formulate deobicei după trecerea în revistă a literaturii de specialitate sau prin procesul sintetizării cunoştiinţelor cantitative şi calitative pentru o temă particulară: din experienţa profesională câştigată în practică; din cursuri scrise de profesionişti şi din multe alte surse specifice domeniului, incluzând legislaţia, documente nepublicate şi persoanele “cunoscătoare”. După o examinare a literaturii, putem expune doar răspunsuri parţiale sau putem finisa răspunsuri la întrebări generale. La început se doreşte exprimarea impresiilor sau a concluziilor noastre sub forma ipotezelor. După aceea ipotezele vor trebui testate. Multe definiţii au fost date ipotezelor, dar toate au la bază acelaşi concept - o ipoteză este o tentativă de răspuns la o întrebăre de cercetat, derivată din trecerea în revistă a literaturii de specialitate. Este în acelaşi timp o exprimare a unei relaţii dintr-o variabilă sau între variabile. O ipoteză, fie că este sau nu susţinută de analiza datelor, ea trebuie să fie o extensie logică a cunoştiinţelor existente anterior. Oricare altă metodă folosită pentru formularea ipotezelor nu este altceva decât “smulgerea” unei legături şi generează posibilitatea de pune la îndoială credibilitatea studiului de cercetare. Dupa colectarea, organizarea şi rezumarea informaţiilor, utilizând statistici asemănătoare celor prezentate în Partea I a acestei cărţi; putem începe să înţelegem dacă ipotezele noastre sunt sau nu susţinute de datele colectate. Să presupunem, de
1
Această parte a manualului se bazează pe capitolele 7-12 din Weinbach R.W., Grinnell R.M. Jr., 1987 - Statistics for Social Workers, Longman Inc., New York / London
37
exemplu, că am lansat ipoteza: clienţii alcoolici care primesc tratamentul în grup se pot abţine de la băutură mult mai bine, după trei luni de tratament, decât clienţii alcoolici care au primit tratamentul individual. Frecvenţele şi procentajele par să ne furnizeze suportul pentru aceată ipoteză; mai ales că numărul clienţilor a fost mic şi ne-a fost uşor să obsevăm tendinţa de succes pentru o metodă de tratament (aici tratamentul în grup) în opoziţie cu altele (tratamentul individual). Probabil, 70% din clienţii alcoolici care au primit tratamentul în grup se pot abţine acum de la băutură în comparaţie cu 65% din cei care au primit tratamentul individual. Există “în aparenţă” o legătură între variabila dependentă (băutor / nebăutor) şi variabila independentă (tratamentul de grup / tratamentul individual). Cu toate acestea, doar un naiv ar concluziona, doar pe baza celor prezentate anterior, că tratamentul în grup este cea mai bună metodă de lucru cu alcolicii. Pentru a testa ipotezele noastre în mod ştiinţific, trebuie să examinăm şi alte explicaţii posibile.
5.2. Explicatii alternative Aşa cum am afirmat, ipotezele noastre trebuie să fie sprijinite de date colectate. Dar e încă prematur să concluzionăm că există o relaţie adevărată între cele două variabile. O relaţie poate fi verificată doar după epuizarea tuturor explicaţiilor alternative care ar putea justifica legătura. În cazul nostru cele trei explicaţii alternative majore sunt: (1) deformarea, (2) alte variabile şi (3) şansa. Primele două sunt în principal legate de metodologia cercetării, iar cea de-a treia este direct legată de testarea statistică. O bună cunoaştere a metodelor de cercetare folosite în asistenţa socială ne va ajuta să minimalizăm efectele primelor două explicaţii alternative - iar această carte ne va ajuta cu eliminarea efectelor celei de a treia explicaţie alternativă. Deformarea Prima explicaţie alternativă este deformarea realităţii. Influenţele conjuncturale sunt o sursă sistematică de distorsiune, care afectează calitatea datelor colectate. Ele pot conduce la rezultatele eronate şi apoi la tragerea unor concluzii eronate. Deformări conjucturale pot apare când datele se colectează într-un moment neprielnic sau când studiul este influenţat de evenimente exterioare, de vreo tendinţă conştientă sau inconştientă a persoanelor care colectează datele şi care nu au o percepţie corectă asupra lor. Dacă dintr-un motiv oarecare, sau combinaţie de motive, datele au fost deformate, variabilele noastre dependente şi independente pot apărea ca fiind legate, când de fapt ele nu sunt. Posibilitatea ca deformarea să poată explica o legătură aparentă între două variabile este minimizată deobicei prin folosirea cu mare grijă a tehnicilor de măsurare. Alte variabile A doua explicaţie alternativă este influenţa altor variabile. Factorii care influenţează variabila independentă pot deasemenea explica diferenţele din cadrul variabilei dependente (a bea / a nu bea, în exemplul nostru). În exemplul nostru, aceştia ar putea fi intensităţile diferite ale suportului familiar pentru metoda de tratament şi nivele de calificare diferite ale asistenţilor sociali care practică cele douămetode. Un plan experimental bun, construit pe baze aleatoare, poate garanta un anumit nivel de control pentru celelalte variabile, dar planurile experimentale bune sunt rare în cercetarea în asistenţă socială. Alegerea unei tehnici metodologice corespunzătoare ne poate garanta că alte variabile nu sunt explicaţii reale ale unei aparente legături între două variabile. Căile prin care planurile de cercetare pot ajuta în controlul altor variabile sunt prezentate în general în textele privind metodologia cercetării. 38
Şansa Cea de-a treia explicaţie alternativă este şansa, care poate fi referită şi prin termeni ca probabilitate, eroare de eşantionare, întămplare norocoasă - sau pur şi simplu noroc. Şansa stipulează ca probabilitatea să se întâmple un eveniment se poate situa oriunde între valorile 0 (niciodată) şi 1 (absolut sigur). Ea se bazează pe presupunerea că în timp ce prin repetarea în timp îndelungat a unor observaţii se poate vedea ca există o anumită regularitate (pattern), în particular, sau pe termen scurt, observaţiile tind să difere într-un fel de pattern-ul pe termen lung. De exemplu, când desemnăm în mod aleator, un eşantion dintr-o populaţie, putem să nu selectăm un eşantion care să aibe o compoziţie identică cu cea a populaţiei din care provine. Teoria probabilităţii ne trimite direct la conceptul de eroare de eşantionare, prezentat în textele metodologice. Probabilitatea spune că o monedă lansată în aer, are 0,5 şanse (sau 50%) să cadă cu o anumita faţă în sus. Cu alte cuvinte, probabilităţile ca să fie cap sau pajură sunt egale. În realitate dacă aruncăm o monedă de zece ori am putea găsi un rezultat diferit de 5 cu 5. Nu vom fi surprinşi dacă obţinem 4 cu 6, sau 8 feţe din zece aruncări. În acest caz vom învinovăţi şansa (eroarea normală de eşantionare), şi vom presupune că dacă vom repeta testul de suficient de multe ori, procentul de aparinţie al feţei va fi aproximativ de 50%. Când analizăm datele noastre, trebuie să determinăm dacă nu cumva rezultatele noastre sunt aberaţii plauzibile de la patternul normal al evenimentelor apărute din cauza erorilor de eşantionare. Trebuie să fim cât mai siguri că o legătură aparentă dintre variabile nu este un simplu noroc ce poate apărea din cînd în cînd. Avem nevoaie să determinăm dacă şansa poate fi explicaţia reală pentru o legătură aparentă. O ipoteză poate fi susţinută doar când şansa, la fel ca şi deformarea şi ca influenţa altor variabile, pot fi convingător eliminate ca explicaţii alternative. Şansa este de obicei ultima explicaţie pe care consumatorii sceptici de rapoarte de cercetare îl propun ca şi cauză reală a legăturii aparente dintre două variabile. Spre deosebire de cazul deformării sau al altor variabile, planurile solide de cercetare nu sunt suficiente pentru a elimina şansa ca explicatie alternativă pentru o aparentă legătură între două variabile. Doar testele statistice o pot face.
5.3. Respingerea explicaţiei şansei prin testele statistice Toate testele statistice încearcă să discrediteze şansa ca explicaţie a unei aparente legături între variabile. Cu toate acestea, ele o fac pe căi diferite. Din fericire sunt mai multe asemănări decăt diferenţe, între testele statistice. Acest capitol examinează căile prin care toate testele statistice se apropie de acest obiectiv. În încercarea de a câştiga suport pentru ipoteze, nu putem elimina total şansa ca explicaţie pentru o legătură aparentă. Înainte de susţine o legătură, trebuie să ne asigurăm într-o măsură rezonabilă că cea ce am observat nu este o întîmplare norocoasă care poate fi uşor explicată prin eroarea normală de eşantionare derivată din întâmplare. Nu dorim să raportăm o legătură care pare să fie adevărată, dacă ea nu este de fapt aşa. În acelaşi timp, nu trebuie să fim niciodată atât de rigizi sau neraţionali, încât să nu cerem suport statistic pentru un rezultat al cercetării care este foarte improbabil să se datoreze şansei. Dacă cercetătorii devin obsedaţi de eliminarea totală a şansei ca explicaţie alternativă, puţine, sau chiar niciunul din rezultatele găsite ar vedea lumina zilei.
39
Testele statistice determină probabilitatea ca relaţiile aparente dintre variabile să se datoreze întâmplării. Dacă probabilitatea efectului întâmplării este mică, şi dacă deformările şi celelalte variabile au fost eliminate ca şi explicaţii posibile pentru o legătură aparentă, rămâne o singură explicaţie raţională: există o legătură credibilă. Dacă efectul şansei este mare, noi nu mai putem pretinde suport pentru o ipoteză care prezice o legătură, chiar dacă celelalte două explicaţii alternative au fost eliminate. Pe scurt trebuie eliminate toate cele trei explicaţii alternative înainte ca o ipoteză să poată fi considerată ca având suport. Tipuri de legături declarate în ipoteze O ipoteză care declară o legătură între variabile, dar care nu indică care valori ale unei variabile se vor grupa cu care valori ale altei variabile, este denumită ipoteză nedirecţională (non-directional sau two-tailed) O ipoteză care declară o legătură între două variabile şi specifică modul (direcţia) în care se crede că sunt legate, este denumită ipoteză direcţională (sau one-tailed). Exemplul folosit mai devreme în acest capitol este o ipoteză direcţională. Ea precizează clar că rata înaltă a abstinenţei la alcool va fi găsită printre clienţii alcolici care au primit tratamentul în grup faţă de clienţii alcolici care au primit tratamentul individual. O ipoteză nedirecţională pentru exemplul nostru, ar stabili că metoda de tratament folosită este legată de abstinenţă; dar nu ar putea prezice care metodă de tratament poate fi asociată cu rata ridicată sau scăzută de abstinenţă. Există, fireşte, o a treia descriere posibilă a legăturii între două variabile predicţia că ele nu vor fi găsite legate (nu există nici o relaţie între ele). Această este numită ipoteză nulă. Ipoteza nulă este considerată de obicei ipoteza cercetării - adică, ipoteza care trebuie dovedită. Deşi ipotezele cercetării tind în mod frecvent să fie direcţionale, câteodată sunt folosite şi ipotezele nedirecţionale, dacă cunoştinţele asupra subiectului sunt limitate. Căutarea suportului pentru a prezice că două variabile sunt nelegate este rară, dar nu fără utilizare în practica şi cercetarea din asistenţa socială. Cercetătorii care au căutat să contrazică ipoteza că o rasă ar fi superioară alteia din punct de vedere intelectual, au căutat suport statistic pentru ipoteza nulă (rasa şi inteligenţa nu sunt legate). Similar practica curentă poate sugera că tratamentul individual este mai eficient decât tratamentul în grup pentru tratarea disfuncţionalităţii sexuale a clienţilor. Din observaţile noastre şi din literatura de specialitate am putea totuşi concluziona că nu se pot face diferenţieri între metodele de tratament folosite în asistenţa socială. În acest caz am putea alege ipoteza nulă ca ipoteză pentru o astfel de cercetare: succesul în tratarea disfuncţiei sexuale nu este legat de metoda de tratament. Ipoteza nulă şi indicatorii statistici Cele trei forme ale ipotezei (direcţională, nedirecţională şi nulă) sunt toate importante pentru noi în construcţia ipotezei unei cercetări.Toate trei, dar în special ipoteza nulă, sunt extrem de importante în înţelegerea modului în care indicatorii statistici sunt folosiţi în testarea ipotezelor. Trebuie amintit că ipoteza nulă este consistentă în raport cu şansa. Ea susţine că două variabile sunt nelegate chiar dacă ele par a fi legate într-un set de date. Ea continuă să susţină că doar fluctuaţia normală a şansei, sub forma erorilor de eşantionare, este cea mai potrivită explicaţie pentru aparenta legătură dintre două variabile. Chiar şi atunci când ipoteza nulă nu este folosită ca ipoteză a cercetării, şi ipotezele sunt fie direcţionale fie nedirecţionale, conceptul ipotezei nule joacă un rol important în testare. Pentru a confirma că două variabile sunt legate, trebuie să verificăm mai întîi că ele să nu sunt nelegate. Altfel spus trebuie să demonstrăm că şansa (ca expresie a ipotezei nule) nu este explicaţie fericită a legăturii aparente. 40
Când o ipoteză este direcţională sau nondirecţională, există un fel de fantomă a ipotezei nule. Ipoteza nulă statuează că o legătură aparentă este de fapt un rezultat al şansei. Înseamnă că am extras un eşantion netipic de date şi că legătura aparentă pe care am observat-o în eşantion nu caracterizează în realitate populaţia din care am extras eşantionul. Pentru a respinge ipoteza nulă, avem nevoie să demonstrăm că şansa este o explicaţie nefericită pentru legătura aparentă observată şi că o legătura adevărată este o concluzie mult mai plauzibilă. Testele statistice ne permit să determinăn când putem întări o ipoteză direcţională sau non direcţională cu ajutorul unui suport statistic. Erori de tipul I şi de tipul II Două tipuri de erori pot fi făcute în interpretarea rezultatelor unei cercetări: tipul I şi tipul II. O eroare de tipul I este atunci când se respinge ipoteza nul’ şi se concluzionează că există o legătură între două variabile, când de fapt nu există nici o legătură. O eroare de tipul II este atunci când încercarea de a respinge ipoteza nulă şi de a identifica o legătură adevărată între două variabile eşuează, când de fapt există una. Cele două tipuri sunt comparate în Tabelul 5.1. Tabel 5.1. Erori de tip I şi II Decizia noastră
În realitate
Respingem ipoteza nulă Ipoteza nulă este falsă
Corect
Acceptăm ipoteza nulă Eroare de tip I ex: ”criminalul este nevinovat”
Ipoteza nulă este adevărată
Eroare de tip II
Corect
ex: ”nevinovatul este criminal”
Sunt câţiva factori legaţi de deciziile privind planul de cercetare care pot mări sau micşora probabilitatea producerii erorilor de tipul I sau II. Aceştia includ selectarea unui eşantion deformat, utilizând instrumente de colectare a datelor care sunt nevalabile şi/sau nesigure, şi care vor sfârşi prin imposibilitatea de a controla efectul altor variabile. Tipul I şi II de erori pot deasemenea rezulta din folosirea testelor statistice nepotrivite. Dacă folosim un test statistic ce necesită condiţii puternice care nu sunt îndeplinite, sau dacă utilizăm un test care necesită doar căteva condiţii şi în realitate sunt îndeplinite condiţii pentru un test mai puternic, pot apărea erori de tipul I sau II. În primul caz datele au fost tratate ca şi când ar poseda calităţi care de fapt le lipsesc, în ultimul caz, oportunitatea pentru o analiză mai exactă nu a fost folosită. Dacă nu e folosit testul statistic potrivit, poate apărea o legătură statistică numai datorită însuşirilor eronate pe care le-am atribuit datelor şi modului în care au fost colectate. Sau s-ar putea ca o legătură adevărată să rămână ascunsă. Niciodată nu putem elimina în totalitate posibilitatea de comitere a erorilor în luarea deciziilor, deci nici în decizia de a respinge sau nu ipoteza nulă. De fapt dacă suntem prea prudenţi să nu comitem erori de tipul I (să respingem în mod greşit ipoteza nulă), creşte posibilitatea comiterii tipului II de eroare (greşeala de a nu respinge ipoteza nulă). Analog, grija exagerată de a nu comite erori de tipul II duce la creşterea probabilităţii de a comite eroride tipul I. Cercetătorii trebuie să decidă până la urmă care eroare, de tipul I sau de tipul II, este mai acceptabilă pentru ei. Aceasta este o decizie de natură etică ce presupune cunoştiinţe din practica asistenţei sociale şi
41
despre consecinţele uneia sau alteia din erori. Din fericire aşa cum vom prezenta mai departe, există convenţii statistice care să ne ghideze în luarea deciziilor. Într-un studiu de cercetare importanţa acestor erori este, desigur, potenţial gravă. De exemplu, profesioniştii în asistenţă socială nerecunoscând că folosirea greşită a testului statistic sau a unei erori metodologice a dus la un rezultat eronat din tipul I, pot concluziona în mod eronat că există o legătură între o metodă particulară de tratament şi rata mai mare de succes în tratament. Ei pot ajusta accesul la tratament pe baza acestui “fapt”. Sau ei pot reacţiona la alte rezultate ale cercetării în care (din anumite motive) a fost comisă eroare de tipul II, şi care discreditează o metodă de tratament în realitate foarte buna, dar care a apărut că nu face parte dintre tratamentele eficiente. Tipul I şi tipul II de erori pot fi la fel de distructive când aplicăm rezultatele cercetării la situaţiile practice de asistenţă socială. Amândouă ne pot conduce la concluzii greşite, pot face rău clienţiilor noştri, sau duc la risipirea resurselor limitate ale agenţiei. Chiar dacă studiile de cercetare sunt bine planificate şi dacă noi înţelegem şi aplicăm criteriile de selecţie a testului statistic potrivit, există întotdeauna câteva posibilităţi, nu contează cât de “acceptabil” de mici, pentru comiterea unei erori în tragerea concluzilor intr-o cercetare. Întotdeauna rămâne posibilitatea de-a ni se întâmpla ca unul din miliardele de eşantioane posibile, să ne conducă la concluzii eronate despre legăturile dintre variabile în populaţia din care provine eşantionul. Sau am făcut câteva erori metodologice obscure care au introdus deformarea sau alte variabile în planul nostru de cercetare. Această vagă posibilitate nu trebuie, totoşi, să să ne timoreze în a ne asuma riscuri rezonabile în interpretarea rezultatelor cercetării şi în aplicarea lor practică. În felul acesta putem face progrese şi putem deveni practicieni cu o bază de cunoştinţe ştiinţifice.
5.4. Dovezi suficiente şi semnificaţie Dacă ne întoarcem la exemplul nostru cu cele două tipuri de tratamente şi la posibila legătură cu abstinenţa clienţilor alcoolici, putem observa că diferenţa de procente dintre rata absinenţei pentru grupul care a primit tratamentul în grup (70%) şi rata abstinenţei pentru aceia care au primit tratamentul individual (65%), este de fapt destul de mică. Chiar dacă am fi avut 50 de clienţi pentru fiecare tratament, mulţi dintre noi nu pot spune dacă aceste 5 procente (70% - 65% = 5%) diferenţă pot fi suficiente pentru a respinge ipoteza nulă (ipoteza nulă în acest exemplu poate fi aceea că metoda de tratament şi efectele nu au legătură una cu alta). O diferenţă de 40 procente între două metode de tratament, ne-ar da mai multe speranţe în a obţine suport statistic pentru o asemenea ipoteză. Din nefericire, în realitate datele arareori vorbesc atât de tranşant pentru a putea susţine sau respinge ipoteza nulă. Ele de obicei sunt astfel încât avem nevoie de testele statistice care să ne ajute (nu să ne conducă) în a decide dacă avem sau nu suport statistic pentru eliminarea ipotezei nule. Până la ce punct ne putem simţi liniştiţi când vrem să respingem ipoteza nulă şi să susţinem că avem suport statistic pentru ipoteza direcţională? Dacă urmare a unor evenimente fortuitoare, a fost posibil să repetăm un studiu de cercetare (numit replicare în terminologia cercetării) de 100 sau chiar de 200 de ori şi în fiecare studiu individual clienţii trataţi în grup au avut o rată de abstinenţă alcoolică mai înaltă, noi trebuie să fim convinşi că ipoteza nulă poate fi cu siguranţă respinsă. Din nefericire, în cercetarea de asistenţă socială nu prea avem posibilitatea de a repeta studiile de mai multe ori. Astfel că avem nevoie să obţinem nişte dovezi palpabile ale improbabilităţii ipotezei nule, cu ajutorul unui
42
singur studiu. De la ce punct putem fi suficient de siguri că o legătură aparentă nu poate fi respinsă în mod rezonabil, datorită aportului şansei? Aici trebuie să apelăm la simţul comun şi la convenţii. Dealungul anilor, cele mai multe cercetări au situat la nivelul de 95% certitudine, punctul care este suficient de înalt pentru a putea avea încredere în eliminarea ipotezei nule. Altfel spus cercetătorii se vor simţi siguri în a concluziona că două variabile sunt legate (sau în relaţie) dacă analiza statistica sugerează că există mai puţin de 5% procente şanse de a face o greşeală, prin respingerea ipotezei nule. Acest nivel de risc în comiterea unei erori de tipul I este acceptabil în majoritatea studiilor de cercetare. Convenţia statistică declară că există suport pentru o ipoteză direcţională sau nondirecţională, dacă probabilitatea de a face o eroare de tipul I este mai mică decât 5% - se mai utilizează şi terminologia echivalentă: nivel de semnificaţie 0,05 , sau coeficient de risc 0,05, sau nivel de încredere 0,95. O decizie care respinge ipoteza nulă nu poate elimina definitiv şansa ca explicaţie posibilă a unei legături aparente. Trebuie să acceptăm că şansa, sub forma erorii de eşantioanare, poate fi cauza pentru care două variabile par a fi legate, când ele nu sunt de fapt. Nu există nimic sacru în ceea ce priveşte nivelul de semnificaţie 0,05, dar el este cel mai des folosit pentru respingerea ipotezei nule. Decizia folosirii şi a altor nivele decât cel de 0,05 se justifică în funcţie de consecinţele care ar rezulta prin luarea unei decizii greşite. O cerere de dovezi mai tari, pentru aceptarea unei legături între variabile, cum ar fi cele de nivel 0,025 sau 0,01, poate fi dorită când este necesar să existe chiar mai puţine posibilitaţi de a greşi respingând ipoteza nulă şi de a concluziona că există o legatură între două variabile, atunci când întâmplarea este o explicaţie reală pentru legătura aparentă dintre ele. Această abordare asigură o probabilitate de a greşi chiar mai mică decât cea datorată erorii de eşantionare. Dacă utilizarea rezultatelor cercetării poate fi o problemă de viaţă şi de moarte, aşa cum e în cazul unui nou medicament, este nevoie de un nivel mai înalt şi mai precis pentru eliminarea ipotezei nule, de exemplu putem folosi nivelul 0,001. Nivelul de semnificaţie 0,001 înseamnă că probabilitatea de a respinge ipoteza nulă în mod eronat este de 1 la 1000. În studiile de cercetare în care importanţa unei erori în respingerea ipotezei nule nu este fatală sau traumatică, putem considera că nivelul de semnificaţie 0,10 (10% probabilitate de a greşi) este acceptabil. La nivel de semnificaţie 0,10 există de două ori mai multe posibilităţi de a comite o eroare de tipul I (sub forma erorii de eşantionare) decât există la nivelul 0,05. Câteodată se acceptă un nivel de semnificaţie mai slab decât 0,10 pentru confirmarea unei legături între două variabile, acolo unde planul de cercetare include replicarea (repetarea cercetării). Dacă un nivel de 0,10 poate fi considerat ca insuficient pentru a dovedi o legătură, un caz tipic sau o serie de cazuri tipice sunt suficiente pentru a ajunge la concluzia că ipoteza nulă poate fi respinsă. Deşi o anumită flexibilitate este permisă în selectarea pragurilor la care şansa este în mod acceptabil eliminată ca explicaţie pentru o legătură aparentă, alegerea unui nivel de încredere nu trebuie văzută ca şi cauzală. Selectarea unui nivel de încredere trebuie deasemenea să fie făcută înainte ca informaţiile să fie colectate. Nu ar fii etic să schimbăm nivelul de încredere după aceea, deoarece deciziile ar fi interpretate ca un efort manipulator pentru a întoarce rezultatele în favoarea sprijinirii concluziilor cercetării.
43
5.5. Relaţii statistic semnificative şi rezultate substanţiale Cuvântul semnificativ este larg utilizat si totodată foarte vag în profesia noastră. Îl folosim deseori pentru a accentua importanţa a ceva, ca de exemplu “contribuţia semnificativă” a unui asistent social la autorizarea plăţii notelor de plată sau pe rol de “evoluţii semnificative” în dezvoltarea respectului de sine la clienţi. Cu alte cuvinte îl folosim zilnic, ca o valoare, de aceea este bine să aşezăm alături de înţelesul lui semnificativ utilizat în mod obişnuit, şi ceea ce el înseamnă în statistică. Semnificaţia statistică este o demonstraţie, prin procedeul testării statistice, care elimină ipoteza nulă într-un mod sigur, şi arătă că există o legătură reală între variabile. O legătură între două variabile care este declarată a fi statistic semnificativă este atunci când suntem în mare măsură siguri (95%, în cele mai multe cazuri) că ea nu poate fi explicată ca o idiosincrazie a şansei sau a erorii de eşantionare. În statistică există doar un singur înţeles relevant al cuvântului semnificativ sau semnificaţie; trebuie să fim atenţi în folosirea termenilor numai în acest sens. O legatură statistic semnificativă între variabile poate sau nu sugera un rezultat întradevăr important al cercetării. Trebuie să fim atenţi la evaluarea fiecărei legaturi cu suport statistic, în contextul întrebării, “Ei şi ce ?!” În practica de asistenţă socială, nu orice legătură statistic semnificativă este un rezultat ce necesită o implementare reală. In realitate pot exista legaturi statistic semnificative care sunt judecate ca fiind nesemnificative în sens absolut. Un exemplu ne poate ajuta să ilustrăm această distincţie. Un administrator de asistenţă socială care a condus un studiu de cercetare pentru a determina care tip de abordare (A sau B) produce rezultate mai bune la clienţii care apelează la serviciile de consiliere familială. Administratorul demonstrează că mărimea medie de 53 printre cuplurile care au primit Tratamentul A este suficient de diferit faţă de marimea 57 printre cuplurile ce au primit Tratamentul B. Administratorul se simte sigur în ceeace priveşte eliminarea ipotezei nule şi concluzionează că există o legătură statistic semnificativă între tipul de tratament şi aranjamentul marital. Dar după o privire mai atentă, administratorul concluzionează că rezultatele nu sunt relevante, pentru că o diferenţă de numai patru puncte (57-53) este prea mică. Această diferenţă nu este în mod sigur îndeajuns de mare pentru a justifica trimiterea câtorva membrii ai personalului la un program scump de învăţare şi deprindere a Tratamentului B. Bazându-se pe lipsa cunoaşterii a ceea ce poate fi interpretat ca un rezultat substanţial (o diferenţă banală de patru puncte) administratorul decide să nu implementeze rezultatele. Existenţa unei legături statistic semnificative între variabile poate fi determinat prin testare statistică pe baza legilor probabilităţii. După aceea trebuie determinat dacă un rezultat este suficient de substanţial sau nu. Această decizie cere o bună înţelegere a mai multor aspecte diferite din practica asistenţei sociale.
5.6. Rezumat Acest capitol a prezentat modul în care şansa şi legile probabilităţii sunt implicate în testarea ipotezelor cercetării. Testarea statistică este folosită pentru a elimina factorul şansă ca o explicaţie a legăturilor aparente; planurile de cercetare sunt folosite pentru a elimina celelalte posibile explicaţii, ca deformarea şi alte variabile. Întotdeauna trebuie să avem în vedere principiile eticii, convenţiile şi sensul comun în stabilirea dacă şansa a fost adecvat eliminată ca o explicaţie competitivă pentru o aparentă legătură între variabile. Decizia dacă suportul statistic pentru o legătură poate
44
fi invocat sau nu, trebuie întotdeauna făcută în legătură cu potenţialul de decizii în folosul sau în defavoarea clienţilor asistaţi social. În final trebuie să decidem dacă o legătură găsită a fi statistic semnificativă între variabile este substanţială sau lipsită de importanţă.
5.7. Întrebări pentru studiu 1. Înainte de a pretinde că există o legătură reală între variabile, care sunt cele trei explicaţii cuncurente care trebuie eliminate ? 2. Care dintre explicaţiile concurente necesită aportul statisticii ca să fie respinse ? 3. Care explicaţii concurente trebuie să fie controlate la începutul planului de cercetare? 4. Care sunt ceilalţi patru termeni pentru şansă care sunt folosiţi în testarea ipotezelor? 5. Care este diferenţa dintre o eroare de tipul I şi una de tipul II ? 6. Care este forma nulă a unei afirmaţii pentru o legătură între vârstă si preferinţa politică? 7. Care este legătura dintre ipoteza nulă şi şansă în testarea ipotezei ? 8. Poate o legătură “statistic semnificativă” între variabile, să însemne că nu există posibilitatea ca variabilele să fie nelegate? Explicaţi. 9. Când putem folosi un alt nivel de semnificaţie decât convenţionalul 0,05 pentru a concluziona că există suport statistic pentru o ipoteză ? 10. Care nivel de semnificaţie 0,01 sau 0,10 sugerează o probabilitate mai mare de existenţă a unei legături reale între variabile ?
45
Capitolul 6. Selectarea unui test statistic
Capitolul precedent a descris modul în care sunt folosite testele statistice pentru a produce argumente în susţinerea ipotezelor privind relaţiile dintre sau printre variabile; testele statistice participă în determinarea situaţiei în care şansa este o explicaţie nepotrivită pentru o legătură aparentă. Acest capitol continuă discuţia asupra testelor statistice şi prezintă condiţiile în care un anume test statistic este potrivit pentru analiza datelor unei anumite situaţii date.
6.1. Importanţa selectării unui test statistic potrivit Prea multe decizii legate de o cercetare pot altera credibilitatea unui studiu de cercetare. Selecţionarea unor instrumente deformante de colectare a datelor, folosirea unor metode de eşantionare inadecvate, sau compilarea unor reviste de specialitate inadecvate ne pot produce îndoieli în ceeace priveşte rezultatele oricărui studiu de cercetare. În plus, credibilitatea unui studiu de cercetare în asistenţa socială depinde foarte mult de utilizarea unor analize statistice corespunzătoare. Folosirea unui test statistic nepotrivit ne poate conduce la concluzii şi recomandări eronate, care pot compromite şi cel mai bun plan de cercetare. De ce oare suntem câteodată puşi în situaţia de a alege un test statistic necorespunzător când există altele care sunt corespunzătoare pentru aproape orice situaţie posibilă? Un motiv major este “regula obişnuinţei”. Aceast pricipiu afirmă că mulţi dintre noi tind să vadă soluţia pentru o problemă ca fiind ceea ce este mai bine şi ceea ce este mai confortabil şi mai familiar. De exemplu, un specialist în rezolvarea cazurilor poate tinde să răspundă problemei unui client prin recomandarea unui tratament individual, un specialist în munca de grup poate vedea acelaşi client ca având nevoie de un tratament în grup. Iar un avocat poate înclina spre a vedea serviciul legal ca fiind soluţia pentru multe probleme. Câţiva asistenţi sociali au o anumită formare în utilizarea testării statistice. Cunoştiinţele lor le permit să fie familiari cu unul sau două teste statistice. Aflaţi în situaţia de a alege în obişnuitele limitări de timp un test statistic, ei vor aplica “regula obişnuinţei”, alegând unul din vechii prieteni cu care sunt familiarizaţi, mai degrabă decât să exploreze posibilitatea utilizării unui test statistic mai potrivit care ar necesita studiu suplimentar. Ei mai pot avea impresia că toate testele statistice au atât de multe în comun încât diferenţele rezultate în folosirea lor vor fi mici indiferent care dintre ele ar fi folosit. Această falsă interpretare poate duce la selectarea testului folosit cel mai frecvent în locul unuia care este mai puţin familial. Acest mod de gândire scuză în mod fals timpul pe care nu-l consumăm pentru a căuta un test statistic potrivit pentru situaţia dată. El duce la proasta aplicare şi la discreditarea a ceea ce altfel ar fi fost extrem de necesar în domeniul cercetării.
6.2. Consecinţele folosirii unui test statistic necorespunzător Orice test statistic cere anumite condiţii pentru folosirea sa corespunzătoare. Aşa cum vom vedea, anumite teste au cerinţe mai multe decât altele - adică ele au mai multe restricţii de utilizare. Ca regulă generală, testele care necesită condiţii mai 46
exacte trebuie folosite mai degrabă decât cele care cer condiţii mai puţine, dar numai dacă condiţiile necesare sunt îndeplinite. Ele ne conduc mai greu la erori de tipul I sau de tipul II în formularea concluziilor cercetărilor noastre. Conceptul puterii unui indicator statistic Nu toate testele statistice sunt egale; unele sunt inevitabil mai bune decât altele. Testele cele mai bune sunt mai puternice faţă de testele mai puţin puternice. Un test mai puternic ne permite să tragem concluzii bine specificate din datele deţinute; concluziile mai vagi, mai generale, rezultă din folosirea testelor mai puţin puternice. Puterea este un concept bazat pe calcule matematice şi măsoară probabilitatea comiterii unei erori prin respingerea ipotezei nule, dacă testul este utilizat corect. Un test mai puternic, folosit corespunzător, va avea o mai mică probabilitate de a ne conduce la o eroare de tipul II, adică el este mai potrivit pentru a detecta o legătură adevărată între variabile. Un test mai puţin puternic, datorită propriei naturi, este mai probabil să ne conducă la o eroare de tipul II, chiar dacă toate criteriile pentru folosirea lui sunt îndeplinite. Aşa cum am sugerat, testele mai puternice sunt în general acelea care necesită condiţii mai ferme pentru folosirea lor. Ele sunt mai complexe prin aceea că folosesc, în general, toate valorile pentru toate cazurile (direct sau indirect), în loc de a folosi doar valorile câtova cazuri (de exemplu, extremele sau valorile tipice). Ştim că abaterea standard este preferabilă amplitudinii ca indicator al împraştierii (şi mai potrivit) şi că media este un indicator mai precis al tendinţei centrale (şi mai potrivit) decât sunt mediana sau modul. De ce? Pentru că amândouă, media şi abaterea standard, implică calcule care folosesc toate valorile; pe când celelalte statistici descriptive, mai puţin precise, nu le folosesc. Acelaşi principiu se aplică în înţelegerea nivelului mare sau mic al puterii testului statistic folosit în testarea ipotezei. În general, testele mai puternice au probabilitatea de a folosi mai multe valori din setul de date. Deasemenea ele profită mai mult de avantajele măsurătorilor de o precizie mai mare. În general, trebuie să folosim cel mai puternic test care poate fi justificat pentru orice situaţie dată. Datele sunt irosite dacă e folosit un test mai puţin puternic când sunt întâlnite criterii pentru un test statistic mai puternic. Un test statistic prea puternic pentru condiţiile care există, ne poate conduce la tragerea unor concluzii false din analiza datelor. Putem evita selectarea unui test statistic prea puternic sau al unui test mai puţin puternic decât ar fi posibil, doar dacă înţelegem factorii criteriilor de alegere a diferitelor teste.
6.3. Consideraţii care influenţează alegerea unui test Metodele de cercetare utilizate şi datele rezultate afectează direct alegerea testului statistic. Este deosebit de important, chiar critic, să cunoaştem contextul cercetării noastre, strategia specifică de cercetare pe care am utilizat-o şi nivelul de măsură al datelor colectate. O corectă înţelegere a studiului de cercetare şi abilitatea de a specifica ce, cum şi de ce, înainte de faza analizei datelor, va facilita foarte mult selectarea unui test statistic. Este bine să specificăm testele statistice ce urmează a fi folosite înainte de a începe colectarea informaţiilor. Totuşi, se întâmplă destul de des să întâlnim probleme în colectarea datelor, probleme care pot schimba modul în care aceste informaţii sunt colectate şi căile prin care ele pot fi măsurate şi analizate. Când apar astfel de situaţii se consideră etic, şi în anumite cazuri absolut esenţial, selectarea unor teste diferite de
47
cele anticipate. Trei consideraţii influenţează alegerea unui test statistic: (1) metodele de eşantionare folosite, (2) natura distribuţiei populaţiei cercetate şi (3) nivelul de măsurare al variabilelor. Metodele de eşantionare folosite Opţiunile metodologice făcute în procesul de cercetare vor începe procesul de eliminare a anumitor teste statistice ca fiind nepotrivite pentru testarea ipotezelor. Alegerea unei metode de eşantionare scurtează lista testelor potrivite pe care le-am putea folosi. În selectarea testului corect, trebuie să fim capabili să dăm răspunsuri la patru întrebări legate de metoda de eşantionare: 1. Observaţiile făcute au fost alese aleator? Selecţia unui caz a putut creşte sau descreşte probabilitatea că oricare alt caz al populaţiei să fi fost deasemenea selectat? 2. Metoda de eşantionare a selectat un singur eşantion sau mai multe? Cât de multe? 3. Dacă au fost mai multe eşantioane, au fost ele independente unele faţă de altele, sau au fost ele legate într-un fel? 4. Cât de mare este ordinul de mărime al eşantionului ? Dacă putem răspunde la aceste patru întrebări, vom fi capabili să eliminăm corect mai mult de jumătate din testele statistice existente deoarece nepotrivirea lor pentru metoda de eşantionare avută în vedere este evidentă. Natura distribuţiei populaţiei cercetate O a doua apreciere majoră în selectarea testului statistic este modul în care variabilele pe care le-am selectat pentru studiu sunt distribuite în interiorul populaţiei. Câteva din cele mai puternice teste necesită o distribuţie normală (sub formă de clopot) a variabilei în populaţia din care eşantionul noastru a fost scos la întâmplare. Aşa cum am discutat în Partea I a acestei cărţi, o distribuţie oblică pozitivă sau negativă trebuie să excludă folosirea mediei ca măsură a tendinţei centrale sau abaterii standard ca o măsură a dispersiei. Absenţa unei distribuţii normale a variabilei în populaţia supusă studiului va duce în mod similar la scoaterea din considerare a multor teste folositoare şi puternice. O distribuţie normală perfect simetrică este rară. O descriere completă a unei variabile pentru o anumită populaţie poate să nu existe; dacă e aşa datele avute pot să aproximeze doar o curbă în forma de clopt. În situaţiile concrete ale cercetărilor, adesea facem judecăţi de valoare care ne ajută în luarea decizilor. De exemplu, facem judecăţi de valoare când decidem că am văzut suficient de multă literatură de specialitate, când justificăm o ipoteză direcţională, sau când alegem un nivel de încredere pentru respingerea ipotezei nule. Tot aşa, facem o judecată de valoare când determinăm dacă o distribuţie este suficient de “normală”. În general, când o variabilă are valori ce aproximează o curbă în formă de clopot, poligonul de frecvenţe pentru populaţia din care provine este considerat suficient de normal pentru folsosirea unor teste statistice relativ puternice. Nivelul de măsurare pentru variabile Un al treilea factor, considerat major în selectarea testelor statistice, este nivelul de măsurare al variabilelor dependente şi independente. Aşa cum am prezentat în Capitolul 1, putem categoriza variabilele de nivel nominal, ordinal, interval şi rapoarte. O construcţie bine planificată a instrumentelor de colectare a datelor ne va pemite obţinerea celui mai înalt nivel posibil de măsurare pentru orice variabilă dată. Putem pierde din precizia datelor dacă folosim un instrument de colectare a
48
informaţiilor construit neîngrijit, prin care se permite unei variabile care ar fi putut fi măsurată de nivel interval sau raport să fie mai puţin precisă. Apoi urmează să o tratăm doar ca un indicator sec al cantităţii (nivelul ordinal). Alegerea unui instrument care produce categorii doar de nivel ordinal de măsurare, în loc de un indice măsurat la nivel interval, va exclude automat folosirea tuturor testelor statistice care necesită variabile de nivel interval. Intradevăr, deciziile pe care le folosim în operaţionalizarea şi în construirea chestionarului, afectează cercetarea prin micşorarea sau extinderea posibilităţilor de alegere a testelor statistice potrivite pentru ipotezele noastre.
6.4. Teste parametrice şi neparametrice Cei trei factori menţionaţi mai sus, metoda de eşantionare, natura populaţiei cercetate şi nivelul de măsurare al variabilelor, determină testul statistic cel mai potrivit pentru a fi utilizat. Fiecare test are propriile cerinţe specifice care se leagă cu fiecare dintre aceşti trei factori. Totuşi pentru simplificarea proceselor de selectare a unui test corespunzător, trebuie punctat că există două grupuri de teste mutual exclusive, care reflectă două mănunchiuri distincte de cerinţe. Cele doua tipuri de teste statistice sunt testele parametrice şi neparametrice. Testele parametrice Testele parametrice sunt mai puternice decât cele neparametrice. Din acest motiv ele sunt preferabile testelor neparametrice, desigur dacă sunt îndeplinite condiţiile pentru folosirea lor. Ele pretind: (1) o distribuţie normală a variabilei (variabilelor) în populaţia studiată, (2) extragerea de eşantioane independente şi (3) cel puţin o variabilă studiată să fie de nivel interval sau rapoarte. Deobicei, ele pretind (4) mărimi mai mari pentru eşantioane decât cele neparametrice. Ca o regulă, e bine să avem în vedere că dacă media şi abaterea standard sunt potrivite ca statistici descriptive pentru rezumarea datelor, statisticile parametrice pot fi utile pentru examinarea legaturilor dintre variabile. Testele neparametrice Testele neparametrice sunt folosite pentru cercetarea situaţiilor în care condiţiile pentru folosirea testelor parametrice nu sunt îndeplinite. Ele sunt mai puţin puternice decât cele parametrice. Spre deosebire de testele parametrice, acestea nu necesită o distribuţie normală. Unele cer eşantioane independente, altele nu. Numărul de eşantioane şi de cazuri din componenţa fiecărui eşantion sunt factori importanţi în selectarea unui test neparametric din sutele care există. Multe dintre aceste teste necesită date măsurate doar la nivel nominal sau ordinal, dar unele cer o precizie de măsurare mai mare. Deoarece statisticile neparametrice sunt desemnate, în general, pentru analizarea datelor de nivel nominal sau ordinal care nu trebuie să fie distribuite normal, ele sunt adesea ideale pentru cercetarea de asistenţă socială. Aşa cum am arătat mai devreme, multe dintre variabilele dependente nu sunt de nivel de măsurare interval sau rapoarte (de exemplu, succesul sau eşecul în tratament, respitalizarea sau nerespitalizarea etc.). Testele neparametrice sunt mai mult decât o a doua opţiune pentru situaţiile în care criteriile cerute de statisticile parametrice nu sunt îndeplinite. Ele au câteva avantaje distincte faţă de testele parametrice şi sunt adesea singurele teste potrivite cu necesităţile noastre statistice. De exemplu, un test statistic neparametric este în special folositor când:
49
1. Eşantioanele au fost selectate din populaţii diferite; folosindu-se cadre de eşantionare diferite. 2. Datele deţinute au fost constituite în principal prin aranjarea în ordine a mai multori răspunsuri alternative sau, 3. Eşantioane foarte mici (din şase sau şapte cazuri) sunt tot ce există disponibil pentru studiu. Din fericire, lipsa de putere a testelor neparametrice poate fi compensată cel puţin în parte. În multe situaţii, două sau chiar mai multe teste pot fi potrivite; unul dintre ele poate fi potenţial mai puternic decât altul (altele). Totuşi ele pot avea nevoie de diferite mărimi minime de eşantione. Ca o regulă generală, testul care necesită cea mai mare dimensiune de eşantion este, probabil, cel mai puternic. Dacă anticipăm nevoia de putere în testare, putem mări dimensiunea eşantionului (eşantioanelor) noastre, astfel încât să se îndeplinescă criteriile pentru utilizarea celui mai puternic test statistic. Pentru că eşantionul cel mai mare este cel care are efectele cele mai pozitive în privinţa puterii testelor, nu este greşit să folosim cea mai mare mărime posibilă atunci când dispunem de resurse adecvate. In anumite cazuri această strategie poate avea un efect important, făcând un test neparametric aproximativ la fel de puternic ca unul parametric.
6.5. Căpătarea deprinderilor de folosire a testelor statistice Deoarece atât de multe teste statistice sunt disponibile nu putem să le cunoaştem în întregime pe toate. De fapt, probabil mai puţin de o duzină de teste sunt utilizate în mod obişnuit în cercetarea de asistenţă socială; altele sunt rar întâlnite în literatura de specialitate, şi un al treilea grup include un număr mare de teste care sunt necunoscute. În plus, noi teste sunt create cu ajutorul calculatorului, în timp ce altele devin la modă pentru un timp, iar apoi sunt abandonate. Următoarele trei capitole sunt concentrate doar pe trei teste statistice. Ele sunt teste care sunt acceptate de mulţi ani şi promit să rămână acceptate datorită potrivirii lor pentru analiza datelor în cercetarea de asistenţă socială. Accentul va fi pus pe înţelegerea modului în care testele statistice îşi îndeplinesc menirea. Convingerea noastră este că înţelegerea factorilor ce influenţează alegerea unui test, aşa cum au fost discutate în acest capitol, şi principiile generale ale testării explicate în capitolul precedent şi dezvoltate în capitolele următoare vor pregăti cititorul să facă alegerea testului statistic adecvat.
6.6. Rezumat Acest capitol a accentuat importanţa selectării cu grijă a testului statistic folosit în analiza datelor. El a prezentat factorii majori avuţi în vedere în alegerea celui mai potrivit test pentru o situaţie dată. Din cele discutate, am observat că cea mai potrivită selecţie a unui test statistic este absolut necesară pentru credibilitatea studiului de cercetare şi că acesta va avea o mare influenţă asupra probabilităţii ca rezultatele cercetarii să fie utile profesioniştilor din asistenţă socială.
6.7. Întrebări pentru studiu 1. Cum poate folosirea unui test statistic să discrediteze credibilitatea cercetării?
50
2. Cum poate un cercetător să folosească un test necorespunzător care în final are un efect negativ în servirea clienţiilor? 3. Cum poate câteodată “regula obişnuinţei” să conducă la selecţia unui test statistic necorespunzător ? 4. La ce ne referim când spunem că un test statistic este mai “puternic” decât altul? 5. Ce factori legaţi de metodele de eşantionare utilizate ajută la determinarea testului statistic corespunzător? 6. Care sunt celelalte două caracteristici ale datelor care contribuie la alegerea testului statistic potrivit? 7. Cum poate operaţionalizarea unei variabile, realizată chiar înainte ca informaţiile să fie colectate, să limiteze sau extindă numărul de opţiuni de teste statistice care ar putea fi utilizate? 8. Care sunt cele trei criterii care trebuiesc îndeplinite pentru ca un test parametric să poată fi utilizat? 9. De ce sunt testele neparametrice folositoare, în particular în multe proiecte de cercetare în asistenţă socială? 10. Cum putem creşte puterea, când trebuie să folosim teste neparametrice?
51
Capitolul 7. Asocierea Nici o analiză statistică nu este mai bine cunoscută şi mai frecvent folosită greşit, decât asocierea - referită uzual prin hi-pătrat. Popularitatea lui derivă în principal din doi factori. În primul rând, mulţi dintre cei care au studiat statistica ca parte a programului de formare profesională pentru asistenţă socială, şi-au petrecut câtva timp studiind acest test statistic. A fost un fel de lanţ intergeneraţional de învăţare pentru formatorii din asistenţa socială (care sunt mai familiarizaţi cu acest tip de analiză decât cu altele) şi care au tendinţa să sugereze folosirea acestuia studenţilor, care la rândul lor îl recomandă altora. Analiza tabelelor de asociere apare destul de frecvent în literatura de specialitate aşa că ne aşteptam să le vedem folosite în articolele din jurnalele cu orientare statistică. Faptul că cunoaşterea tabelelor de asociere este atât de răspândită facilitează definitiv comunicarea rezultatelor din munca de asistenţă socială, unde practicienii citesc jurnale mai puţin orientate statistic, care ar putea utiliza şi alte procedee statistice mai puţin răspândite. Procedurile statistice înţelese de multă lume sunt avantajoase atunci când încercăm să comunicăm cunoştinţe din practica asistenţei sociale. Totuşi, şi asocierea, ca şi toate celelalte analize statistice, sunt destinate a fi folosite cu un anumit tip de date şi în anumite situaţii de cercetare specifice. Cercetătorul sau practicianul de asistenţă socială care nu cunoaşte condiţiile specifice necesare utilizării lor, riscă să facă o gravă eroare care poate avea în final un impact negativ chiar asupra practicii de asistenţă socială. De asemenea, popularitatea asocierii poate fi un pericol potenţial . Credinţa în ele şi larga lor răspândire printre cercetători şi practicieni, constituie principalele consecinţele negative ale folosirii lor greşite. Un al doilea factor explicativ al popularităţii asocierii provine direct din condiţiile necesare utilizării: ele necesită informaţii doar de nivel nominal. Faptul că doar nivelul nominal este cerut pentru variabile, face ca asocierea să fie bine văzută de un număr mare de cercetători de asistenţă socială. Asocierea cere ca valorile unei variabile să reprezinte categorii distincte şi să existe doar diferenţe de clasă. Ar trebui să fie evident de acum încolo, că dacă examinăm legaturile dintre variabile de nivel ordinar şi interval, sunt necesare alte teste, în general mai puternice. Asistenţii sociali sunt adesea interesaţi în a căuta legături între variabile ca eficienţa tratamentului (succes/eşec) şi alte variabile de nivel nominal cum ar fi tipul de tratament (de grup/individual). Este destul de dificil de spus cu certitudine dacă succesul clientului (îmbunătăţire/neînbunătăţire) s-a petrecut, şi fără a încerca să se determine cantitatea exactă de succes. Similar, putem uşor afla dacă o parte specifică a legislaţiei sociale a fost adoptată în diferite state (ale S.U.A.). Dar probabil că nu vom avea de gând să măsurăm cantitatea de implicare a grupurilor de avocaţi în adoptarea acestor legi - ci doar dacă au fost active sau nu. În practica de asistenţă socială şi în situaţiile de cercetare, multe dintre variabile au valori de tipul “da-nu” sau alte categorii de valori ce pot fi considerate a fi numai de nivel nominal. Pentru că procedeul căutării asocierilor este cel mai potrivit pentru cazurile când ambele variabilele din studiu sunt de nivel nominal, el va fi adesea legitim a fi utilizat în analiza datelor din proiectele noastre.
52
7.1. Ce caută să determine asocierea Aşa cum am discutat într-un capitol anterior, toate testele statistice încearcă să elimine şansa ca explicaţie pentru o legătură aparentă între două sau mai multe variabile. Cu asocierea, spectrul şansei are anumite caracteristici. Dacă spre exemplu, am cauta să găsim o legătură între o variabila dependentă ca succesul tratamentului clientului (succes/eşec) şi o variabilă independentă asemenea tipului de tratament (de grup/individual) pentru urmarirea evaluarii unui program de consiliere în privinţa alcoolului, şansa ar putea juca rolul scepticului. Ipoteza nulă spune că nu există nici o legătură între cele două variabile: dacă clienţii s-au abţinut de la alcool pentru o perioadă de timp (succes) sau nu s-au abţinut (eşec) şi dacă au primit tratamentul de grup sau individual. Ocazional poate apărea că acei clienţi care s-au abţinut au fost în general cei care au primit tratamentul individual sau vice versa. Totuşi în concordanţă cu ipoteza nulă, această aparentă legătură dintre cele dintre două variabile poate fi explicată şi de variaţiile normale ale caracteristicilor întâlnite în eşantionul mic pe care s-a lucrat (faţă de populaţia tuturor alcoolicilor). Ar putea fi doar rezultatul erorii de eşantionare. Ipoteza nulă trebuie să susţină că nu exista o legătură reală între două variabile dintr-o populaţie. Putem pretinde existenţa unei legături reale între două variabile doar dacă putem demonstra că legătura observată dintre ele este improbabil să se fi întâmplat doar pe baza şansei, şi deci orice persoană rezonabilă va elimina întâmplarea (şi fireşte factorii deformare şi alte variabile) ca explicaţie improbabilă. Asocierea încearcă să determine dacă există o legătură adevărată între două variabile, examinând în ce măsură valorile specifice unei variabile sunt asociate cu valorile specifice ale celei de a doua variabile, într-un grad de probabilitate suficient de mare ca aceasta să nu fie doar efectul erorii de eşantionare. Când folosim asocierea nu suntem atât de ambiţioşi ca să sugerăm că o variabilă poate fi cauza variaţiei celeilalte variabile. Putem doar afirma, în cel mai bun caz, că există un anumit tip de legătură (patern). Asocierile sunt folosite când dorim să ştiim când aceste legături sunt suficient de puternice şi consistente pentru a elimina şansa (întâmplarea) ca o explicaţie a legăturii observate. Analiza asocierii este una dintre cele mai simple căi pentru a determina dacă există o legătură adevărată între două variabile. Exemplul care urmează ilustrează modul cum asocierea este folosită în examinarea eficacităţii relative a tratamentului de grup faţă de tratamentul individual cu clienţii care au fost trataţi pentru alcoolism la un centru particular de tratament. Pentru a face aceasta, un grup de clienţi care au primit tratamentul în grup sunt comparaţii direct cu un grup de clienţi care au primit tratamentul îndividual.
7.2. Logica tabelelor de asociere Pentru a înţelege procedeul asocierii este util să începem cu un tabel care este asemănător Tabelului 7.1 sau Tabelului 7.2 . Tabelele au multe nume: tabele de asociere, tabele hi-pătrat sau tabele de contingenţă. În continuare ne vom referi la ele ca tabele de asociere. În ultima coloană din dreapta Tabelului 7.1 şi Tabelului 7.2, sunt totalurile (frecvenţele) pentru fiecare rând introdus. Totalurile pe coloane sunt introduse în linia de jos. Aceste totaluri de pe rânduri şi coloane sunt denumite totaluri marginale. Ele indică numărul total de cazuri care au fost observate având o anumită valoare pentru una din variabilele - aceste sunt: tratament în grup, tratament individual, succes sau eşec. Totalul general, numărul total de cazuri (N), este introdus
53
în colţul din dreapta-jos. Suma totalurilor de pe ultima coloana şi de pe ultimul rând sunt egale, şi egale cu numărul total de cazuri. Tabelul 7.1 Tipul de tratament după succesul clientului Succes? Tip de tratament Da Nu Tratament în grup a b Tratament individual c d Total a+c b+d
Total a+b c+d N
Aşa cum se vede, Tabelul 7.1 conţine două variabile dihotomice (cu două categorii), tipul de tratament şi succesul clientului. Clienţii diferă după tipul de tratament pe care l-au primit (variabila independentă) şi pot varia datorită succesului (variabila dependentă). Este, desigur, posibil a avea variabile cu mai mult de două categorii. Tabelul de asociere va avea atunci mai multe rânduri şi coloane şi firesc mai multe celule. Tabelul 7.1 identifică diferitele celule în exemplul nostru cu a, b, c şi d. Categoriile variabilelor din tabelul de asociere pot fi puse în orice ordine deoarece ele sunt de nivel nominal; neexistând o ordonare după rang sau alte diferenţe cantitative. Matematic este posibil să folosim analiza tabelelor de asociere cu variabile de nivel ordinar, interval sau raport. Totuşi folosind tabelele de asociere cu variabile de nivel ordinal sau interval, acestea nu vor putea profita de avantajele pe care le oferă precizia de măsurare a acestor variabile. Valorile, în aceste cazuri, sunt tratate fără să se ţină cont de diferenţele cantitative pe care le reflectă, ca şi cum ele ar reprezenta doar diferenţe calitative. Tabelele de asociere prezintă deobicei frecvenţele pentru o variabilă independentă şi pentru una dependentă. În acest capitol, în toate tabelele, variabila dependentă va fi dispusă pe coloane, iar variabila independentă va fi dispusă pe linii. Aceasta nu reprezintă o lege, de aceea unele studii folosesc aşezarea inversă. De fapt în orice studiu de cercetare, în momentul calculului indicatorului de asociere este “orb” în ceea ce priveşte care dintre variabile este cea independentă sau cea dependentă. Asocierea examinează numai dacă există legaturi între cele două variabile. Sunt situaţii când nici una dintre variabile nu este clar dependentă sau independentă. Ele sunt doar două variabile, a căror legătură dorim să o studiem. Indicatorul hi-pătrat este deasemenea potrivit pentru acest tip de situaţii. Frecvenţe observate Tabelul 7.2 prezintă rezultatele actuale, sau observate, rezultate din studiul nostru ipotetic asupra celor două metode de tratament. Datele din cele patru celule ale Tabelului 7.2 reprezintă numărul observat de clienţi care au realizat fiecare combinaţie de valori corespunzătoare pentru cele două variabile. Putem observa că au existat în total 100 de clienţi (N), dintre care 60 au primit tratamentul în grup (a+b) şi 40 au primit tratamentul individual (c+d). Cincizeci şi cinci au avut succes în timp ce 45 au avut insucces. În plus, printre cei 60 care au primit tratamentul în grup, 40 de clienţi au avut succes (celula a) şi 20 de clienţi au avut insucces (celula b). Printre clienţii ce au primit tratamentul individual, 15 au fost consideraţi ca având succes (celula c) şi 25 ca având insucces (celula d). Tabel 7.2 Frecvenţe observate a tipului de tratament dupa succesul clientului Succes? Tip de tratament Da Nu Total
54
Tratament în grup Tratament individual Total
40 15 55
20 25 45
60 40 100
În exemplul nostru avem nevoie să comparăm clienţii care au primit tratamentul în grup cu aceia care au primit tratamentul individual, în ceea ce priveşte rezultatele lor. O astfel de comparaţie este relativ greu de observat în Tabelul 7.2 pentru că cele două tipuri de tratament au numere diferite de clienţi (60 şi 40). Evident că cei 40 de clienţi care au avut ca rezultat succesul cu tratamentul în grup (celula a), nu-i putem compara direct cu cei 15 clienţi care au avut ca rezultat succesul, dar pe baza tratamentului individual (celula c) şi astfel nu putem concluziona că tratamentul în grup este cea mai bună metodă de tratament doar pentru ca cifra 40 este mai mare decât 15. În ciuda diferenţei dintre numarul de cazuri în cele două grupuri, este posibil să facem o încercare de comparare între cele două tipuri de tratament, prin calcularea procentelor. De exemplu, putem afla ce procentaj reprezintă 40 de clienţi din 60 de clienţi şi ce procentaj reprezintă 15 clienţi din 40 de clienţi. Tabelul 7.3 este un tabel de asociere cu procentaje pentru datele observate în Tabelul 7.2. El arată că 66,7 procente ale clienţilor care au primit tratamentul în grup au avut ca rezultat succesul, comparativ cu 37,5 procente ale acelor clienţi care au primit tratamentul individual. Variabilele tipul de tratament primit şi succesul clienţilor ar putea fi deci legate. Dacă procentajele (celula a şi celula c) ar fi identice, cele două variabile în mod sigur nu ar fi legate. Acum la acest punct, este încă dificil să ştim dacă aparenta legătură nu este doar o fluctuaţie a şansei. Deşi cele două variabile par să fie întrucâtva legate, totuşi s-ar putea spune că ele “nu sunt prea mult legate”. Argumentul ar consta în faptul că 29,2 procente diferenţă (66,7 procente - 37,5 procente = 29,2 procente) nu este foarte mult şi s-ar putea ca faptul de a fi legate este doar un rezultat al erorii de eşantionare. Aşa să fie? Multe dintre raţionamentele statistice sunt preocupate să ne ajute să decidem cât de mare diferenţă este necesară pentru a elimina şansa ca explicaţie posibilă al unei legături aparente între variabile. Tabel 7.3 Procente observate a tipului de tratament dupa succesul clientului (din tabelul 7.2) Succes? Tip de tratament Da Nu Total Tratament în grup 66.7 33.3 100.0 Tratament individual 37.5 62.5 100.0 Tratament în grup = Celula a: 40 / 60 = 66.7% Celula b: 20 / 60 = 33.3% 100% Tratament individual = Celula c: 15 / 40 = 37.5% = Celula d: 25 / 40 = 62.5% 100% Frecvenţele aşteptate Cât de mare ar trebui să fie diferenţa între procente pentru ca şansa să fie o explicaţie improbabilă ? Putem răspunde la această întrebare prin concentrarea asupra cât de mult diferă frecvenţele observate faţă de acele frecvenţe pe care noi ne aşteptăm să le găsim mai frecvent, dacă ipoteza nulă ar fi adevărată - acestea sunt frecvenţele aşteptate. 55
Să ne întoarcem la Tabelul 7.2 şi să ne concentrăm doar asupra frecvenţelor marginale. Din totalul de 100 de clienţi, 55 sau 55 % au avut ca rezultat succesul. Dacă tipul de tratament nu este legat de succesul clientului, ar trebui să ne aşteptăm la aproximativ 55 de procente din totalul clienţilor să aibe succes, indiferent de tipul de tratament aplicat. Deşi rezultatele dintr-un eşantion particular nu vor ieşi exact în acest mod, foarte adesea, într-un număr mare de eşantioane dintr-o populaţie în care ipoteza nulă este adevărată (variabilele în mod sigur sunt nelegate), vom găsi “rezultatul mediu” al tuturor eşantioanelor; adică proporţia medie de aproximativ de 55 %. Putem construi un tabel al frecvenţelor aşteptate presupunând că ipoteza nulă ar fi adevărată; asemănător Tabelului 7.4 . Pentru a calcula frecvenţa aşteptată dintr-o celulă, se ia totalul pe coloană, se înmulţeşte cu totalul de pe linie pentru acea celulă şi după aceea se împarte rezultatul la numărul total de cazuri (N). Adică: E=
(R) (C) (N)
unde: E = Frecvenţa aşteptată într-o celulă particulară R = Totalul pe linia celulei C = Totalul pe coloană celulei N = Numărul total al cazurilor Înlocuind valorile vom găsi: celula a:
E = (60) (55) 100 celula b: E = (60) (45) 100 celula c: E = (40) (55) 100 celula d: E = (40) (45) 100 Totalul frecvenţelor aşteptate = 100
= 33 = 27 = 22 = 18
Tabelul 7.4 Frecvenţe şi procentaje aşteptate pentru tipul de tratament după succesul clienţilor Succes? Tip de tratament Da Tratament în grup 33 (55%) Tratament individual 22 (55%) Total 55
56
Nu 27 (45%) 18 (45%) 45
Total 60 (100%) 40 (100%) 100
Tabelul 7.5 Diferenţa dintre frecvenţele observate şi cele aşteptate pentru tipul de tratament după succesul clienţilor (din Tabelele 7.2 şi 7.4) Observate -Aşteptate = Diferenţe Celule (Tabelul 7.2) -(Tabelul 7.4) = (Tabelul 7.5) Celula a 40 33 = +7 Celula b 20 27 = -7 Celula c 15 22 = -7 Celula d 25 18 = +7 Total 100 100 = 0 Succes? Tip de tratament Da Nu Total Tratament în grup +7 -7 0 Tratament individual -7 +7 0 Total 0 0 0 Diferenţa dintre frecvenţele observate şi frecvenţele aşteptate Tabelul pentru frecvenţele obsevate este acum comparat cu tabelul frecvenţelor aşteptate. Aceasta înseamnă ca vom examina mai îndeaproape diferenţele dintre frecvenţele observate (Tabelul 7.3) şi frecvenţele aşteptate (Tabelul 7.4) pentru fiecare celulă. Tabelul 7.5 prezintă diferenţele matematice între frecvenţele observate şi frecvenţele aşteptate din exemplul nostru. Indicatorul statistic hi-pătrat Ar fi nevoie acum de un fel de rezumat al diferenţelor prezentate în Tabelul 7.5. Simpla adunare a diferenţelor pentru toate celulele nu este bună pentru că va fi întotdeauna zero. Un rezumat mai bun este furnizat prin ridicarea la pătrat a diferenţelor din fiecare celulă, împărţirea acestor pătrate la valoarea aşteptată pentru fiecare celulă şi adunarea rezultatelor pentru toate celulele. Numărul care rezultă este numit valoarea hi-pătrat, reprezentat de litera din alfabetul grec, hi cu semnul ridicării la pătrat. Putem exprima aceasta cu formula: 2
=
2
(O - E)
E unde: 2= Valoarea hi-patrat O = Frecvenţa observată E = Frecvenţa aşteptată = Suma (tuturor celulelor) Înlocuind literele prin valori găsim: 2= (40-33)2 33
+ (20-27) 2 + (15-22) 2 + (25-18) 2 27 22 18
(+7) 2 + (-7) 2 + (-7) 2 + (+7) 2 33 27 22 18 = (49) / 33 + (49) / 27 + (49) / 22 + (49) / 18 = 1,5 + 1,8 + 2,2 + 2,7 = 8,2 (valoarea lui hi-pătrat) =
Dacă sunt doar patru celule, aşa cum este cazul în exemplul nostru, trebuie să mai scădem 0,5 din diferenţa dintre frecvenţele observate şi cele aşteptate pentru fiecare celulă înainte de ridicarea la pătrat (acesta este Factorul de corecţie al lui
57
Yates). Dar de dragul simplificării şi pentru a prezenta formula obişnuită, exemplul nostru nu a mai efectuat această scădere. Grade de libertate Înainte să putem utiliza un tabel de asociere pentru calculul lui hi-pătrat, pentru a determina dacă există o asociere statistic semnificativă între cele două variabile, avem nevoie să înţelegem conceptul de grade de libertate. Probabilitatea obţinerii unei valori hi-pătrat mari este afectată de mărimea tabelului de asociere pe baza căruia este calculat. Mărimea aici se referă la numărul de coloane şi de linii (adică numărul total de celule) din tabel. Cu cât tabelul este mai mare, cu atât este mai probabil să avem o valoare mai mare al lui hi-pătrat. Aceasta reiese evident din faptul că valoarea hi-pătrat este suma cifrelor derivate din fiecare dintre celule. Cu cât sunt mai multe celulele într-un tabel cu atât vor fi mai multe cifre care adunate vor creşte valoarea lui hi-pătrat. Fiecare valoare hi-pătrat trebuie să fie evaluată ţinând cont de dimensiunea tabelului, exprimată în termeni de grade de libertate. Numărul de grade de libertate pentru un tabel de asociere este egal cu numarul de linii minus unu, înmulţit cu numărul de coloanelor minus unu. Putem scrie această formulă astfel: df = (r-1) (c-1) unde: df = grade de libertate r = numărul de linii c = numărul de coloane Înlocuind literele cu valorile din exemplul nostru, găsim: df = (2-1) (2-1) = (1) (1) = 1 (grade de libertate) Întradevăr, Tabelul 7.2 are gradul unu de libertate, aşa cum au toate tabelele formate din doua linii şi două coloane. Determinarea probabilităţii Pentru a determina dacă valoarea lui hi-pătrat pentru un tabel de asociere dat sugerează sau nu o asociere statistic semnificativă între variabile, trebuie să găsim în primul rând linia care corespunde gradelor de libertate al tabelului de asociere în Tabelul 7.6. Cele şase valori în fiecare din liniile Tabelului 7.6 sunt valori hi-pătrat care au probabilitatea indicată în capul de tabel al coloanelor respective. Vom citi în dreptul liniei pentru a găsi unde cade valoarea noastră hi-pătrat. Dacă numărul exact nu apare, vom considera numărul din stânga locului unde ar cădea valoarea lui hipătrat. După aceea ne vom deplasa la vârful coloanei şivom găsi probabilitatea asociată lui.
58
Tabelul 7.6 Valori critice pentru hi-pătrat
df 1 2 3 4 5
Nivel de semnificaţie pentru un test direcţional .10 .05 .025 .01 Nivel de semnificaţie pentru un test nedirecţioal .20 .10 .05 .02 1.64 2.71 3.84 5.41 3.22 4.60 5.99 7.82 4.64 6.25 7.82 9.84 5.99 7.78 9.49 11.67 7.29 9.24 11.07 13.39
.01 6.64 9.21 11.34 13.28 15.09
.001 10.83 13.82 16.27 18.46 20.52
6 7 8 9 10
8.56 9.80 11.03 12.24 13.44
10.64 12.02 13.36 14.68 15.99
12.59 14.07 15.51 16.92 18.31
15.03 16.62 18.17 19.68 21.16
16.81 18.48 20.09 21.67 23.21
22.46 24.32 26.12 27.88 29.59
11 12 13 14 15
14.63 15.81 16.98 18.15 19.31
17.28 18.55 19.81 21.06 22.31
19.68 21.03 22.36 23.68 25.00
22.62 24.05 25.47 26.87 28.26
24.72 26.22 27.69 29.14 30.58
31.26 32.91 34.53 36.12 37.70
16 17 18 19 20
20.46 21.62 22.76 23.90 25.04
23.54 24.77 25.99 27.20 28.41
26.30 27.59 28.87 30.14 31.41
29.63 31.00 32.35 33.69 35.02
32.00 33.41 34.80 36.19 37.57
39.29 40.75 42.31 43.82 45.32
21 22 23 24 25
26.17 27.30 28.43 29.55 30.68
29.62 30.81 32.01 33.20 34.38
32.67 33.92 35.17 36.42 37.65
36.34 37.66 38.97 40.27 41.57
38.93 40.29 41.64 42.98 44.31
46.80 48.27 49.73 51.18 52.62
26 26 27 28 29 30
31.80 31.80 32.91 34.03 35.14 36.25
35.56 35.56 36.74 37.92 39.09 40.26
38.88 38.88 40.11 41.34 42.69 43.77
42.86 42.86 44.14 45.42 46.69 47.96
45.64 45.64 46.96 48.28 49.59 50.89
54.05 54.05 55.48 56.89 58.30 59.70
32 34 36 38 40
38.47 40.68 42.88 45.08 47.27
42.59 44.90 47.21 49.51 51.81
46.19 48.60 51.00 53.38 55.76
50.49 53.00 55.49 57.97 60.44
53.49 56.06 58.62 61.16 63.69
62.49 65.25 67.99 70.70 73.40
44 48 52 56 60
51.64 55.99 60.33 64.66 68.97
56.37 60.91 65.42 69.92 74.40
60.48 65.17 69.83 74.47 79.08
65.34 70.20 75.02 79.82 84.58
68.71 73.68 78.62 83.51 88.38
78.75 84.04 89.27 94.46 99.61
.005
.0005
Valoarea hi2 este semnificativă dacă ea este mai mare sau egală cu valoarea listată în tabel
59
Dacă, de exemplu, fixăm nivelul de probabilitate la 0,05, vom şti că dacă respingem ipoteza nulă, probabilitatea statistică de a comite o eroare de tipul I este mai puţin decât 5 din 100. În exemplul nostru, valoarea obţinută pentru hi-pătrat este de 8,2, cu un grad de libertate. Luăm valoarea lui hi-pătrat de 8,2 şi găsim cele două valori din prima linie din Tabelul 7.6 între care se găseşte această valoare. Valoarea noastră hi-pătrat, 8,2 , este localizată între valorile 6,64 şi 10,83 . Astfel, dacă ipoteza noastră a fost direcţională (sau one-tailed în tabel), adică “clienţii care primesc tratamentul în grup au o rată statistic semnificativă mai înaltă de succes decât clienţii care primesc tratamentul individual”, putem spune că dacă respingem ipoteza nulă, există o probabilitate de doar 0,005 de a face o eroare de tipul I (doar 5 dintr-o mie). Pe scurt, ipoteza noastră direcţională poate fi considerată ca având suport statistic, deoarece 0,005 este mult mai mic decât convenţionalul 0,05. Pe de altă parte, dacă ipoteza noastră ar fi fost nedirecţională, putem încă considera că avem suport statistic pentru ea, pentru că probabilitatea corespunzătoare este tot mai mică decât 0,01, care este mai mică decât convenţionalul 0,05 . Să ţinem minte că trebuie să folosim valoarea din stânga valorii calculate a lui hi-pătrat pentru a determina corect nivelul probabilităţii. De exemplu, avem nevoie să găsim o valoare chi-pătrat la cel puţin 2,71, cu un grad de libertate, pentru ca o ipoteză direcţională să fie susţinută la un nivel obişnuit de semnificaţie de 0,05. Prezentarea rezultatelor unei analize de asociere Prezentarea rezultatelor noastre obţinute în urma unei analize de asociere, este relativ simplă. În primul rând, vom prezenta tabelul de asociere cu frecvenţele observate, după aceea plasăm valoarea hi-pătrat (2), gradele de libertate (df), şi probabilitatea (p) asociată valorii noastre 2 ca rezultatul să se datoreze întâmplării, la sfârşitul tabelului. Aceste trei elemente de informaţie vor fi scrise astfel: 2 = 8,2, df = 1 ; p < 0,005 Tabelele 7.7; 7.8; 7.11 şi 7.12 sunt exemple de prezentare a analizei de asociere.
7.3. Când să nu utilizăm asocierea Analiza hi-pătrat poate să ne fie foarte folositoare. Totuşi, ea poate fi greşit înţeleasă. Probabilitatea indicată poate să nu fie prea adecvată în cazul în care frecvenţele aşteptate din câteva celule ale tabelului de asociere sunt mici. Există două situaţii în care procedeul tabelelor de asociere nu poate fi folosit: 1. Când într-un tabel cu două linii şi două coloane (patru celule), una sau mai multe celule au valoarea aşteptată mai scăzută decât 5. 2. Când într-un tabel cu mai mult decât două linii şi două coloane, există mai mult de 20% din celule care au valori aşteptate mai mici decât 5. 3. Când într-un tabel cu mai mult decât două linii şi două coloane, există celule cu fredcveţe nule (0). O verificare rapidă dacă sunt probleme cu valorile aşteptate prea mici, într-un tabel de asociere poate fi realizată prin localizarea celulei cu valoarea aşteptată cea mai mică. Pentru a face aceasta, se localizează linia şi coloana cu cele mai mici totaluri. Celula cu cea mai mică valoare se află la intersecţia liniei şi coloanei localizate. După aceea valoarea aşteptată a celulei este determinată cu formula (R) (C)
60
/ (N). Dacă frecvenţa aşteptată este 5 sau mai mult, este permisă folosirea analizei tabelului de asociere. Dacă ea este mai mică decât 5 poate fi necesar să combinăm anumite celulele între ele (numită grupare) astfel încât criteriul pentru folosirea lui hipătrat se poată fi îndeplinit; sau se poate folosi un alt test statistic (vezi ultimul capitol). Desigur un tabel 2 x 2 (două linii şi două coloane) nu poate fi grupat. Volumul eşantionului În general, cu cât avem un eşantion mai mare, cu atât avem mai multe şanse să respingem ipoteza nulă. Cu cât este mai mare dimensiunea eşantionului cu atât este mai puternic testul. (Acesta este valabil pentru orice test statistic) De fapt, cu un eşantion foarte mare este extrem de probabil ca ipoteza nulă să fie respinsă chiar dacă diferenţa absolută dintre frecvenţele aşteptate şi cele observate din fiecare celulă este suficient de mică. Când oamenii interpretează un tabel de asociere, sunt adesea induşi în eroare de valoarea lui hi-pătrat şi de nivelul de probabilitate rezultat; mai ales dacă nu urmăresc cu atenţie volumul eşantionului (N). Trebuie întotdeauna să avem în minte că o valoare hi-pătrat şi nivelul de probabilitate sunt legate direct de dimensiunea eşantionului pe baza căruia sunt calculate. Cele prezentate anterior pot părea greu de înţeles, dar un acelaşi tabel de asociere poate prezenta o legătură statistică importantă între două variabile (via indicatorul statistic hi-pătrat) sau - credeţi sau nu - el poate descrie o legătură slabă, dar statistic semnificativă. Pe scurt, putem aproape întotdeauna avea o valoare hipătrat statistic semnificativă - interesând mai puţin magnitudinea legăturilor dintre două variabile - dacă eşantionul este suficient de mare. Astfel trebuie întotdeauna să privim la ceea ce înseamnă legătura - nu doar nivelul de semnificaţie statistică (p) al valorii hi-pătrat. Aceasta este legată de discuţia noastră din Capitolul 7 în care am făcut distincţie între: (1) legături statistic semnificative între sau dintre variabile şi (2) rezultate substanţiale. Tabelul 7.7 Frecvenţe şi procentaje observate pentru tipul de tratament după succesul clienţilor (N = 200) Succes? Tip de tratament Da Nu Număr Procent Număr Procent Procent Tratament în grup 30 60.0% 20 40.0% 100% Tratament individual 80 53.3% 70 46.7% 100% Total 110 90 2 = 0,672, df = 1 ; p > 0,20 (fără predicţia direcţiei)
Total Număr 50 150 200
O continuare a exemplului nostru va clarifica cele afirmate. Să presupunem ca într-un alt studiu, 200 de clienţi au primit tratament în cadrul programului de tratare al alcoolicilor. Rezultatul studiului poate fi asemenea celui prezentat în Tabelul 7.7. Aşa cum poate fi observat din acest tabel, p este mai mare decât 0,20 doar dacă direcţia legăturii nu a fost precizată şi mai mare decât 0,10 ; dacă s-a specificat direcţia în prealabil (vezi Tabelul 7.6). Cu alte cuvinte, noi am putea să nu avem suport statistic suficient la nivelul 0,05 pentru a fi capabili să respingem ipoteza nulă. Acum să presupunem că avem nu doar 200 de clienţi, aşa ca în Tabelul 7.7 ci de zece ori mai mulţi - 2000, iar proporţia celor 2000 clienţi în toate celulele este
61
exact acelaşi ca şi în cazul eşantionului anterior, prezentat în Tabelul 7.7. Rezultatele se găsesc în Tabelul 7.8. O privire atentă asupra Tabelelor 7.7 şi 7.8 va arăta că frecvenţele observate în ambele tabele sunt absolut proporţionale una faţă de cealaltă, dar diferenţa între valorile fiecărui hi-pătrat şi nivelele de probabilitate este foarte mare. Frecvenţele observate în Tabelul 7.7 nu sunt statistic semnificative, în timp ce frecvenţele observate în Tabelul 7.8 sunt statistic semnificative (la nivelul 0,01 pentru o ipoteză nedirecţională şi la nivelul 0,005 pentru o ipoteză direcţională). Dacă am fi folosit 20000 clienţi valoarea hi-pătrat ar fi fost de 67,2; dacă am fi folosit 200000 clienţi, hipătrat ar fi devenit 672 şi aşa mai departe. Şi totuşi cele două tabele 7.7 şi 7.8 sunt aproape identice, singurul lucru care le diferenţiază este numarul de cazuri pe care leam folosit pentru calcularea celor două mărimi hi-pătrat. Tabelul 7.8 Frecvenţe şi procentaje observate pentru tipul de tratament după succesul clienţilor (N = 2000) Succes? Tip de tratament Da Nu Număr Procent Număr Procent Procent Tratament în grup 300 60.0% 200 40.0% 100% Tratament individual 800 53.3% 700 46.7% 100% Total 1100 900 2 = 6,72, df = 1 ; p < 0,01 (fără predicţia direcţiei)
Total Număr 500 1500 2000
7.4. Asocierea cu trei sau mai multe variabile De obicei ne concentrăm atenţia mai întâi pe legăturile dintre două variabile. Totuşi trebuie să avem în vedere că o a treia variabilă poate, într-un anumit fel, “explica ” legătura aparentă. În exemplul pe care-l vom folosi, începem în primul rând cu legătura dintre cele două variabile, tipul de tratament şi succesul clientului. Este posibil ca o a treia variabilă; nivelul motivaţiei clientului înaintea intrării la tratament, care nu a fost controlată metodologic şi să poate explica aparenta legătură între variabila dependentă şi cea îndependentă. Va trebui să o reverificăm pentru a avea o imagine mai bună asupra legăturii adevărate dintre tipul de tratament şi succes. A treia variabilă, motivaţia clientului, se numeşte variabilă de control. O modalitate de explorare a efectului celei de-a treia variabile este de a împărţii clienţii noştri după categoriile celei de-a treia variabile şi de a examina legătura dintre variabilele principale, controlându-le astfel prin prisma celei de-a treia variabilă. În exemplu nostru putem împărţi eşantionul în două subcategorii: cu motivaţie înaltă pentru tratament şi cu motivaţie scăzută pentru tratament. Putem după aceeia construi două tabele separate, pentru a urmări legătura dintre cele două variabile: tipul de tratament şi succesul clientului. Rezultatul poate apărea ca în Tabelul 7.9 (motivaţie înaltă pentru tratament) şi Tabelul 7.10 (motivaţie scăzută pentru tratament). Legătura dintre tipul de tratament şi rezultatul clientului aproape că a dispărut, aşa cum putem vedea examinând diferenţele dintre frecvenţele observate şi cele aşteptate în celulele respective (ele sunt aproape zero). Astfel, controlând motivaţia clienţilor pentru tratament, legătura aparentă dintre variabilele dependente şi
62
independente aproape că a dispărut. Este foarte probabil ca legătura aparentă dintre variabila dependentă şi cea independentă să nu fi fost una reală. Legătura iniţială nu dispare întotdeauna când o controlăm printr-o a treia variabilă. Fireşte poate rămâne în esenţă aceiaşi cu toate valorile celei de-a treia variabile. În astfel de cazuri vom putea concluziona că cea de a treia variabilă nu joacă un rol important în explicarea legăturii iniţiale. Legătura poate fi mai scăzută chiar dacă nu dispare. În acest caz, a treia variabilă poate explica doar o parte, nu totul, dintr-o legătura iniţială. Intensitatea legăturii poate să crească când o a treia variabilă este verificată. În asemenea situaţii, cea de-a treia variabilă este probabil variabila înabuşită (se mai numeşte şi variabilă latentă) aceasta ascunzând gradul real al asocierii dintre variabila dependentă şi cea independentă. Tabelul 7.9 Frecvenţe şi procentaje observate pentru tipul de tratament după succesul clienţilor cu o motivaţie înaltă (N = 70) Succes? Tip de tratament Da Nu Total Număr Procent Număr Procent Număr Procent Tratament în grup 21 52.5% 19 47.5% 40 100% Tratament individual 16 53.3% 14 46.7% 30 100% Total 37 33 70
Tabelul 7.10 Frecvenţe şi procentaje observate pentru tipul de tratament după succesul clienţilor cu o motivaţie scăzută (N = 30) Succes? Tip de tratament Da Nu Total Număr Procent Număr Procent Număr Procent Tratament în grup 11 55% 9 45% 20 100% Tratament individual 6 60% 4 40% 10 100% Total 17 13 30 Astfel putem da peste un alt rezultat când introducem o a treia variabilă, Legătura dintre primele variabile poate fi diferită pentru diferitele categorii ale variabilei de control. Acesta nu este un rezultat simplu, el este adesea unul important. Nu întodeuna este posibil să obţinem uşor rezultate rezumative; mai curând, legătura iniţială trebuie să fie descrisă pentru fiecare categorie a variabilei de control. A treia variabilă este prezentă ca să detaileze mai departe legătura dintre primele două variabile, şi se mai numeşte variabilă de control.
7.1. Exemplu din micro-practică Descrierea situaţiei care generează un studiu
Joan este un asistent social ce se ocupă cu internarea pacienţilor în spital. Ea a observat că un număr mare de pacienţi care au fost lăsaţi să trăiască cu propriile rude sunt reinternaţi în spital. Cunoscând că asistenţii sociali, colegi de a ei, care se ocupă cu planificarea externărilor trimit frecvent pacienţii externaţi la internat, ea s-a întrebat de ce a văzut atât de puţine reinternări printre acei pacienţi care au fost externaţi la internat. Ea s-a întrebat dacă nu poate fi o legătură între pacienţii care sunt reinternaţi în spital şi locul în care au fost ei externaţi (internat/la rude).
63
Ipoteza ce urmează a fi testată
Joan citeşte literatura de specialitate asupra temei ce o preocupă. Bazându-se apoi pe consensul general al altor practicieni de asistenţă socială; pe rezultatele cercetărilor anterioare şi pe propriile intuiţii şi observaţii subiective, ea porneşte la realizarea şi implementarea unei cercetări de mici proporţii care va strânge datele necesare testării unei ipoteze direcţionale. Pacienţii externaţi la internat vor avea o rată de reinternare mai scăzută faţă de pacienţii externaţi la rude, statistic semnificativă. O privire asupra metodologiei
Joan a ales o strategie simplă pentru a testa ipoteza sa direcţională. Ea a primit permisiunea supervizorilor săi să selecteze un eşantion de 10 procente din toate dosarele pacienţilor care au fost externaţi în ultimele 18 luni, alese la întâmplare. Utilizând un instrument de colectare al informaţiilor standardizat întocmit de ea, a strâns date de o mare varietate al variabilelor demografice pentru 148 de pacienţi (10% din 1480 pacienţi = 148 pacienţi) care au fost externaţi la internat şi 250 de pacienţi (10% din 2500 pacienţi = 250 pacienţi) care au fost trimişi la rude. Eşantionul total a fost de 398 pacienţi (148+250=398). Variabila dependentă în ipoteza ei a fost statutul admisiei pacienţilor (readmişi/nereadmişi). Variabila independentă a fost statutul externărilor pacienţilor (internat/rude). Rezultatele Tabelul 7.11 prezintă rezultatele la care a ajuns Joan, folosind procedeul tabelelor de asociere aşa cum sunt prezentate în acest capitol. Tabelul 7.11 Reinternarea în spital după starea externării Reinternare? Starea externării Da Nu La internat 25 123 La rude 71 179 Total 96 302 2 = 7,2 , df = 1, p < 0.005 (utilizând corecţia lui Yates)
Total 148 250 398
Interpretarea rezultatelor şi tragerea concluziilor Ce a aflat Joan din testarea ipotezei direcţionale folosind tabelul de asociere? Din cunoştiinţele sale generale despre testarea ipotezelor, ea ştia că p < 0.005, este un nivel de probabilitate impresionant. Aceasta a însemnat pentru ea că diferenţele dintre frecvenţele observate şi cele aşteptate au fost mari. Ea ştia deasemenea că dacă respinge ipoteza nulă pe baza analizei sale ea va greşi de mai puţine ori decât 5 dintr-o mie. Astfel ea a putut respinge ipoteza nulă şi să concluzioneze că există o legătură statistic semnificativă între cele două variabile. Important este că ea a avut suport statistic pentru ipoteza ei direcţională. Deasemenea Joan ştia că în analiza tabelei de asociere trebuie să privească nu numai dacă rezultatul este statistic semnificativ, dar şi dacă legătura între cele două variabile a fost în direcţia ipotezei. Asemenea altor teste statistice despre care vom discuta, tabelul de asociere nu ia în seamă direcţia pretinsă a ipotezei. Deoarece în analiza tabelului de asociere se ţine cont în primul rând de diferenţele dintre frecvenţele aşteptate şi cele observate pentru toate celulele, el va fi sensibil la relativa
64
mărime sau micime al frecvenţelor observate pentru fiecare celulă, neţinând cont de ceea a fost prevăzut. Mai trebuie să ne reamintim că o diferenţă este doar o diferenţă, chiar dacă sugerează numere mai mici sau chiar mai mari decât cele prezise. O diferenţă mare între frecvenţele observate şi cele aşteptate dintr-o celulă (în orice direcţie) contribuie mult la creşterea valorii lui hi-pătrat, care se va reflecta prin creştea probabilităţii ca ipoteza nulă să fie respinsă. Trebuie să determinăm dacă asocierea este în direcţia prezisă, privind direct celulele în care se găsesc frecvenţele observate relativ mari, sau examinând procentajele. Folosind Tabelul 7.11 Joan a fost capabilă să determine că aproximativ 17% (25 din 148) din pacienţii externaţi la internat au fost readmişi în spital, comparativ cu 28% (71 din 250) dintre aceia dirijaţi către rude. Aceste două procentaje, 17 şi 28 au fost consecvente cu direcţia ipotezei sale; pacienţii eliberaţi către internat au fost mai puţin întâlniţi ca reinternaţi faţă de pacienţii eliberaţi către rude. Înainte ca Joan să tragă orice concluzie despre “însemnătate” semnificaţei statistice dintre cele două variabile, ea a ştiut că trebuie să recunoască efectele metodologiei de cercetare pe care a folosit-o, în interpretarea rezultatelor obţinute. Ea a folosit un instrument de colectare a datelor standardizat şi structurat. Totuşi, validitatea şi siguranţa informaţiilor din fişele pacienţilor poate fi o problemă, ca şi alţi factori deformatori. Din cauza lipsei unui plan experimental, lista altor variabile (factori) care ar fi putut afecta reinternarea ar putea fi mare. Aceştia ar putea fi: diagnosticul pacientului, durata primei spitalizări, disponibilitatea serviciului de îngrijire de după externare, medicaţia folosită de pacient, şi mulţi alţi factori pe care ea nu a are motiv să creadă că au fost egal reprezentaţi în cele două grupuri de pacienţi (îngrijiţi acasă / în internat). Deci, ce îi spun rezultatele despre ipoteză? Scopul procedeului tabelelor de asociere este de a căpăta probe pentru sau împotriva existenţei unei legături între două variabile; cunoaşterea relaţiei cauză-efect nu este posibilă de la început, datorită absenţei unui plan experimental şi datorită limitelor proprii ale analizei de asociere. Ceea ce Joan a aflat este faptul că pentru diferite motive, pacienţii externaţi din spitalul ei către internate, au avut o probabilitate mai mică să fie reinternaţi faţă de aceia care au fost eliberaţi acasă. Joan nu şi-a limitat analiza asocierii doar la legătura dintre variabila independentă şi cea dependente. Ea a mai adunat date despre diagnosticul pacienţilor şi durata primei spitalizări. Ea a putut deci examina legătura dintre aceste “alte variabile” şi variabila dependentă folosind mai multe analize complexe ale tabelelor de asociere, şi alte teste statistice adecvate. Fişele pacienţilor pot conţine informaţii despre variabile suplimentare care au contribuit la luarea deciziei de externare, cum ar fi unde au locuit înainte de internare (la rude sau în internat); aceste informaţii pot fi folosite pentru a tempera rezultatele analizei sale şi pentru a lăsă să cadă mai multă lumină pe rezultatele statistice. Legarea rezultatelor de practică Date fiind toate limitările care au temperat interpretarea rezultatului găsit de Joan, poate părea la prima vedere că rezultatele sale sunt virtual nefolositoare. O asociere este o legătură prin definiţie relativ slabă; probabilitatea existenţei mai multor variabile care pot afecta variabila dependentă pot discredita utilitatea practicii de asistenţă socială sau chiar rezultatele cercetării. Chiar în ciuda unui plan de cercetare mai puţin perfect şi a folosirii unei analize de de asociere relativ puţin puternică pot apărea implicaţii în practică.
65
Contribuţia rezultatelor găsite de Joan, la corpul de cunoştinţe profesionale este relativ limitată, dar fără îndoială reală. Condiţiile legate de admitere, scoatere de sub tratament şi readmitere la spitalul lui Joan, pot diferi într-o oarecare măsură faţă de alte spitale, dar nu în totalitate, probabil vor fi mai multe asemănări decât diferenţe. Vom fi abilitaţi să generalizăm rezultatele ei mai departe de acest spital particular. Unul dintre beneficiile majore ale identificării unei legături între două variabile este acela că poate îmbunătăţi abilitatea noastră de a prevedea viitorul. Câteva implicaţii pot fi imediat folosite, bazându-ne pe rezultatele lui Joan din tabelul 7.11. Ea îcepe să se întrebe următoarele lucruri: 1. Ar trebui oare să încerc să găsesc plasamente în internate pentru mai mulţi dintre clienţii mei? 2. Ar trebui să mă străduiesc ca un asistent social profesionist să se ocupe de creerea mai multor facilităţi de internat? 3. Ar trebui să consider pacienţii care au ales să se întoarcă la rude că “riscă” să fie reinternaţi în spital? 4. Ar trebui să mă străduiesc să furnizez surse suplimentare de suport pentru pacienţii care se duc să trăiască cu rudele pentru a reduce probabilitatea lor de a fi reinternaţi? Aceste aplicaţii ale rezultatelor cercetării sunt încă doar întrebări. Nici una dintre ele nu arată că practicienii asistenţi sociali de la serviciul de externare ar trebui pregătiţi să facă modificări drastice în metodele lor, fără o atentă chibzuială, şi ceea ce este mai important, fără dovada unor cercetări suplimentare. Cele patru întrebări mai reflectă nivelele diferite ale angajamentului de a se încrede în rezultatele cercetării. Întrebarea 4 poate atrage după sine o activitate care merge puţin mai departe decât cât de utilă este o practică de asistenţă socială pentru un planificarea externării pacienţilor. Este totuşi o urmare bazată pe rezultatele lui Joan, crearea unui cadru modificat al priorităţilor practicii (timp mai mult alocat pacienţilor încredinţaţi rudelor). Intrebarea 2 va cere un efort mai mare şi resurse practice suplimentare din partea asistentului social şi a comunităţii; ceea ce probabil nu s-ar fi întâmplat până ce Joan nu s-ar fi convins de adevărul rezultatelor sale şi de generalitatea lor dincolo de eşantionul folosit. Multe alte implicaţii practice pot fi scoase din datele prezentate în tabelul 7.11. Unele pot reflecta foarte modest schimbările experimentate din practica de asistenţă socială care pot fi destinate îmbunătăţirii serviciilor. Se recomandată multă atenţie când se interpretează toate rezultatele cercetării. Aceasta deoarece schimbările radicale în furnizarea serviciilor de asistenţă socială pot afecta negativ traiul clienţilor noştri. Aplicaţiile practice derivate din rezultatele asocierilor pot fi riscante. Asocierea serveşte cel mai bine pentru identificarea legăturilor dintre variabile şi pentru formularea unor întrebări critice la care să se caute răspuns prin analize statistice mai puternice.
7.6. Exemplu din macro-practică Descrierea situaţiei care generează un studiu
Jim este un asistent social angajat de un comitet legislativ. El încearcă să acorde asistenţă în punerea în aplicare a unui sistem mărit de taxe de vânzare. Noua taxă propusă va furniza un venit suplimentar pentru şcolile publice. Ca parte a muncii
66
sale, el a început strângerea unor date personale asupra legislatorilor în scopul de a înţelege ce îi determină să voteze pentru / împotriva taxelor propuse. După ce a examinat câteva date disponibile şi zvonuri despre 30 de legislatori, i se părea că legislatorii care au favorizat aprobarea taxei au de obicei copii care frecventează şcolile publice; iar acei legislatori care nu au sprijinit legiferarea taxei nu prea aveau copii în şcolile publice. Jim s-a întrebat dacă poate găsi suport statistic pentru o legătură dintre variabila dependentă (susţinerea/nesusţinerea taxei) şi variabila independentă (folosirea/nefolosirea şcolilor publice). Ipoteza ce urmează a fi testată După discuţii cu membri comitetului şi trecerea în revistă a literaturii disponibile despre modelele după care legislatorii votează diverse taxe, Jim a concluzionat că poate formula o ipoteză direcţională. Legislatorii care au copii înscrişi la şcolile publice vor susţine mai mult creşterea impozitului pentru a genera venit suplimentar şcolilor publice, decât o vor face legislatorii care nu au copii în aceeaşi situaţie. O privire asupra metodologiei Jim a continuat să strângă informaţii despre legislatori dar a făcut şi un efort special să afle mai multe despre înregistrarea sistematică a datelor despre variabilele sale dependente şi independente. A identificat 160 legislatori care şi-au anunţat public suportul pentru sau împotriva taxei. A obţinut date biografice suficiente despre 125 (78%) dintre ei şi a putut să tragă concluzii asupra situaţiilor în care aceştia îşi trimit proprii copii la şcolile publice. Rezultatele Tabelul 7.12 prezintă rezultatele la care a ajuns Jim folosind procedurile de asociere aşa cum au fost prezentate în acest capitol.
Tabelul 7.12 Suportul legislatorilor pentru crşterea taxelor în funcţie de cum utilizează şcolile publice Votează pentru taxe mărite? Utilizează şcolile publice? Da Nu Total Da 39 36 75 Nu 21 29 50 Total 60 65 125 2 = 1,2 , df = 1, p > 0,10 (utilizând corecţia lui Yates) Interpretarea rezultatelor şi tragerea concluziilor Jim a fost întrucâtva înspăimântat de rezultatele analizei de asociere. El a fost totuşi bucuros că nu s-a încrezut în bănuiele de dinainte şi nu a vorbit comitetului legislativ despre aceasta. Bazându-se pe propria analiză, ar fi avut o probabilitate mare de comitere a unei erori de tipul I dacă ar fi respins ipoteza nulă şi ar fi revendicat existenţa unei legături între variabilele dependentă şi independentă. Cu un grad de libertate şi cu o ipoteză direcţională ştia că valoarea lui hi-pătrat ar fi trebuit să fie cel puţin 2,71 (tabelul 7.6) pentru a putea respinge ipoteza nulă la nivelul standard 0,05 de semnificaţie statistică. El acum are motive să creadă că
67
folosirea sau nefolosirea şcolilor publice pentru instruirea propriilor copii, nu a fost asociată cu preferinţa pentru votarea taxei mărite de impozitare, de către legislatori. Alte variabile ar fi putut reflecta un grad mai puternic de asociere cu variabila dependentă - preferinţa de vot asupra oricărei taxe de impozitare, percepţia acestora asupra oportunităţii unei taxe faţă de alte surse de venit, căsătoria cu un soţ care a fost instruit într-o şcoală publică, etc. Dar Jim poate fi acum aproape sigur că, cel puţin în statul său, nu există nici un motiv să creadă că votul legislatorilor pentru sau împotriva impozitului, a fost legat într-un fel sau altul de faptul că aveau copii în sistemul şcolar public. Legarea rezultatelor de practică Lipsa suportului statistic pentru ipoteza direcţională nu a negat în nici un fel valoarea studiului de cercetare întreprins de Jim. Micul său studiu, chiar dacă limitat şi focalizat pe un singur obiectiv, a fost foarte folositor. El a evitat tragerea unor concluzii eronate, bazate pe dovezi inadecvate, care puteau avea ca rezultat o strategie nepotrivită pentru lobby. Jim s-a întrebat dacă nu ar fi productiv să încerce să analizeze statistic alte caracteristici demografice ale legislatorilor ca variabile independente. Acum ar putea să-şi folosească timpul mai eficient urmărind alte piste în înţelegerea poziţiilor legislatorilor asupra propunerilor de impozit. Adesea, lipsa suportului statistic pentru o ipoteză poate economisi foarte mult timp. Majoritatea studiilor de cercetare generează alte întrebări de cercetat. În general, studiile de cercetare crează mai multe întrebări de cercetat decât la câte pot răspunde. Cu toate acestea faptul că putem pune o întrebare relevantă este un bun indicator a măsurii în care rezultatele cercetărilor au contribuit la îmbunătăţirea calităţii serviciilor sociale.
7.7. Rezumat Acest capitol a fost o discuţie pentru înţelegerea analizei de asociere. Am explicat popularitatea acesteia şi am subliniat când este folosită. La acest moment, ar trebui să cunoaşteţi cum lucrează acest test statistic, cum pot fi interpretate rezultatele, şi cum pot fi aplicate în practica de asistenţă socială. Ceea ce stăpâniţi despre hi-pătrat vă va ajuta şi pe mai departe. Ceea ce nu înţelegeţi încă în totalitate poate deveni mai clar pe măsură ce vom discuta principii asemănătoare în legătură cu un alt test statistic - coeficientul de corelaţie r a lui Pearson.
7.8. Întrebări pentru studiu 1. De ce folosirea frecventă al lui hi-pătrat în cercetarea în asistentă socială poate fi un avantaj sau un dezavantaj? 2. De ce este testul hi-pătrat în mod particular bine situat în cercetarea de asistenţă socală? 3. Ce însemnătate au numerele din fiecare celulă a unui tabel de asociere? 4. Ce se pierde când se foloseşte testul hi-pătrat pentru date care sunt, de exemplu, de nivel interval şi normal distribuite? 5. Poate indicatorul statistic hi-pătrat să ne spună dacă o variabilă produce variaţia în a doua variabilă? Explicaţi. 6. Ce sunt frecvenţele aşteptate şi cum sunt ele folosite în testul hi-pătrat? 68
7. Cum intervin gradele de libertate în determinarea dacă o valoare hi-pătrat precizată (de exemplu 10,00) este statistic semnificativă? 8. Care este minimul de frecvenţă aşteptată necesară pentru folosirea lui hi-pătrat? 9. Care sunt cei doi paşi ai procesului de determinare dacă avem sau nu suport statistic pentru o ipoteză direcţională? 10. Cum poate fi folosit hi-pătrat pentru a examina legătura dintre două variabile în timpul ce se controlază efectului unei a treia variabile?
69
Capitolul 8. Corelaţia Capitolul precedent a prezentat un mod de analiză a legăturii dintre două variabile de nivel nominal prin folosirea tabelelor de asociere şi a indicatorilor asocierii. Acest capitol explică modul în care putem să analizăm legătura dintre două variabile de nivel interval sau rapoarte prin procedurile denumite analize de corelaţie.
8.1. Conceptul de corelaţie Un exemplu de legătură între două variabile poate fi găsită în distribuţia ipotetică a variabilităţii motivaţiei clienţilor pentru tratament după nivelul lor de funcţionare. Tabelul 8.1 însumează datele pentru un eşantion de zece clienţi. Pentru fiecare valoare a variabilei X de nivel interval (nivelul motivaţional al clientului) există o corespondenţă; sau o pereche, valoarea variabilei Y de nivel interval (nivelul de funcţionare al clientului). O legătură între aceste două variabile este evidentă deoarece, fără excepţie, nivelul înalt al motivaţiei pentru tratament este asociat cu nivelele înalte ale funcţionării şi vice versa. Floyd de exemplu, a înregistrat cea mai scăzută valoare la ambele, nivelul de motivaţie (1) şi nivelul de funcţionare (2), Jane a măsurat următorul nivel scăzut pentru ambele variabile (rezultatele 2 şi respectiv 3), şi Lyne a atins nivelele cele mai înalte pentru ambele variabile (rezultatele 10 şi respectiv 11). Această legătură poate fi depistată cu ajutorul diagramei de împrăştiere, asemenea acelei ilustrate în Figura 8.1. Axa orizontală reprezintă rezultatelele individuale ale clienţilor, sau valorile, pentru nivelul motivaţiei pentru tratamentul (X), în timp ce axa verticală reprezintă rezultatele individuale ale nivelelor de funcţionare (Y). Fiecare punct reprezintă un caz şi totodată o pereche de valori măsuri ale celor două variabile- pentru fiecare client. Dacă punctele se conectează, ele vor forma o linie dreaptă, indicând că cele două variabile sunt perfect corelate. Asemenea perfecţiune este rar întâlnită în practica cercetării de asistenţă socială. Aici ea este folosită pentru a ilustra conceptul de corelaţie. Tabelul 8.1 Rezultate înregistrate de 10 clienţi la nivelele de motivare şi de funcţionare
Numele clientului Floyd Jane Robert Sue Herb Bill Margareta Ann Doroty Lyne
Nivel motivaţional (X) 1 2 3 4 5 6 7 8 9 10
Nivel de funcţionare (Y) 2 3 4 5 6 7 8 9 10 11
Figura 8.1 Legătură perfectă pozitivă între două variabile: nivelul motivaţional şi nivelul de funcţionare socială a clienţilor (din Tabelul 8.1)
70
Nivel de funcţionare (Y)
11 Lyne 10 Dorothy 9 Ann 8 Margareta 7 Bill 6 Herb 5 Sue 4Robert 3 Jane 2 - Floyd 1| | | | | | | | | | | 1 2 3 4 5 6 7 8 9 10 11 Nivel motivaţional (X)
Intensitate şi direcţie Figura 8.1 pune în evidenţă două dimensiuni importante ale relaţiei dintre variabile: intensitatea şi direcţia. Cu privire la intensitate, legătura dintre două variabile este cea mai puternică atunci când rezultatele tuturor clienţiilor cad dealungul unei linii drepte. Linia care trece prin toate punctele (reprezentând clienţii) diagramei de împrăştiere este numită linie de regresie. În aceste foarte rare cazuri, în care există o legătură perfectă, putem prezice cu precizie (de 100%) că unei valori Y îi corespunde o anume valoare X, şi vice versa. În cazurile obişnuite unde intensitatea legăturii este mai puţin perfectă, linia de regresie este mai puţin distinctă, iar capacitatea noastră de a prezice valorile unei variabile din valorile alteia este supusă erorii. Figura 8.2 Legătură perfectă negativă între două variabile: nivelul motivaţional al clientului şi nivelul de funcţionare socială a clienţilor
Nivel de funcţionare (Y)
11 - 10 98765432- 1| 1
| 2
| | | | | | 3 4 5 6 7 8 Nivel motivaţional (X)
| 9
| | 10 11
În legătură cu a doua dimensiune a corelaţiei, direcţia, legătura dintre nivelul motivaţional şi nivelul de funcţionare socială a clienţiilor, aşa cum este prezentată în Figura 8.1, poate fi descrisă ca fiind pozitive. Valorile înalte ale lui X sunt asociate cu valorile înalte ale lui Y, şi vice versa. Într-o legătură negativă (Figura 8.2), valorile înalte ale unei variabile sunt asociate cu valorile scăzute al celei de-a doua variabile şi
71
vice-versa. Asemenea corelaţiei perfecte pozitive, corelaţia perfectă negativă este foarte rară în cercetarea de asistenţă socială, ele apar în principal în disciplinele fizice. În cercetarea de asistenţă socială, în anumite legături nu se va putea distinge direcţia şi nici intensitatea - cu alte cuvinte nu există legături între toate variabile. Acestea lucru va fi susţinut de ipoteza nulă. Dar majoritatea legăturilor dintre variabile de nivel interval sau rapoarte reflectă un anumit grad de corelaţie, mergând de la aproape perfectă şi până la abia distictibilă numită şi corelaţe nonperfectă. Figura 8.3 este o altă diagramă de împrăştiere ilustrând o legătură între variabilele nivelul motivaţional şi funcţional, care este încă pozitivă dar nu mai este perfectă ca aceea ilustrată în Figura 8.1. Ea ne arată că doi clienţi au realizat 1 pentru nivelul motivaţional, dar unul dintre ei (Sue) a realizat 2 pentru nivelul funcţionalitaţii şi celălalt (Robert) a realizat 4. Linia de regresie nu este aşa distinctă ca în figura 8.1, nu este posibil ca o linie dreaptă să treacă prin toate punctele. De aceea este imposibil să prognozăm cu o precizie de 100% mărimea nivelului de funcţionalitate pentru un client, doar pe baza rezultatului privind nivelul lui motivaţional.
Figura 8.3 Legătură nonperfectă pozitivă între două variabile: nivelul motivaţional al clientului şi nivelul de funcţionare socială a clienţilor
Nivel de funcţionare (Y)
11 10 9 8 7 6- 5 4 - Robert 3 2 - Sue 1| | | | | | | | 1 2 3 4 5 6 7 8 Nivel motivaţional (X)
| 9
| | 10 11
Similar, figura 8.4 furnizează un exemplu de legătură negative care este mai puţin perfectă. Figura 8.5 prezintă un exemplu în care nu se poate observa nici un fel de legătură între cele două variabile. Figura 8.4 Legătură nonperfectă negativă între două variabile: nivelul motivaţional al clientului şi nivelul de funcţionare socială a clienţilor
Nivel de funcţi-
11 10 9- 876-
72
onare (Y)
5432- 1| 1
| 2
| | | | | | 3 4 5 6 7 8 Nivel motivaţional (X)
| 9
| | 10 11
Figura 8.5 Nici o legătură între două variabile: nivelul motivaţional al clientului şi nivelul de funcţionare socială a clienţilor
Nivel de funcţionare (Y)
11 10 98765432- 1| 1
| 2
| | | | | | 3 4 5 6 7 8 Nivel motivaţional (X)
| 9
| | 10 11
8.2. Logica corelaţiei Figurile 8.1 - 8.5 sunt diagrame de împraştiere standard. Ele sunt modalităţi dificile şi consumatoare de timp de prezentare a perechilor de valori pentru un număr mare de cazuri. O cale mult mai eficientă de punere în evidenţă a unei relaţii dintre variabile de nivel interval sau rapoarte este folosirea unei indicator statistic numit coeficient de corelaţie. Acesta furnizează o valoare numerică atât al intensităţii cât şi al direcţiei unei legături. Aşa cum este prezentat în Figura 8.6, coeficientul de corelaţie variază într-un continuum de valori, de la o extremă -1,0 (legătura perfect negativă) la o altă extremă 1.0 (legătura perfect pozitivă), cu 0.00 (fără corelaţie) ca punct de mijloc. Un coeficient de corelaţie nu poate fi mai mare decât 1.00 sau mai mic decât -1.0. Figura 8.6 Intervalul în care variază coeficientul de corelaţie |
|
|
-1.0
0.0
-1.0
73
Cu cât valoarea numericâ a coeficientului de corelaţie este mai aproape de una din valorile extreme (-1 sau -1), cu atât mai puternică este legătura dintre cele două variabile. De exemplu, un coeficient de 0,92 este mai apropiat de o corelaţie perfectă decât oricare din coeficienţii -0,65 sau 0,60 şi de aceea, sugerează o mai puternică corelaţie decât oricare dintre cele două. Cu cât coeficientul este mai apropiat de mijlocul acestui interval cu atât legătura dintre cele două variabile este mai slabă. Un coeficient de corelaţie care este apropiat de valoarea 0 sugerează că nu există nici o legătură între variabile. Semnul plus sau minus indică direcţia legăturii. De exemplu, corelaţia dintre nivelul îndemânării asistenţilor sociali şi anii de experienţa profesională în asistenţă socială poate fi de 0,85. Absenţa semnului minus indică o legătură pozitivă. Corelaţia dintre nivelul de îndemânare şi nivelul de apatie a celor care muncesc poate fi de 0,75, indicând astfel o puternică legatură negativă. Există persoane care sunt mai apatice şi neimplicate în munca lor, astfel este normal ca ele să fie mai puţin îndemânatice, şi vice versa. Pot fi utilizate o varietate de analize de corelaţie. Una din procedurile cele mai frecvent utilizate este şi cea care va fi prezentată pentru a ilustra coeficientul de corelaţie în acest capitol Este vorba de corelaţia Pearson al produsului momentelor (sau coeficientul de corelaţie r), pe care îl vom numi în discuţiile ce urmează, simplu: r. Înţelegerea indicatorului statistic r Folosind r, încercăm să determinăm statistic ceea ce arată o diagramă de împrăştiere - adică, până la ce grad punctele reprezentând valorile celor două variabile pentru fiecare caz vor tinde să formeze o linie dreaptă. Dacă valoarea lui r este mare (dacă se apropie de 1,00 sau -1,00) punctele vor tinde să se “strângă” aproape de linia de regresie; iar dacă valoarea lui r este mică (în apropierea lui 0,00) o diagramă a punctelor va reflecta distanţarea punctelor faţă de dreapta de regresie. Pentru a înţelege cum a apărut formula lui r ca un indicator al corelaţiei dintre variabile, este bine să ne reamintim că r este cel mai des interpretat ca o expresie a abilităţii noastre de a prezice o valoare a unei variabile din informaţiile pe care le avem despre o valoare a celeilalte variabile. Nu este implcată nici o relaţie de cauzalitate. Dacă o valoare mare r rezultă din analiza statistică, rezultatul ne poate ajuta să prezicem valoarea unei variabile dacă ştim valoarea alteia, dar r nu ne poate spune de ce tind variabilele să se influenţeze. Argumentul care explică ce variabilă cauzează variaţia alteia, trebuie să se bazeze pe alţi factori. Trebuie remarcat în formula lui r, că numărătorul este derivat din perechile de valori (una pentru fiecare variabilă) pentru fiecare caz. Suma de la numărător reflectă gradul în care variază împreună cele două variabile. Exprimat în alt fel, el ne spune în ce grad anumite valori ale unei variabile tind să fie găsite împreună cu anumite valori ale celeilalte variabile. La numitor, formula introduce cantitatea totală de variaţie a tuturor datelor; anume produsul abaterilor standard al celor două variabile. Valoarea r care rezultă din formula finală, este proporţia din variaţia totală ce revine covariaţiei de la numărător. Într-o corelaţie perfectă (r = 1,0 sau r = -1,0) 100 % din variaţia totală a celor două variabile va fi explicată de către covariaţia de la numărător. Invers, în acele cazuri rare în care nu există corelaţie (r = 0,0) între variabile, nimic din variaţia totală nu va fi explicată de covariaţia sumarizată în numărător. Cunoscând valorea pentru o variabilă a unui caz în care r = 0,0 ea nu ne va ajuta cu nimic în a prezice valoarea pentru cea doua variabilă pentru acel caz.
74
Valoarea indicatorului statistic r care rezultă din formulă ne spune mai multe. Dacă ridicăm la pătrat valoarea r, noua cifră va fi proporţia variaţiei dintr-o variabilă care poate fi “explicată” prin legătura ei cu cealaltă variabilă. Ţineţi minte că termenul explicaţie pe care îl folosim aici, nu înseamnă cauzalitate. Se referă doar la abilitatea noastră de a prezice valorile unei variabile dacă ştim valorile altei variabile. De exemplu, o valoare de 0,80, relativă la numărul de interviuri de tratament şi la rezultatele obţinute la testul stimei de sine, înseamnă că 64% (0,80 x 0,80 = 0,64) din variaţia rezultatului obţinut la testul stimei de sine poate fi explicat pe baza numărului de interviuri de tratament. Celelalte 36 de procente ale variaţiei valorilor stimei de sine (1,00 - 0,64) rămân neexplicate, sau cauzele care explică acestea sunt altele. Capacitatea noastră de a prezice “părerea despre sine însuşi” a clienţilor dacă ştim numărul de interviuri avute ar trebui să fie bună, dar cu siguranţă nu poate fi perfectă. Doar un r de +1,0 sau de -1,0 (o corelaţie perfectă) ne-ar permite să facem preziceri cu o acurateţe de 100% (1,02 = 1,0). Statistica r este un indicator al intensităţii şi al direcţiei oricărui model de asociere ce există între valorile unei variabile şi valorile altei variabile. Aşa cum am subliniat în prezentarea lui hi-pătrat, folosim greşit un test când încercăm să mergem mai departe decât este principala sa destinaţie (predicţia în cazul lui r) şi încercăm să îi atribuim mai multe atribuţii (implicaţii în cauzalitate) decât este el capabil să realizeze. Exemplul şi aplicarea pas cu pas a formulei, ce urmează, va sublinia faptul că r (la fel ca alte teste statistice ) este doar o manevrare matematică a numerelor care pot furniza doar un răspuns parţial pentru întrebările cercetării noastre. Răspunsurile plenare trebuie să vina din logică, teorie, intuiţie, experienţă practică, sau din alte domenii, mai puţin din procesele “mecanice”. Calcularea indicatorului statistic r Tabelul 8.3 furnizează un model pentru pregătirea datelor şi calculul lui r, folosind informaţiile prezentate în Tabelul 8.2. Tabelul 8.3 prezintă ceea ce Floyd a obţinut ca mărime a motivaţiei (X) de 5, ea este înregistrată în coloana a , şi ca nivel de funcţionare (Y) de 10, înregistrat în coloana b. În coloana c este înregistrat pătratul valorilor X (5 x 5 = 25) şi în coloana d este înregistrat pătratul valorilor Y (10 x 10 = 100). Coloana e conţine produsul valorilor lui Floyd X şi Y (5 x 10 = 50). În partea de jos a fiecărei coloane este suma valorilor tuturor cazurilor. Aceste sume sunt apoi înlocuite în formula de mai jos. e _ (a)(b)
r =
N ------------------------------| c _ a2 | | d _ b2 | | N || N |
Unde r = coeficientul de corelaţie a = suma valorilor X b = suma valorilor Y c = suma valorilor X2 d = suma valorilor Y2 e = suma produselor X x Y N = numărul total de cazuri Substituind literele cu valori , obţinem 75
a = 175 d = 11000 b = 300 e = 6750 c = 4875 N = 10 Substituind valorile în formula lui r , obţinem 6750 _ (175)(300)
r =
= = = = =
10 -----------------------------------------| 4875 _ 1752 | | 11000 _ 3002 | | 10 | | 10 | (6750 - 5250) / (4875 - 3062,5)(11000 - 9000) 1500 / 1812,5 x 2000 1500 / 1903,94 0,78784 0,79 (coeficient de corelaţie)
Tabelul 8.2 Rezultatele obţinute de clienţi la nivelele motivaţional şi de funcţionare Nivel motivaţional Nivel de funcţionare Numele clientului (X) (Y) Floyd 5 10 Jane 15 20 Robert 25 30 Sue 35 40 Herb 45 50 Bill 0 10 Margareta 7 20 Ann 10 30 Doroty 15 40 Lyne 20 50 Tabelul 8.3 Schemă de calcul pentru coeficientul de corelaţie r a lui Pearson (din tabelul 8.2) Variabila (a) (b) (c) (d) Nivel motivaţ. Nivel de funcţ. Numele clientului (X) (Y) X2 Y2 Floyd 5 10 25 100 Jane 15 20 225 400 Robert 25 30 625 900 Sue 35 40 1225 1600 Herb 45 50 2025 2500 Bill 0 10 0 100 Margareta 7 20 25 400 Ann 10 30 100 900 Doroty 15 40 225 1600 Lyne 20 50 400 2500 Total 175 300 4875 11000
76
(e) XY 50 300 750 1400 2250 0 100 300 600 1000 6750
Legătura dintre r şi şansă Cât de mare trebuie să fie r pentru a putea respinge în siguranţă ipoteza nulă şi să avem suport statistic pentru existenţa unei legături reale între cele două variabile? Ca şi la alte legături bivariate, coeficientul de corelaţie este gândit să fie suficient de puternic ca să ajungă la sau să depăşească nivelul predeterminat al semnificaţiei statistice. Nivelul de încredere de 0,05 justificat şi statuat anterior, este folosit şi aici ca punct de referinţă pentru a determina dacă putem respinge ipoteza nulă. Tabelul pentru valorile critice ale lui r (Tabelul 8.4) ilustrează punctul la care semnificaţia statistică este realizată pentru diferite intensităţi ai coeficientului de corelaţie, depinzând de mărimea eşantionului. Aşa cum arată tabelul, pentru un eşantion de 11 indivizi, este nevoie de un coeficient de corelaţie de 0,602 cu o ipoteză nedirecţională, care a ajunge la o semnificaţie statistică de nivelul de 0,05 (0,735 pentru nivelul 0,01) şi care permite astfel respingerea ipotezei nule. Cu o mărime a eşantionului de 400 de cazuri, respingerea ipotezei nule este posibilă cu un coeficient de corelaţie mult mai slab (0,098 la nivelul 0,05 şi 0,128 la nivelul 0,01). Acesta este un punct important care trebuie reţinut. Ca şi la analiza de asociere, şi la analiza corelaţiei probabilitatea demonstrării semnificaţiei statistice cu ajutorul lui r este legată direct de mărimea eşantionului. Într-un eşantion mai mic este mult mai probabil ca întâmplarea (şansa), sub forma erorii de eşantionare, să fie cauza legăturii aparente dintre două variabile, decât întrunul mai mare. Cu un eşantion mare, o legătură aparentă, chiar una care la prima vedere apare a fi slabă, este de departe mai puţin probabilă să fie rezultatul şansei. Un tabel cum este Tabelul 8.4 încorporează acest factor când ia în considerare dimensiunea eşantionului în furnizarea nivelului de semnificaţie. Tabelul 8.4 Valorile critice ale coeficientului de corelaţie r Nivel de semnificaţie pentru un test direcţional .025 .005 .025 Nivel de semnificaţie pentru un test nedirecţionat n .05 .01 n .05
.005 .01
3 4 5 6 7 8 9 10
.997 .950 .878 .811 .754 .707 .666 .632
.999 .990 .959 .917 .874 .834 .794 .765
38 39 40 41 42 43 44 45
.320 .316 .312 .308 .304 .301 .297 .294
.413 .408 .403 .398 .393 .389 .384 .380
11 12 13 14 15 16 17 18 19 20
.602 .576 .553 .532 .514 .497 .482 .468 .456 .444
.735 .708 .684 .661 .641 .623 .606 .590 .575 .561
46 47 48 49 50 55 60 65 70 75
.291 .288 .284 .281 .279 .266 .254 .244 .235 .227
.374 .372 .368 .364 .361 .345 .330 .317 .306 .296
21
.433
.549
80
.220
.286
77
22 23 24 25 26 27 28 29 30
.423 .413 .404 .396 .388 .381 .374 .367 .361
.537 .526 .515 .505 .496 .487 .478 .470 .463
85 90 94 100 125 150 175 200 300
.213 .207 .202 .195 .170 .159 .148 .138 .113
.278 .270 .263 .256 .230 .210 .194 .181 .148
31 32 33 34 35 36 37
.355 .349 .344 .339 .334 .329 .325
.456 .449 .442 .436 .430 .424 .418
400 500 600 700 800 900 1000
.098 .088 .080 .074 .070 .065 .062
.128 .115 .105 .097 .091 .086 .081
Substanţialitatea coeficientului de corelaţie Pentru a interpreta intensitatea unui coeficient de corelaţie, trebuie să luăm în considerare modul în care se utilizează o analiză de corelaţie. Chiar dacă se obţine un coeficient de corelaţie statistic semnificativ, valoarea r în sine nu este în mod necesar prtător de înţeles şi nu reprezintă neapărat un rezultat substanţial. De exemplu, cercetările care construiesc instrumente de măsurare sunt preocupate de validitatea si fiabilitatea lor. Punctul tradiţional de la care se poate accepta un instrument, ca prezentând siguranţă, cere adesea un coeficient de corelaţie de peste 0,85, pe când punctul pentru a accepta validitatea instrumentului este frecvent de 0,40 sau chiar mai scăzut. Dintr-o perspectivă diferită, indentificarea faptului că nu există o asociere (r = 0,00) între două variabile despre care se credea că sunt legate, poate reprezenta cel mai important rezultat al unui studiu. În interpretarea unui coeficient de corelaţie, mai este important să nu îl tratăm ca şi cum ar fi echivalent cu date de nivel interval sau rapoarte; sau nu facem judecăţi care dau o astfel de impresie. De exemplu, un coeficient de corelaţie de 0,80 nu este de două ori mai puternic ca unul de 0,40. De fapt 0,80 descrie o asociaţie de patru ori mai puternică (0,802 = 0,64; 0,402 = 0,16; 0,64 / 0,16 = 4) în ceea ce priveşte cantitatea de variaţie pe care o poate explica din variaţia totală a celeilalte variabile. Trebuie ţinut minte că un coeficient de corelaţie atât de puternic ca 0,80, arată un model (pattern) de la care se vor abate foarte puţine excepţii - adică tuturor valorilor mari ale primei variabile îi vor corespunde virtual valori mari şi pentru cea de a doua variabilă, şi vice versa. Un coeficient de corelaţie mai slab (aşa ca 0,40) va avea un procentaj mai mare de cazuri care se opun direcţiei de asociere. Prezentarea corelaţiilor Prezentarea unui coeficient de corelaţie într-un raport de cercetare este simplă. După calcularea lui r conform schemei date în Tabelul 8.3 şi formulei lui de calcul, vom găsi nivelul de probabilitate asociat cu r -ul obţinut; pe baza dimensiuni eşantionului în tabelul 8.4. Acesta ne va permite să determinăm dacă putem respinge ipoteza nulă sau nu. Cu informaţia astfel obţinută putem prezenta rezultatele noastre într-o frază. De exemplu:
78
Între variabilele independentă şi cea dependentă pentru 20 de clienţi s-a găsit o corelaţie r = -0,57, la nivelul de semnificaţie p < 0,01, ceea ce indică prezenţa unei corelaţii negative statistic semnificative între cele două variabile.
8.3. Corelaţia cu trei sau mai multe variabile Legăturile bivariate necesită frecvent explicaţii în continuare. De exemplu, este improbabil să putem prezice cu siguranţă cât timp un client va rămâne în tratament doar pe baza unor informaţii privind severitatea problemei prezentate de client, motivaţia lui pentru tratament; sau orice altă variabilă singulară. Perspectiva sistemelor şi alte teorii a cauzelor multiple, susţin că există multe variabile care contribuie împreună şi determină comportamentul uman. Acurateţea predicţiei poate fi îmbunătăţită prin extinderea volumului de date disponibile prin includerea mai multor (decât două) variabile în acelaşi timp într-o analiză. Deciziile privind direcţia în care să aibe loc extinderea, sursele suplimentare şi tipurile de date necesare îmbunătăţirii explicaţiilor şi capacităţilor noastre predictive, constituie adesea următorul pas critic în procesul de analiză a datelor. În acest text, nu ne vom ocupa cu descrierea testelor care examinează corelaţiile între trei sau mai multe variabile (unul binecunoscut este coeficientul de corelaţie parţială). Pentru dezbaterea noastră, este suficient să spunem că ar trebui să ştim despre existenţa lor şi despre ceea ce pot ele oferi (sau ce nu pot ele oferi) în plus faţă de o analiză bivariată, cu utilizarea lui r.
8.4. Exemplu din micro-practică Descrierea situaţiei care generează un studiu
Bill este un asistent social într-o agenţie de servicii familiale. El conduce câteva grupuri de tratament, constituite din adolescente. Recent el şi-a dat seama de variabilitatea mare în participarea verbală printre membrii grupului. Virtual toate fetele ar fi trebuit să ia parte când aveau loc discuţii; dar câteva dintre ele nu au făcut niciodată vreun comentariu nesolicitat. El a simţit că aceste fete aveau un nivel scăzut al dorinţei de a se implica în grup. După o perioadă de câteva săptămâni, Bill a întrebat câteva din fetele nevorbăreţe, de ce sunt aşa de rare comentariile lor voluntare. Dintre cele şapte fete întrebate, cinci au dat un răspuns asemănător: fiecare a fost singurul copil în familie şi au fost învăţate de către părinţi că nu este datoria lor să iniţieze comunicarea. Apoi Bill le-a întrebat pe trei dintre cele mai vorbăreţe, care înclinau să domine în discuţiile din grup, câţi fraţi şi /sau surori au. Răspunsurile lor au fost şase, şapte şi nouă. Pe baza incursiunii sale limitate, Bill a început să speculeze o posibilă legătura între o variabilă dependentă, neiniţierea unui comentariu în tratamentul de grup şi o variabilă independentă, numărul fraţilor din familie. Ipoteza ce urmează a fi testată
Din literatură, Bill a aflat tot ce a putut despre fenomenele ca trăsăturile sociale ale copilului singur, modelele de comunicare dintre fraţi şi variaţiile în participarea verbală în grupurile de adolescenţi. Majoritatea literaturii de specialitate părea să-l conducă la concluzia că adolescenţii cu mai mulţi fraţi sunt mai dispuşi pentru comentarii voluntare decât aceia cu mai puţini fraţi. Această presupunere se explica prin experienţa în comunicare câştigată prin maturizarea printre fraţi. Totuşi altă parte a literaturii de specialitate părea să sugereze o versiune opusă. Ea susţinea
79
că copii care au în jur adulţi cu care să comunice vor căpăta mai multă iscusinţă verbală şi vor fi mai puţin intimidaţi de prezenţa adulţilor. Astfel Bill a rămas indecis. Oriunde era vorba de o astfel de temă, în diferitele surse, se sugera că variabila dependentă şi cea independentă par a fi logic legate. Dar în ce direcţie? Bill avea şi el o oarecare experienţă câştigată (desigur neştiinţifică) din propriile observaţii. Pănă la urmă s-a decis s-ă realizeze un studiu de cercetare de dimensiuni mici, care să testeze următoarea ipoteză direcţională: Printre adolescentele dintr-un grup de tratament, există o corelaţie pozitivă între numărul comentariilor nesolicitate şi numărul fraţilor din familie. O privire asupra metodologiei
Este o procedura obişnuită într-o agenţie să se înregistreze video sesiunile de tratamentet de grup şi să se folosească apoi de către personalul agenţiei pentru supervizare. Astfel Bill nu avea nici o problemă în privinţa accesului la informaţiile ce i-ar putea folosi pentru a-şi testa ipoteza. El a primit permisiunea administratorului agenţiei de a folosi benzile video cu cele şapte fete din grupul său, pentru a le folosi în cercetare. Pentru operaţionalizare Bill a definit un caz, ca fiind o adolescentă care a participat la cel puţin 75% din şedinţele grupului său într-o perioadă de patru luni; Având identificate 35 de fete care îndeplineau acest criteriu, el a revăzut toate videocasetele împreună cu un coleg care a fost interesat de studiul său. Bill şi prietenul său au dezvoltat o definiţie operaţională pentru variabila “comentariu nesolicitat”. După aceea ei au înregistrat numărul comentariilor nesolicitate realizate de fiecare fată în timpul fiecarei şedinţe. Un comentariu nesolicitat a fost judecat ca fiind făcut doar dacă Bill şi colegul său au simţit că a fost conform cu definiţia. Bill şi colegul său au adunat numărul comentariilor nesolicitate pentru fiecare dintre fete (cazuri) şi apoi l-au împărţit la numarul de şadinţe la care tinerele au participat. Acest număr le-a furnizat media comentariilor nesolicitate pe o şedinţă pentru fiecare caz (variabila dependentă). Din înregistrările făcute la Agenţie ei au scos datele pentru variabila independentă, numărul fraţiilor pentru fiecare caz. Bill a aşezat măsurătorile pentru fiecare dintre cele două variabile într-un tabel asemănător tabelului 8.2. Rezultatele
Bill a folosit r pentru a determina dacă poate să aibe suport statistic pentru ipoteza sa. Folosind formula pentru r, el a aflat că coeficientul de corelaţie dintre numărul comentariilor nesolicitate pe şedinţă şi numărul de fraţi a fost de 0,340. Gândindu-se la ceea ce înseamnă puterea corelaţiei, el a fost oarecum dezamăgit, dar reamintindu-şi că dimensiunea eşantionului său este mare (35 este relativ mare pentru r), şi-a dat seama că nu avea nevoie de o corelaţie mare pentru a avea semnificaţie statistică. Când s-a uitat în tabelul pentru r, unde dimensiunea eşantionului este controlată (Tabelul 8.4), el a observat că probabilitatea comiterii unei erori de tipul I în respingerea ipotezei nule cu o corelaţie de 0,340 şi un eşantion de 35 era mai mică decât 0,025. (De semnalat că 0,340 se găseşte la dreapta lui 0,334, dar este mai mic decât 0,430). Interpretarea rezultatelor şi tragerea concluziilor
Bill a ştiut că nivelul de semnificaţie 0,05 este în general acceptat ca suport pentru o legătură dintre două variabile. El ştie deasemenea că în cea ce priveşte legătura dintre variabila dependentă şi cea independentă, se află pe tărâmul sigur al statisticii. Totuşi este necesar un al doilea pas pentru interpretare, înainte de a revendica suport statistic pentru ipoteza sa. A fost oare corelaţia dintre variabile în 80
direcţia în care el a formulat ipoteza, adică este o corelaţie pozitivă? Bill a ţinut minte că o corelaţie pozitivă între două variabile (Figurile 8.1 şi 8.3) înseamnă ca valorile înalte ale unei variabile tind să se afle printre cazurile care au valori înalte ale celeilalte variabile şi vice versa. Aceasta înseamnă că, pentru aceste date, fetele care au avut valori mari pentru variabila “numărul comentariilor nesolictate” ar fi trebuit să aibe valori mari şi pentru variabila “numărul fraţilor” şi vice versa. Datele lui Bill arată că este aşa. El a concluzionat că are suport statistic pentru ipoteza sa, în direcţia presupusă. Bill a fost realist în privinţa rezultatelor sale. El a ştiut că pot fi şi alte explicaţii pentru rezultatul sau statistic semnificativ, decât existenţa unei legături adevărate între variabile. Cercetarea sa a fost una de dimensiuni mici, el s-a bazat pe un eşantion care îi convenea cel mai mult: de la agenţia sa şi dintre cazurile lui. Multe efecte deformante şi multe alte variabile ar fi posibil să fi afectat rezultatele obţinute de el. Acestea ar putea să fie legaţi cu factori ca: (1) o anume deformare creată în interiorul eşantionului ca urmare a cazurilor pierdute; (2) o posibilă inabilitate a lui Bill de a fi un bun mediator pentru fetele care nu au fost obişnuite să fie în situaţii de grup; (3) o posibilă distorsiune a evenimentelor dată de limitele echipamentelor de înregistrare video folosite. În plus, o corelaţie de 0,340 dintre variabile nu este puternică în sens absolut. Lipsa de încredere absolută în rezultatele sale şi mărimea acestora, l-au determinat pe Bill să nu publice încă un articol din studiul său pentu a comunica rezultatele sale şi altora. Legarea rezultatelor de practică
Rezultatele lui Bill, chiar şi astfel calificate, cu siguranţă nu erau fără valoare. El le-a rezumat şi le-a prezentat la o întâlnire săptănânală a personalului. Colegii săi iau oferit o privire critică asupra metodelor sale de cercetare şi au identificat posibilele deformări şi prezenţe ale altor variabile care, dacă ar fi controlate metodologic, ar îmbunătăţi planul cercetarii. Bill şi câţiva asistenţi sociali au decis să facă câteva ajustări metodei lor practice, bazându-se pe presupunerea că corelaţia pe care el a identificat-o a fost una reală. Ei au estimat că riscul implementării unor schimbări rezultate din constatările cercetării este mic ca efect asupra clienţiilor, şi ei au fost de acord să le evalueze peste şase lunii. Ei s-au hotărât să urmeze următorii paşi: 1. Vor folosi variabila „numărul de fraţi” pentru a crea grupuri mai omogene printre viitorii noi clienţi. Ei şi-au dat seama că aşezând pe cei ar trebui să fie cei mai vorbăreţi membrii (cu mai mulţi fraţi) laolaltă într-un grup, ei nu vor mai putea inhiba prin intimidare pe ceilalţi membrii ai grupului care sunt mai puţin insistenţi. Ei au sperat că clienţii mai insistenţi vor fi mai puţin tentaţi să domine şi să monopolizeze discuţia cu persoanele asemănătoare lor. În schimb, câteva dintre acele persoane pe care asistenţii sociali le considerau mai puţin insistente (cu mai puţini fraţi) vor deveni mai active şi mai insistente în grupuri formate din persoane mai asemănătoare lor. 2. În alte grupuri, noii membrii din familiile cu mai mulţi copii, vor fi văzuţi ca persoane cu risc să domine discuţiile. De asemenea noii membrii cu mai puţini fraţi sau fără de fraţi, vor fi priviţi ca având riscul de a fi rezervaţi în ceeace priveşte comentariile voluntare. Această percepţie va afecta modul în care asistenţii sociali îsi vor juca rolul de îndrumători ai unor grupuri mai omogene. 3. În toate grupurile, liderii vor facilita discuţii în jurul unor domenii ca: atitudinile faţă de prezenţa sau absenţa fraţilor, atitudinile părinţilor faţă de afirmaţiile copiilor, etc.
81
Ca şi în exemplele ce folosesc tabelele de asociere, contribuţia la corpul cunoştiinţelor în asistenţă socială oferite de studiul lui Bill trebuie să fie considerată ca fiind limitată. Cantitatea nouă de cunoştiinţe aduse a fost mică. Totuşi, la un alt nivel, Bill a realizat un obiectiv foarte important, care i-a adus multe beneficii, atât lui, colegilor lui cât şi clienţiilor. El pus bazele pentru următoarele studii de cercetare care vor folosi planuri de lucru mai sofisticate. În plus personalul format din asistenţi sociali au început să se gândească la a face cercetări. Ei au câştigat experienţă în aplicarea rezultatelor cercetării. Ei vor încerca de acum să utilizeze materialele publicate în revistele de specialitate, în viitoarele lor cercetări. Probabil, chiar şi fără să ştie, Bill a adus personalul mai aproape de legitimizarea cercetării ca o componentă importantă a practicii de asistenţă socială. Vor fi formate grupuri de tratament mai eficiente sau mai puţin eficiente, ca rezultat direct al cercetării lui Bill. Dar cândva în viitor, studiul său de mici proporţii poate avea efecte pozitive în oferta de servicii de asistenţă socială pentru clienţii agenţiei.
8.5. Exemplu din macro-practică Descrierea situaţiei care generează un studiu
Tanya este un administrator într-o agenţie districtuală de bunăstare publică. De curând ea şi-a dat seama de rata înaltă a erorilor înregistrate la serviciul de asistenţă financiară a agenţiei sale. Când ea a fost angajată în poziţia actuală, rata erorilor de determinare a eligibilităţii pentru noii solicitanţi de AFDC (Ajutor Social Financiar) era printre cele mai mari din stat. Ea a presupus că problema a fost legată, cel puţin în parte, de experienţa insuficientă a angajaţilor. Ea a obţinut acordul necesar şi a luat rapid hotărârea să mărească baremurile de acceptare a asistenţilor sociali angajaţi mai curând de şase luni. Ea a cerut deasemenea angajaţilor mai vechi o precizie mai mare în determinarea eligibilităţii. La un an după ce a luat aceste decizii, rata erorilor s-a dublat. Tanya a fost preocupată de noua cifră a ratei erorii. Ea s-a întrebat, cum de eforturile ei de a redresa această problemă pot avea ca rezultat înrăutăţirea ei. Cum de s-a putut întâmpla ca o mai bună instruire a noilor asistenţi sociali, combinat cu folosirea personalului mai experimentat, să rezulte într-o creştere dramatică a erorilor în determinarea eligibilităţii? Discutând acest paradox cu unii membrii ai personalului, ea a primit o sugestie asupra a ce probabil că a funcţionat greşit. Membrii personalului au făcut o observaţie cauzală şi anume că dealungul a câţiva ani au fost o serie de schimbări majore în criteriile de acceptare în AFDC. Tanya s-a întrebat dacă experienţa practică a lucrătorilor mai vechi, căpătată sub standarde vechi, nu a fost acum când ei au fost rugaţi să-şi îndeplinească cu multă seriozitate îndatoririle, mai mult o ocazie de a face erori decât un beneficiu. Ea a presupus că atâta timp cât nici un angajat vechi nu a beneficiat de o instruire suplimentară de când s-au schimbat lucrurile, ei au putut face un număr mare de erori din cauza lipsei de cunoştiinţe asupra noilor standarde. Printre aceşti “veterani” care au lucrat sub câteva seturi de standarde, pot fi mulţi care fac confuzii în privinţa standardelor actuale şi de aceea există posibilitatea de a face erori. Tanya şi-a propus să nu ia alte decizii care ar putea să nu soluţioneze problema, sau chiar să o înrăutăţască. Dacă ea ar fi recomandat schimbări pentru viitor ele nu se puteau bizui decât pe o bănuială. S-a hotărât să adune mai întâi informaţii sigure pe care să-şi sprijine apoi recomandarile.
82
Ipoteza ce urmează a fi testată
Dacă experienţa a fost într-adevăr pozitiv corelată cu rata erorii printre lucrătorii vechi, atunci, s-a gândit Tanya, ar trebui să demonstreze această legătură folosind informaţiile deja disponibile în sistemul de informaţii al conducerii agenţiei. Pentru că ea a fost mai interesată în explicarea diferenţelor de rate de eroare dintre lucrători ca diferenţe determinate de diferenţele de experienţă dintre lucrători, prima variabilă a fost identificată ca fiind cea dependentă şi ultima variabilă ca independentă. Ea a simţit că scurta sa trecere în revistă a literaturii de specialitate şi discuţiile cu colegii i-au permis să formuleze o ipoteză direcţională: Printre asistenţii sociali care lucrează la determinarea eligibilităţii în AFDC, există o puternică şi statistic semnificativă corelaţie pozitivă între anii de experienţă de lucru în agenţie şi rata erorilor. O privire asupra metodologiei
Asemenea lui Bill din exemplul anterior, Tanya s-a gândit la o cercetare simplă. Pentru că avea nevoie de un răspuns rapid, ea şi-a limitat studiul la examinarea legăturii dintre variabila dependentă şi variabila independentă. Cu ajutorul calculatorului, ea a calculat r pentru a evalua corelaţia dintre variabile pentru toţi cei 40 de asistenţi sociali care au determinat eligibilităţile în mod curent. Pentru măsurarea variabilei dependente ea a folosit numărul erorilor identificate la 100 de cazuri (ultimele 100). Rezultate
Coeficientul de corelaţie dintre rata de eroare şi anii de experienţă a fost 0,215. Tanya a verificat în tabelul cu valori critice similar cu Tabelul 8.4 dacă şansa poate fi explicaţia pentru această legătură. Din tabel a reieşit că ar fi nevoie de o valoare minimă pentru r de 0,264 pentru a obţine semnificaţie statistică la nivelul de 0,05 cu un eşantion de 40 de cazuri şi o ipoteză direcţională. Ea nu a găsit deci suport pentru ipoteza sa la nivelul de 0,05. În plus semnul pe care îl poartă coeficientul de corelaţie indică tendinţa în direcţie opusă aceleia în care ea a prezis că s-ar afla. Interpretarea rezultatelor şi tragerea concluziilor
Tanya a sperat să găsească suport pentru presupunerea ei că, în cazul asistenţilor sociali mai vechi, cei cu mai multă experienţă au făcut cele mai multe erori, iar cei cu mai puţină experienţă au făcut mai puţine erori. Ea dorea să folosească acest rezultat pentru a recomanda supervizorilor să nu mai folosească pentru determinarea eligibilităţii clienţilor o parte din angajaţii vechi, sau ca aceştia să fie trimiţi la aceleaşi ore de instruire la care sunt trimişi şi noii angajaţi. Rezultatele însă au dezamăgit-o. Uşoarea corelaţie negativă i-a sugerat că asistenţii sociali mai vechi au făcut mai puţine greşeli decât aceia cu mai puţină experienţă. Rata erorii în district ar fi fost chiar şi mai ridicată dacă nu ar fi fost folosiţi angajaţii mai vechi. Legarea rezultatelor de practică
Tanya ştia suficiente lucruri despre cercetare pentru a înţelege că lipsa suportului statistic pentru ipoteza sa nu a însemnat că nu au apărut cunoştinţe noi. Studiul său de cercetare a determinat schimbarea focalizării atenţiei mai departe decât pe experienţa de lucru trecută a angajaţilor mai în vârstă, ca factor principal în creşterea recentă a ratei erorii. Ea şi-a reamintit că în graba ei de a reduce rata erorii, ea a introdus două variabile: personalul vechi căruia i-a cerut determinări mai precise ale eligibilităţii şi personalul nou care a fost instruit mai mult în vederea îndeplinirii rolului lor. Probabil problema a devenit şi mai gravă datorită introducerii instruirii 83
suplimentare. Ea a aflat în final că o creştere a numărului de ore de instruire nu a reprezentat în mod necesar o garanţie că s-au format lucrători mai bine pregătiţi pentru munca lor. În plus, faptul că angajaţii cu experienţă, care au lucrat şi sub regulamente vechi şi care nu au fost expuşi unor instrucţii suplimentare, au lucrat mai bine decât noii lucrători supuşi instruirii, a condus la întrebarea dacă instruirea şi-a atins obiectivele. Bazându-se pe analiza datelor sale, Tanya a decis urmatoarele măsuri: 1. Să întocmească şi să pună în aplicare un plan de studiu evaluativ pentru instruirea asistenţilor sociali noi. 2. Să folosească în continuare angajaţii cu experienţă pentru a creşte responsabilitatea în determinarea eligibilităţii şi să-i încurajeze să le acorde asistenţă noilor angajaţi în învăţarea rolului lor. 3. Să raporteze rezultatele cercetării sale superiorilor ei, informându-i asupra modului de abordare a problemei (punctele 1 şi 2 de mai sus), pentru a-i face să cunoască preocuparea ei pentru rata ridicată de erori şi de încercarea de a o corecta. Contribuţia Tanyei la cunoştiinţele profesionale, folosind analiza corelaţiei, a fost foarte folositoare în ciuda faptului că ipoteza ei nu a avut suport statistic. Pentru că ea a folosit corect indicatorul r, şi într-o situaţie corespunzătoare, rezultatele au avut credibilitate. Ele i-au permis să ia decizii în cunoştiinţă de cauză şi au călăuzit-o în selectarea şi planificarea altor studii de cercetare necesare.
8.6. Rezumat Acest capitol a prezentat analizele de corelaţie ca un mijloc de determinare şi exprimare a intensităţii şi a direcţiei unor asocieri (extindere a covariaţiei) dintre două variabile de nivel interval sau rapoarte. Am arătat deasemenea efectul pe care îl are dimensiunea eşantionului asupra semnificaţiei statistice şi modul în care acest efect explică matematic de ce un coeficient de corelaţie poate fi semnificativ statistic chiar dacă este slab. Corelaţia este unul dintre multele domenii în care un cercetător trebuie să fie permanent preocupat de etică, şi să aibe o grijă specială să nu prezinte greşit, intenţionat sau neintenţionat, rezultatele cercetării. Asemănător tuturor testelor statistice, r (coeficientul de corelaţie r a lui Pearson) nu poate controla deformările sau efectele altor variabile. Ideal ar fi ca aceşti factori să fie deja controlaţi prin grija cu care se întocmeşte planul de cercetare înainte de colectarea datelor şi analiza acestora.
8.7. Întrebări pentru studiu 1. Care va fi forma unei diagrame de împrăştiere care reflectă o corelaţie negativă perfectă? 2. Ce coeficient de corelaţie sugerează o legătură mai puternică între două variabile, 0,74 sau -0,86? 3. Ce coeficient de corelaţie sugerează că nu există nici o legătură între două variabile de nivel interval? 4. Cum influenţează dimensiunea eşantionului, mărimea coeficientului de corelaţie considerat semnificativ statistic? 5. Cum se poate ca o corelaţie foarte slabă, de 0,10 , să fie o contribuţie valoroasă la îmbunătăţirea cunoştiinţelor practice?
84
6. De ce nu este corect să afirmăm că, coeficientul de corelaţie de 0,84 sugerează o legătură de două ori mai puternică decât un coeficient de corelaţie de 0,42? 7. De ce analizele bivariate, asemenea lui r, nu furnizează în mod uzual o explicaţie totală asupra legăturii dintre două variabile? 8. Poate o analiză bivariată de corelaţie să ne spună care variabilă cauzează variaţia în a doua variabilă? Explicaţi. 9. Când poate un coeficient de corelaţie să fie folosit pentru a prezice, cu siguranţă de 100%, valorile unei variabile cu ajutorul valorilor cunoscute pentru cealaltă variabilă? 10. Care este formatul obişnuit pentru prezentarea rezultatelor din analiza de corelaţie?
85
Capitolul 9. Compararea mediilor Am prezentat până acum un test popular (hi-pătrat) care este folosit frecvent pentru analizarea legăturii dintre două variabile de nivel nominal şi am discutat apoi despre un alt test (coeficientul de corelaţie r, a lui Pearson) destinat examinării relaţiei dintre două variabile de nivel interval sau de rapoarte. In acest capitol, vom examina unul dintre testele statistice potrivite atunci când una din variabile, deobicei cea dependentă, este cel puţin de nivel interval iar cealaltă variabilă, deobicei variabila indepedentă, este de nivel nominal.
9.1. Popularitatea statisticii t Există câteva feluri diferite de teste proiectate pentru diferite necesităţi de analizare a informaţiilor. Vom prezenta doar unul dintre acestea. Testul t este foarte popular şi în special foarte folositor pentru cercetarea în asistenţă socială. Ce îl face pe testul t (numit şi testul Student) atât de folositor? Una dintre cele mai mari nevoi pentru asistenţi sociali este în acele studii care caută evaluarea eficacităţii diferitelor abordări ale intervenţiei. Avem nevoie să ştim dacă o metodă de intervenţie este în mod real mai bună decât alta pentru obţinerea rezultatelor dorite. Testul t este ideal pentru a fi folosit în situaţii în care avem două categorii a unei variabile independente (intervenţia A / intervenţia B) care este de nivel nominal, pe când variabila dependentă (comportamentul, atitudinea, valoarea sau orice altceva) pe care sperăm să o găsim afectată, este cel puţin de nivel interval. Deobicei avem măsurători rezonabil de precise ale variabilei dependente. Exemplele pot include variabile ca: respectul de sine, aspiraţia către bunăstare, satisfacţia maritală, nivelul de funcţionare socială, sau alte caracteristici ale clientului. Mulţumită muncii cercetătorilor care au îmbunătăţit instrumentele pentru aceste măsurări, acum aceste variabile pot fi tratate statistic, ca fiind măsurate la nivel interval. Alte variabile dependente frecvent folosite ca: numărul întâlnirilor ratate, numărul împotrivirilor exprimate faţă de un program de bunăstare socială, sau numărul comportamentelor violente îndreptate către soţie, sunt de nivel interval sau de rapoarte datorită naturii lor. Dacă putem justifica o variabilă ca fiind de nivel interval sau de rapoarte şi cealaltă variabilă este doar de nivel nominal, t poate fi ales ca test statistic. Alt motiv pentru care cercetătorii în asistenţă socială adesea folosesc testul t, este dimensiunea relativ mică a eşantionului necesar pentru utilizarea acestui test. Eşantioanele mari sunt rar disponibile în cercetarea în asistenţă socială, în special în situaţii clinice. Testul t este potrivit pentru cercetările care folosesc un număr mic de cazuri (de exemplu, un total de doar 20 sau 30 de cazuri). În plus cele două grupuri nu trebuie neapărat să conţină un număr egal de cazuri. Chiar şi în cercetările planificate cu mare grijă, de exemplu cele asupra eficacităţii unui tratament, există oameni care renunţă înainte ca studiul să fie terminat. Aceasta conduce la o situaţie în care există mai multe cazuri într-un grup decât în altul. Discrepanţa dintre dimensiunea celor două grupuri este automat controlată de formula lui t.
86
9.2. Logica statisticii t Testul t, asemenea altor teste statistice, este folosit pentru a ne ajuta să determinăm dacă o legătură aparentă dintre două variabile este o legătură adevărată, care există în interiorul populaţiei, sau este rodul şansei. Cu t, se face de fapt o comparare între două medii. Eşantionul este divizat în două grupuri (sub-eşantioane) pe baza valorii fiecărui caz pentru una din cele două categorii, variabila de nivel nominal (de exemplu, intervenţia A sau intervenţia B). Mărimile mediilor variabilei de nivel interval (sau de rapoarte) pentru cele două grupuri sunt comparate apoi folosind formula lui t. Mediile celor două subeşantioane sunt probabil diferite; t este o analiză a mărimii acestei diferenţe. Dacă diferenţa se dovedeşte ca fiind mică din punct de vedere matematic, atât de mică încât hazardul ar putea fi explicaţia probabilă pentru această diferenţă, ipoteza nulă nu va putea fi respinsă. Vom putem atunci concluziona că, mult mai probabil, diferenţa dintre mediile celor două grupuri se datorează şansei şi nu reflectă o diferenţă reală care ar exista în populaţie. Dar dacă testul nostru t, indică faptul că diferenţa este destul de mare ca ea să nu fie explicată doar prin jocul şansei, vom fi abilitaţi să respingem ipoteza nulă si să concluzionăm că diferenţa observată în eşantion este într-adevăr o reflectare a unei diferenţe reale în interiorul populaţiei. Şansa, sub forma erorii de eşantionare, va fi eliminată ca explicaţie pentru o legătură observată între două variabile. Dacă eşantionul este mic, chiar şi o diferenţă mare între două medii poate fi atribuită şansei. Dar există un punct unde diferenţa dintre doua medii este suficient de mare, astfel ca şansa să fie puţin probabil, o explicaţie pentru legătura aparentă dintre două variabile. Unde poate fi găsit acest punct? Testul t ni-l spune. Acest punct se determină sub forma unei probabilităţ statistice, probabilitatea de a face o eroare de tipul I, adică de a respinge ipoteza nulă şi de a concluziona că diferenţa dintre cele două medii este legată de prezenţa valorilor diferite pentru variabila secundară (cea de nivel nominal). Să luăm un exemplu pentru a ilustra utilizarea lui t. Un ghid teoretic de studiu a fost realizat pentru a ajuta la pregătirea absolvenţilor pentru examenul de licenţă. Pentru a evalua rezultatele unui asemenea ghid de studiu, putem selecta la întâmplare 15 din 30 de studenţi care au planificat să participe la examen şi cărora le vom furniza o copie a acestui ghid. Le vom da astfel câteva direcţii specifice pentru a-şi împărţi timpul de studiu, fiecare putând folosi ghidul ca îndrumător. Cei 15 studenţi care au folosit ghidul vor putea fi priviţi ca un grup experimental, rămânând 15 care nu au folosit ghidul şi care vor fi priviţi ca şi grup de control. După ce cei 30 de abolvenţi vor reuşi să promoveze examenul de licenţă, rezultatele lor vor fi comparate. Nu vom compara direct notele tuturor acelora care au folosit ghidul de studiu cu notele celor care nu l-au folosit. În schimb vom compara media notelor rezultate pentru cei 15 absolvenţi din grupul experimental cu media notelor celorlalţi 15 absolvenţi din grupul de control. Odată cu compararea mărimilor celor două medii, este necesar să ne punem câteva întrebări: Este oare diferenţa dintre mediile celor două grupuri suficientă pentru a ne permite să respingem ipoteza nulă, care spune că nu există nici o legătură între folosirea respectiv nefolosirea ghidului de studiu şi rezultatele lor la examen?
87
Cât de încrezători putem fi, pentru a spune că diferenţa nu s-a datorat erorii de eşantionare? Altfel spus, este posibil ca diferenţa dintre mediile celor două grupuri să reflecte o asociere reală între cele două variabile? Cu ajutorul testului t putem compara mărimile celor două medii, folosind o formulă matematică concepută pentru a ne spune dacă diferenţa dintre mărimile mediilor celor două grupuri este suficient de mare pentru ca legătura dintre cele două variabile să fie puţin probabilă din cauza şansei. Testul t ne spune dacă ipoteza nulă poate fi respinsă şi dacă există suport statistic pentru a susţine că ghidul de studiu poate în mod real îmbunătăţi rezultatele la examen. Desigur, chiar dacă se demonstrează că există o legătură statistic semnificativă între cele două variabile, va mai trebui să decidem dacă legatura este una substanţială. Diferenţa rezultată din examinare este suficient de mare ca să justificre preţul de achiziţie a ghidului de studiu?
9.3. Calcularea şi interpretarea valorilor lui t Datorită extinderii utilizării calculatoarelor în facultăţi, în agenţiile de servicii sociale şi chiar în multe familii, aflarea lui t nu mai este o problemă în ceea ce priveşte calculul matematic. Aceast fapt este o uşurare, deoarece formula lui t este complexă şi va implica o cantitate considerabilă de timp dacă se lucrează cu creionul şi hârtia. Pentru cititorii care găsesc că este mai uşor să înţeleagă cum este aplicată formula lui t urmărind pas cu pas procedura, am inclus Figura 9.1 . Veţi observa că testul t implică mult mai mult decât o simplă comparare de medii. De fapt, el compară variabilitatea rezultatelor intergrupuri cu variaţia rezultatelor din interiorul grupurilor. Complexitatea analizei lui t (datorită faptului că toate mărimile brute sunt folosite în calcularea sa) explică de ce este un test atât de puternic pentru examinarea unei legături aparente dintre două variabile. Nivelul de probabilitate al unei valori t este determinat în pasul 7 al Figurii 9.1. În eşantionul din exemplu, valoarea lui t este 1,90 (Pasul 5) şi gradul de libertate este 8 (Pasul 6). Întrebarea este: "Care este probabilitatea de a comite o eroare de tipul I cu o valoare a lui t de 1,90, la 8 grade de libertate date?" Pentru a răspunde la această întrebare, avem nevoie să consultăm tabelul de probabilităţi al valorilor t, din tabelul 9.1. Valoarea lui t pentru eşantionul din Figura 9.1 (1,90) este statistic nesemnificativă (la nivelul 0.05) pentru un test cu o ipoteza nedirecţiontă (two-tailed), dar este statistic semnificativă la nivel 0.05 pentru un test direcţionat (one-tailed). Aşa cum indică Tabelul 9.1, dacă valoarea t este cuprinsă între 2.306 şi 2.895 (cu 8 grade de libertate), nivelul probabilităţii p va fi semnificativ la nivelul de 0.05 pentru o ipoteză nedirecţionată şi la nivelul 0.025 pentru o ipoteza direcţionată. Figura 9.1 Algoritmul de calcul al statisticii t pentru două subgrupuri PAS 1. Prezentarea datelor brute. Grup A Grup B Nume client Rezultat Nume client Rezultat Peter 5 Gary 0 Janice 15 Carol 5 Alice 25 Martha 10 Robert 35 Jeff 15 Rosalie 45 James 20
PAS 2.Calculul sumelor de la pasul 1. 88
Unde Na = Numarul indivizilor din grupul A Nb = Numarul indivizilor din grupul B Xa = Suma rezultatelor brute din grupul A Xb = Suma rezultatelor brute din grupul B Sa = Suma pătratelor rezultatelor brute din grupul A Sb = Suma pătratelor rezultatelor brute din grupul B N = Numarul total al indivizilor (Na + Nb) Substituind valorile în formule obţinem Na = 5 Nb = 5 Xa = 5 + 15 + 25 + 35 + 45 = 125 Xb = 0 + 5 + 10 + 15 + 20 = 50 Sa = 52 + 152 +252 + 352 + 452 = 25 + 225 + 625 + 1225 + 2025 = 4125 Sb = 02 + 52 + 102 + 152 + 202 = 0 + 25 + 100 + 225 + 400 = 750 N =5+5 = 10
PAS 3. Calculul mediilor pentru ambele grupe Stabilirea formulelor. Grup A Grup B Ma = Xa / Na Mb = Xb / Nb Unde: Ma = Media aritmetică a grupului A Mb = Media aritmetică a grupului B Substituind valorile în formulă obţinem Grup A Ma = 125 / 5 = 25
Grup B Mb = 50 /5 = 10
PAS 4. Calculul mediei pătratelor abaterilor valorilor faţă de media grupei (calculul varianţei) pentru ambele grupuri Stabilirea formulelor. Grup A Grup B SSa = Sa - Xa2 / Na SSb = Sb - Xb2 / Nb Unde: SSa = Suma patratelor abaterilor pentru grupul A SSb = Suma patratelor abaterilor pentru grupul B Substituind valorile în formule obţinem Grup A Grup B SSa = 4125 - 1252 / 5 SSb = 750 - 502 / 5 = 4125 - 15.625 / 5 = 750 - 2500 / 5 = 4125 - 3125 = 750 - 500 = 1000 = 250
89
PAS 5. Calculul valorii t Stabilirea formulei statisticii t Ma - Mb t = SSa + SSb Na + Nb Na + Nb - 2 Na * Nb Substituind valorile în formulă obţinem 25 - 10 t = 1000 + 250 5+5 5+5-2 5*5 15
=
1250 8 =
= = = =
10 25
15 156,25 * 0,4 15 / 62,5 15 / 7,9057 1, 8974 1,90
PAS 6. Calculul gradelor de libertate Stabilirea formulei gradelor de libertate df df = N - 2 Substituind valorile în formulă obţinem df = 10 - 2 = 8 (grade de libertate) PAS 7. Determinarea nivelului de probabilitate a valorii t obţinute a. Se utilizează valoarea t calculată (la pasul 5) şi gradele de libertate (pasul 6) b. Se utilizează Tabelul 9.1, “Valorile critice ale lui t” c. Se caută în linia corespunzătoare gradelor de libertate df (prima coloană a tabelului) d. Se compară valoarea t calculată cu valorile tabelate fie pentru testul direcţionat (one-tailed) fie pentru cel nedirecţionat (two-tailed).
90
Tabelul 9.1 Valori Critice pentru testul t Nivele de semnificaţie pentru testul direcţionat (one-tailed) 0.10 0.05 0.025 0.01 0.005 0.0005 Nivele de semnificaţie pentru testul nedirecţionat (two-tailed) df 0.20 0.10 0.05 0.02 0.01 0.001 1 3.078 6.314 12.706 31.821 63.657 636.619 2 1.886 2.920 4.303 6.965 9.925 31.689 3 1.638 2.353 3.182 4.541 5.841 12.941 4 1.533 2.132 2.776 3.747 4.604 8.610 5 1.476 2.015 2.571 3.365 4.032 6.859 6 1.440 1.943 2.447 3.143 3.707 5.959 7 1.415 1.895 2.365 2.998 3.499 5.405 8 1.397 1.860 2.306 2.896 3.355 5.041 9 1.383 1.833 2.262 2.821 3.250 4.781 10 1.372 1.812 2.228 2.764 3.169 4.587 11 1.363 1.796 2.201 2.718 3.106 4.437 12 1.356 1.782 2.179 2.681 3.055 4.318 13 1.350 1.771 2.160 2.650 3.012 4.221 14 1.345 1.761 2.145 2.624 2.977 4.140 15 1.341 1.753 2.131 2.602 2.947 4.073 16 1.337 1.746 2.120 2.583 2.921 4.015 17 1.333 1.740 2.110 2.567 2.898 3.965 18 1.330 1.734 2.101 2.552 2.878 3.922 19 1.328 1.729 2.093 2.539 2.861 3.883 20 1.325 1.725 2.086 2.528 2.845 3.850 21 1.323 1.721 2.080 2.518 2.831 3.819 22 1.321 1.717 2.074 2.508 2.819 3.792 23 1.319 1.714 2.069 2.500 2.807 3.767 24 1.318 1.711 2.064 2.492 2.797 3.745 25 1.316 1.708 2.060 2.485 2.787 3.725 26 1.315 1.706 2.056 2.479 2.779 3.707 27 1.314 1.703 2.052 2.473 2.771 3.690 28 1.313 1.701 2.048 2.467 2.763 3.674 29 1.311 1.699 2.045 2.462 2.756 3.659 30 1.310 1.697 2.042 2.457 2.750 3.646 40 1.303 1.684 2.021 2.423 2.704 3.551 60 1.296 1.671 2.000 2.390 2.660 3.460 1.282 1.645 1.960 2.326 2.576 3.291 Valoarea t obţinută din calcule este semnificativă dacă ea este mai mare sau egală cu valoarea listată în tabel
9.4. Prezentarea statisticii t Deobicei este util a prezenta mărimile brute ale cazurilor în ambele grupuri (dacă eşantionul nu este prea mare) astfel ca cititorii să poată face propriile comparări. Dacă nu dorim să raportăm rezultatele individuale, vom prezenta cel puţin rezultatele medii pentru fiecare grup. Trebuie reţinut ca diferenţa actuală între medii ajută cititorul în a determina dacă o legătură semnificativ statistică este în mod real un rezultat esenţial. Astfel vor mai fi prezentate pe lângă valoarea lui t, gradul de libertate (df) şi valoarea probabilităţii p asociate. Dacă se realizează mai multe teste t, este folositor un singur tabel care să conţină toate rezultatele obţinute. Dacă sunt 91
calculate doar puţine teste t, rezultatele sunt deobicei prezentate în corpul textului, mai degrabă decât într-un tabel. In majoritatea studiilor statistice, se raportează atât analizele care nu au permis respingerea ipotezei nule, cât şi cele care au permis-o. In unele cazuri este suficient să se raporteze că nu s-a găsit că variabilele ar fi legate la un nivel statistic semnificativ. In situaţiile în care ipoteza nulă este ipoteza centrală a cercetării (adică, încercăm să dovedim ca falsă o legatură care în mod obişnuit este crezută ca fiind adevărată), suportul statistic sau nesprijinirea pentru respingerea ipotezei nule trebuie, fireşte, să fie prezentat.
8.5. Când nu se foloseşte testul t Ca şi testul hi-pătrat, popularitatea testului t printre asistenţii sociali ne poate conduce la utilizări greşite. În graba noastră de a folosi o statistică care ne este familiară, putem folosi câteodată testele t în situaţii în care ele nu sunt corespunzătoare şi în care ar fi putut fi utilizate alte teste mai potrivite. De obicei când testul t este folosit greşit avem una din următoarele situaţii: (1) când ignorăm forma distribuţiei pentru variabila de nivel interval în populaţie şi (2) când nu suntem atenţi la analizarea corectă a informaţiilor, încercând să prezentăm un rezultat şocant. Forma distribuţiei
Faptul că variabila independentă este de nivel interval şi că cea dependentă este de nivel nominal nu justifică folosirea lui t pentru a determina prezenţa unei legături între două variabile. Testul t este un test din categoria celor parametrice, ceea ce înseamnă că este proiectat pentru a fi folosit doar când variabila de nivel interval este considerată ca fiind normal distribuită în populaţie. Dacă distribuţia de frecvenţe pentru valorile variabilei în populaţie este vizibil asimetrică, va trebui folosit un alt test, asemenea celor prezentate în capitolul următor (testul Mc Neamar, testul exact Ficher, testul Man-Whitney, etc.) Credibilitatea rezultatelor cercetării este serios periclitată dacă testul t este folosit cu variabile de nivel interval sau rapoarte care nu se prezintă ca o curbă normală. Abordarea şocantă
O a doua greşală obişnuită implică calcularea în serie a testelor t, cu o singură variabilă dependentă legată eventual de mai multe variable independente. In câteva exemple particulare ale acestei erori, cercetătorii au calculat testele t folosind sute de posibile variabile independente (fără prea mare legătură), doar pentru a anunţa cu mândrie că ei au găsit o legătură semnificativ statistică între una dintre variabilele independente şi variabila dependentă. Teoria probabilităţilor sugerează că astfel de rezultate reflectă probabil erori de Tipul I şi că legătura aparentă va fi legată de şansă şi nimic mai mult. Conform legilor probabilităţii, o variabilă dependentă va părea că are o asociere semnificativ statistică cu câteva variabile independente dacă sunt testate suficiente legături. In situaţiile unde există motive să credem că mai multe variabile independente diferite, pot fi în legătură cu variabila dependentă, ar trebui să folosim alte teste statistice, special proiectate pentru astfel de situaţii.
92
8.6. Exemplu din micro-practică Descrierea situaţiei care generează un studiu
Frank este un asistent social într-un centru de planificare familială. El a fost învăţat în agenţia sa că cea mai bună formă pentru consilierea maritală este de a vedea ambii parteneri (soţul şi soţia) împreună. Înainte cu cinci ani a tratat 20 de cupluri în care consilierea nu s-a putut face decât individual (soţ sau soţie), din cauza programului pe care îl aveau aceştia la servici. El a fost surprins observând că, cu toate că ei nu au consiliaţi niciodată împreună, după primele interviuri toate cele 20 de cupluri păreau să realizeze un progres excelent în rezolvarea problemelor lor maritale. De-a lungul a câţiva ani, Frank a consiliat tot mai multe cupluri pe o bază individuală. Crezând că a obţinut rezultatele bune datorită metodei folosite, el a încurajat şase dintre colegii săi să consilieze cuplurile cu dificultaţi maritale, întâlnindu-i separat mai degrabă decât împreună. Alţi asistenţi sociali au fost deasemenea surprinşi de progresele excelente ale clienţiilor lor. Frank nu a fost pregătit să concluzioneze că metoda de consiliere maritală individuală este preferabilă consilierii cuplului. El a decis să realizeze o mică cercetare pentru a vedea dacă poate găsi suport statistic pentru ipoteza că satisfacţia maritală este cel mai bine sporită când cuplurile sunt tratate în consiliere individual şi nu împreună. Ipotezele care vor fi testate A început să caute în literatura de specialitate de asistenţă socială şi a găsit suport pentru afirmaţia că consilierea împreună a cuplurilor este mai adecvată în obţinerea satisfacţiei maritale, decât cea individuală. Dar cum el s-a aventurat în literatura de specialitate din alte domenii ca psihologia şi consilierea pastorală, Frank a găsit o cantitate mare de suport pentru părerea că satisfacţia maritală ar fi mult mai probabil ca să rezulte din consilierea individuală. Explicaţia cea mai uzitată era că clienţii tind să discute despre insatisfacţie mai uşor şi mai cinstit atunci când celălalt soţ nu este prezent. Frank a concluzionat că literatura de specialitate era în contradicţie. Totuşi el a simţit că propriile observaţii şi cele ale colegilor săi au fost suficiente pentru a înclina balanţa suficient pentru a justifica o ipoteză direcţională: Printre cuplurile ce au primit consiliere maritală, acelea care au fost consiliate individual vor reflecta un nivel mai înalt de satisfacţie maritală decât acelea care au fost consiliaţi împreună. O privire asupra metodologiei
Frank a realizat o mică cercetare pentru a-şi testa ipoteza. El a primit permisiunea din partea directorului agenţiei pentru a-i fi repartizaţi la întâmplare clienţii noi care au cerut consiliere maritală pe o perioadă de trei luni pentru a realiza consiliere individuală sau de cuplu. Pentru a realiza cercetarea, clienţii au fost repartizaţi la întâmplare în două grupuri de subiecţi. Toţi cei şase asistenţi sociali care au folosit anterior consilierea individuală (şi care deci aveau experienţă) au participat ca şi consilieri la studiul lui Frank. Incepând cu luna următoare fiecare cuplu care erau de acord a fost repartizat la unul dintre cei şase asistenţi sociali pentru a fi văzuţi împreună la o consiliere de 50 de minute pe săptămână; cuplurile care au rămas au fost repartizate pentru a fi văzute individual timp de 25 de minute fiecare în fiecare lună. Cei ce nu au fost de acord cu acest aranjament au fost deasemenea trataţi, dar nu au mai fost incluşi ca subiecţi în acest studiu de cercetare. Metoda de consiliere (individuală sau în cuplu) a fost variabila independentă. S-a decis că variabila dependentă, satisfacţia maritală, va trebui măsurată dupa zece
93
săptămâni consecutive de consultanţă. A fost aleasă o scală pentru a măsura gradul satisfacţiei maritale, ea fiind adaptată pentru a produce informaţii de nivel interval. Paisprezece cupluri au fost văzute în sesiuni de consiliere individuală şi paisprezece au fost văzuţi ca şi cuplu. Toţi clientii au completat scalei satisfacţiei maritale. Frank a comparat mărimea mediei scalei pentru clienţii care au fost văzuţi individual (grupul experimental) cu mărimea mediei scalei pentru clienţii care au fost văzuţi ca şi cuplu (grupul de control). Variabila "satisfacţie maritală" măsurată pe scală a fost găsită ca fiind normal distribuită, deci Frank s-a simţit în măsură să folosească testul t pentru analiza statistică. El a încercat să determine dacă diferenţa dintre mărimile mediei (pentru cele două grupuri) a fost suficient de mare pentru a-i permite să respingă ipoteza nulă. El a dorit să fie capabil să concluzioneze că o legătură reală dintre două variabile a fost probabil explicaţia pentru diferenţele observate în eşantion. Rezultatele
Valoarea lui t pentru informaţiile lui Frank, a fost de 1.312 . Din tabelul valorilor critice ale lui t (Tabelul 9.1), el a observat că ar fi avut nevoie de o valoare minimă pentru t de 1.706 pentru a putea respinge ipoteza nulă (folosind o statistică semnificativă de la nivel 0.05, un eşantion de 28 indivizi statistici şi 26 de grade de libertate, având o ipoteză direcţională). Interpretarea rezultatelor şi tragerea concluzilor
Frank a notat că dacă ar fi respins ipoteza nulă pe baza informaţiilor lui, el ar fi desconsiderat mai mult decât 1 din 10 (10 procente) şanse în comiterea unei erori de Tip I. El avea în mod clar o lipsă de suport statistic pentru ipoteza sa. Dezamăgirea lui iniţială a fost chiar şi mai mare atunci când a privit la mărimile mediilor celor două grupuri. Clienţii care au participat la consiliere individual au avut media cu ceva mai mică decât a fost cea pentru cei care au fost consiliaţi împreună. Frank a privit rezultatele sale cu mai multă obiectivitate. Astfel el a realizat că lipsa argumentului statistic pentru legătura dintre metoda de consiliere şi satisfacţia maritală, poate fi un rezultat folositor pentru sine însuşi. Imposibilitatea de a respinge ipoteza nulă poate fi interpretată ca însemnând că există diferenţe prea mici determinate de metoda de consiliere folosită. Frank deasemenea şi-a pus problema cum de a putut greşi. Rezultatele cantitative din studiul său au fost inconsistente în ceea ce priveşte impresiile anterioare. El s-a întrebat dacă el sau alţi asistenţi sociali nu cumva au perceput doar că consilierea individuală făcută de ei duce la rezultate superioare, pentru că ei au fost surprinşi că ceilalţi clienţi consiliaţi în cuplu au putut obţine rezultate superioare. Fireşte el deasemenea s-a întrebat dacă ipoteza sa poate fi încă corectă. S-ar putea ca adevărata legătură dintre variabila dependentă şi cea independentă să fi fost ascunsă de tehnica măsurătorilor sau de influenţa altor variabile (de exemplu experienţa mare a asistenţilor sociali care au efectuat consilierea cuplului). Frank a concluzionat că sunt necesare studii suplimentare pentru a rezolva dilema. Legarea rezultatelor de practică
Inainte ca studiile viitoare să se realizeze, Frank s-a întrebat ce utilizare practică să dea rezultatelor sale. In timpul următoarei întâlniri cu personalul agenţiei el a avut timp să prezinte rezultatele studiului său. El a fost capabil să traseze implicaţiile pe care le poate avea studiul său pentru practica de asistenţă socială în interiorul agenţiei. Aşa cum în mod obişnuit se întamplă în cercetarea în asistenţă socială, studiul său a generat mai multe întrebări decât răspunsuri. Totuşi aceste întrebări au servit la focalizarea atenţiei personalului pe domeniile potenţial
94
productive ale cercetării. Bazându-se pe propriile rezultate, Frank şi alţi membrii ai personalului, au început să-şi pună urmatoarele întrebări: 1. Datorită faptului ca tipul de consiliere (individual sau în cuplu) poate avea puţin sau nici un efect în sporirea satisfacţiei maritale, este necesar ca să se facă eforturi pentru a încuraja clienţii să participe în cuplu la consiliere, chiar dacă ei par a se împotrivi sau dacă programul lor de la servici reprezintă o dificultate pentru întâlnirile în cuplu? 2. Poate implicarea ambilor parteneri în consiliere să continue câteodată să fie o condiţie esenţială pentru consiliere sau trebuie ca politica agenţiei să fie schimbată? 3. Trebuie alocate resurse pentru un program de dezvoltare a personalului cu scopul de a forma asistenţii sociali specialişti în consilieriea individuală în tratamentul problemelor maritale? 4. Este necesar ca personalul să dezvolte un singur model de tratament care să combine consilierea individuală cu cea de cuplu, sau trebuie ca personalul profesionist să i se permită libertatea de a alege formula de consiliere pe care el o preferă spre utilizare? Aceste întrebări (şi multe altele) au reieşit din problemele care au afectat profesioniştii asistenţi sociali şi din problemele care au fost legate de politicile agenţiei. Principala valoare a studiului lui Frank a fost de a pune în cauză practicile necontestate din interiorul agenţiei şi a încurajat pe fiecare membru al personalului pentru a justifica sau pentru a lăsa deoparte practicile bazate pe explicaţii nevalidate. Chiar dacă nu au rezultat schimbări, asistenţii sociali vor trebui să practice pe o bază teoretică deja existentă, până când rezultatele cercetărilor ulterioare nu vor furniza un răspuns definitiv la întrebări.
9.7. Exemplu din macro-practică Descrierea situaţiei care generează un studiu
Nan este şefa serviciului social al unei mari agenţii de sănătate. În rolul ei profesional, ea supervizează serviciile de asistenţă socială oferite în 50 de oficii districtuale de sănătate din interiorul statului. I-a fost adus recent la cunoştiinţă că agenţia are probleme serioase cu plecarea personalului de asistenţă socială. O examinare preliminară a datelor agenţiei a relevat că problema era reală şi că părea a fi normal distribuită printre cele 50 de birouri de district. Nan a vorbit cu şeful de personal, responsabil cu conducerea interviurilor pentru angajaţii care părăseau agenţia. La început acesta a preferat să nu sugereze motivele posibile pentru care atât de mulţi asistenţi sociali şi-au dat demisia. Dar după ce Nan l-a asigurat că nu plănuia să-l pună să identifice asistenţii sociali care i s-au plâns, el a explicat că motivele date de către asistenţi pentru a părăsi agenţia păreau a fi asemănătoare. El a afirmat că “mulţi” păreau a fi fost total frustraţi de lipsa de autonomie în luarea deciziilor. În timp ce ei recunoşteau că în unele probleme profesionale şi administrative deciziile finale trebuie să aparţină supervizorilor, ei nu vedeau nici un motiv pentru care multe alte decizii nu puteau fi luate de către ei înşişi. După aceea, Nan s-a gândit la ceea ce i s-a spus. În timp ce prima ei reacţie a fost de enervare pe supervizorii districtului pentru modul autocratic în luarea deciziilor, ea şi-a reamintit că trebuie să-şi asume o mare din responsabilitate pentru stilul propriu de supervizare, care funcţiona atât de bine la nivelul persoanelor din
95
secretariat. A angajat apoi formatori din afara agenţiei şi a cerut tuturor supervizorilor districtului să participe la cursurile privind folosirea autorităţii în faţa personalului. Ea însăşi a participat activ la întâlniri făcând în mod regulat comentarii asupra eficacităţii abordărilor discutate. Aparent supervizorii răspundeau pozitiv la mesajele lui Nan că folosirea extensivă a autorităţii asupra personalului este un semn al unei bune supravegheri. Consultându-şi doar asistenţii sociali cu care lucrau, fără ca să le se permită să ia decizii sau să le implementeze, supervizorii s-au complăcut în a urma directivele date de Nan. Ipoteza ce urmează a fi testată
Nan a ştiut că avea nevoie de o modalitate obiectivă de a determina dacă nivelul de autonomie al asistenţilor sociali în luarea deciziei este legată de plecarea lor din agenţie. Ea nu a dorit să se încreadă în impresiile însărcinatului cu personalul fară a se convinge personal. Ea nu dorea să încerce să-i ajute pe toţi supervizorii ei să devina mai liberali în luarea deciziilor până ce nu era absolut sigură că există o legătură între cele două variabile. Ea a decis să realizeze o cercetare pentru a testa ipoteza: Rata demisiei personalului va fi mai scăzută într-un mediu de luare a deciziilor democratic decât într-unul autocratic. O privire asupra metodologiei
Nan ştia că literatura de specialitate recentă, despre folosirea cercurilor de calitate, propunea ca şi cale de rezolvare a unor probleme administrative luarea deciziilor în urma unui proces de grup. Concepţia este caracteristică metodelor de conducere ale “Teoriei Z“, folosită cu foarte mult succes în Japonia de foarte mulţi ani. Deoarece Nan cunoştea mai de mult teoria cercurilor de calităte, ea a văzut acum o bună ocazie pentru a o încerca. Cercurile de calitate i s-au părut a fi o bună operaţionalizare a unei modalităţi mai democratice de luare a deciziilor în birourile districtuale. Nan a ales la întâmplare 10 districte pentru a-i servi ca şi grup experimental. După aceea ea a acordat timp supervizorilor din cele zece districte să frecventeze nişte antrnamente (workshop-uri) de folosire a cercurilor de calitate. Ea a spus supervizorilor că aşteaptă de la ei să implementeze cercurile de calitate în cadrul supervizării lor şi a cerut un raport asupra metodelor de implementare ca să se asigure că acestea au fost puse în practică. Ei au fost rugaţi să nu împărtăşească propriile experienţe cu alţi supervizori. În acelaşi timp Nan a selectat la întâmplare alte zece districte care să constituie grupul de control. Supervizorilor din cele zece districte nu le-a fost dat un antrenament suplimentar şi nici informaţii noi; ca de exemplu cum trebuie să se descurce cu luarea deciziilor în interiorul grupurilor de lucru. După un an, Nan a calculat rata medie a plecărilor din district pentru grupul experimental şi pentru grupul de control. Ea a considerat două categorii de nivel nominal pentru variabila independentă: mediul de luare a deciziilor (democratic şi autocratic). Variabila dependentă, rata demisiei, era de nivel rapoarte. Condiţiile păreau să fie îndeplinite pentru folosirea testului t şi ar fi putut obţine suport statistic pentru ipoteza sa direcţională. Rezultatele
Valoarea t obţinută din datele lui Nan a fost 1,992. Ea a determinat 18 grade de libertate (10+10-2 = 20-2 = 18). Folosind tabelul valorilor critice ale lui t (vezi Tabelul 9.1) ea a remarcat că, pentru linia corespunzătoare la 18 grade de libertate, valoarea lui t a căzut între valorile 1,734 şi 2,100 . Ea s-a uitat la capul de tabel în 96
dreptul valorii din stânga (1,734) şi a observat că nivelul de semnificaţie se situează la 0,05 pentru o ipoteză direcţională şi la 0,10 pentru o ipoteză nedirecţională. Probabilitatea p (de a greşi respingând ipoteza nulă de egalitate a mediilor) corespunzătoare datelor sale a fost deci mai mică decât 0,05. Interpretarea rezultatelor şi tragerea concluziilor
Din cunoştiinţele ei de statistică, Nan a ştiut că a găsit suport statistic pentru ipoteza sa. Ea a ştiut că respingând ipoteza nulă, are mai puţin de cinci procente şanse pentru producerea unei erori de Tipul I (doar pe baza probabilităţii statistice). Ea a fost deasemenea încântată să vadă că legătura era în direcţia prezisă; media ratei celor plecaţi din oficiile districtului pentru grupul experimental a fost mai scăzută decât media celor plecaţi din oficiile districtelor grupului de control. Pentru ca studiul ei a fost foarte limitat în privinţa extinderii, Nan a fost şovăitoare în a privi propriile rezultate ca o aprobare fără echivoc a cercurilor de calitate sau a altor metode mai democratice de "rezolvare de probleme / luare de decizii”, ca metodă de reducere a demisiilor personalului de asistenţă socială. Ea a recunoscut că ar fi fost precipitat din partea ei să procedeze la implementarea rezultatelor sale luându-le ca o legătură simplă cauză-efect. Planul simplist al cercetării sale nu a eliminat nici influenţele posibile, nici alte variabile care ar explica diferenţa între rata demisiilor în cele două grupuri de birouri districtuale. Cu siguranţă se pot pune întrebări şi asupra metodologiei. De exemplu, cât de pozitiv a influnţat trainingul, adică posibilitatea de a pleca în afara statului, moralul supervizorilor din cadrul grupului experimental? Probabil ei s-au întors într-o stare sufletească mai bună şi mai tentaţi să ia în considerare părerile subordonaţilor. Dacă a fost aşa, aceasta ar fi fost o mai bună explicaţie pentru pentru rata scăzută a demisiei, decât implementarea cu succes a cercurilor de calitate. Sau poate că asistenţii sociali i-au privit pe supervizorii din grupul experimental cu mai multă consideraţie pentru că făceau un efort de încerca ceva nou? Dacă a fost aşa, şi acesta ar fi putut fi un factor major pentru reducerea ratei demisiei. Nan a început prin a-şi pune întrebări în lumina rezultatelor cercetării sale: 1. Cum pot să îmi potrivesc stilul de supervizare în raport cu supervizorii districtelor în aşa fel încât să nu le comunic neintenţionat că aştept extinderea autorităţii lor în supravegherea asistenţilor sociali? 2. Cum pot să ajut supervizorii districtelor să identifice deciziile care sunt potrivite a fi luate printr-un procedeu democratic şi cum să-i fac să se simtă mai confortabil în folosirea acestui procedeu. 3. Cum pot să ajut supervizorii districtelor să identifice deciziile care nu sunt corespunzătoare a fi luate prin procedeu democratic (de exemplu, problemele personale) şi să folosească autoritatea lor de şefi şi alte procedee mai puţin democratice fară a răni moralul lucrătorilor? 4. Ce metode de procedee democratice, în afara cercurilor de calitate, vor ajuta asistenţii sociali să simtă că pot avea mai multă iniţiativă în decizii dacă ei posedă cunoştiinţele tehnice necesare? 5. Ar fi oare de recomandat să se trimită toţi supervizorii districtelor la şedinţe de training de cercuri ale calităţii? 6. Ce alte cercetări ar putea fi proiectate pentru a furniza suport suplimentar pentru concluzia mea că decizia democratică este asociată cu o rată scăzută a demisiei personalului?
97
După ce s-a gândit la aceste întrebări şi la altele care reieşeau din studiu, Nan împreună cu colegii ei care erau administratori de asistenţă socială au discutat ideile ei pentru implementarea rezultatelor pentru alte probleme ale agenţiilor. Apoi ea a hotărât un plan de acţiune. La următoarea întâlnire a tuturor supervizorilor Nan a împărtăşit rezultatele sale din cercetare. Ea şi-a reafirmat poziţia în utilizarea autorităţii date de poziţia de conducător în anumite situaţii dar a vorbit şi despre convingerea că asistenţii sociali de la toate nivelele sunt profesionişti care trebuiesc implicaţi în luarea deciziilor. Ea a subliniat ca ea crede că folosirea excesivă a supervizării autocratice poate răni moralmente, şi chiar mai important, nu aduce avantaje în expertizarea problemelor de rezolvat. Pentru a pune în aplicare aceste gânduri a cerut unui membru al grupului experimental să utilizeze o parte din întâlnirea de supervizare următoare pentru a-i invăţa pe toţi supervizorii (inclusiv pe ea însăşi) principiile de bază ale cercurilor de calitate. La întâlnire şi ceilalţi nouă supervizori care au utilizat această metodă au fost provocaţi să-şi povestească experienţele. Nan s-a convins că anumite decizii sunt mai bine de luat în comun de către supervizorii districtuali şi personalul (staf-urile) lor. La o altă întâlnire ea a subliniat această convingere. Dar ca să fie consecventă, ea a permis fiecăruia să decidă personal dacă să frecventeze cercurile de calitate pentru a-şi îmbunătăţi tehnica luării deciziilor în district sau dacă să-şi dezvolte un plan propriu (cu aprobarea ei) în vederea democratizării luării deciziilor. În final Nan şi-a alocat timp pentru a dezvolta o analiză mai cuprinzătoare şi mai riguroasă a problemei fluctuaţiilor de personal. Studiul va examina alţi factori (în plus faţă de procesul luării deciziilor) pe care i le-a sugerat literatura legată de moralul şi fluctuaţia personalului. Ea speră ca, în ultimă instanţă, rezultatele studiului de întindere mai mare să poată fi generalizate la alte domenii de asistenţă socială şi ca raportul final să poată fi publicat într-o revistă de specialitate.
9.8. Rezumat Acest capitol a prezentat cum se utilizează un test statistic popular care compară mediile a două eşantioane, testul t. S-a subliniat în mod particular importanţa lui în cercetarea în asistenţă socială. Exemplele practice descrise au ilustrat că chiar dacă testul t este utilizat în principal în cercetări majore el este valabil şi în preliminarii, în eforturi limitate. Exemplele din micro- şi macro-practică, văzute în lumina celor spuse în capitolele precedente, mai dovedesc încă ceva. Cititorul va remarca că rezultatele statistice care au fost găsite pe baza unor ipoteze au valori practice la diferitele nivele ale muncii de asistenţă socială. Chiar dacă un studiu bine proiectat şi implementat şi a cărui teste statistice au fost corect conduse, eşuează în a oferi suport pentru ipotezele statistice el este totuşi util în practică. Se insistă asupra faptului că cercetătorii conştiincioşi care utilizează bunul simţ în interpretarea rezultatelor lor nu pot pierde. Ei vor îmbogăţi corpul de cunoştinţe disponibile pentru practica asistenţei sociale, chiar dacă nu vor obţine niciodată suport statistic pentru o ipoteză direcţionată sau nedirecţionată.
9.9. Intrebări pentru studiu 1. Care este combinaţia de nivele de măsurare a variabilelor utilizate în testul t?
98
2. De ce dimensiunile cerute de tesul t pentru volumul eşantionului şi a subeşantioanelor îl fac ideal pentru cercetările în asistenţă socială? 3. Dacă ipoteza nulă este corectă, valoarea medie a variabilei din eşantion va fi similară sau foarte diferită de valoarea medie a variabilei din celălalt eşantion? 4. Când erorile de eşantionare sunt mai probabil să genereze o diferenţă de 5 ani între vârstele medii a studenţilor din două secţiuni ale unui curs: dacă acestea au câte 10 studenţi fiecare sau dacă au 25? 5. De ce formula lui t sugerează că testul poate fi utilizat numai cu o distribuţie normală? 6. Ce determină gradele de libertate pentru statistica t, într-un set de date concrete? 7. Ce pas suplimentar este necesar în a determina dacă o valoare t semnificativă din punct de vedere statistic oferă suport pentru o ipoteză direcţionată? 8. Ce strategie ar trebui să utilizeze un cercetător pentru a raporta o analiză statistică care a utilizat testul t şi care nu a putut furniza suport statistic pentru o ipoteză? 9. Cum poate un test t care nu a găsit o valoare semnificativă statistic să reflecte un rezultat care să fie util pentru un practician? 10. Cum au utilizat cercetătorii mai multe proceduri diferite t pentru o singură variabilă dependentă pentru a produce “rezultate” derutante?
99
Capitolul 10. Alte teste statistice Ultimele trei capitole au furnizat o privire detailată asupra a trei teste care sunt extrem de folositoare pentru cercetarea în asistenţă socială. De fapt, o parte importantă a tuturor cercetărilor de asistenţă socială folosesc hi2, r (coeficientul de corelaţie Pearson), şi testul t (Student) în analiza statistică. Câteodată, aceste teste sunt folosite fie că sunt potrivite, fie că nu, scăzând astfel credibilitatea studiului de cercetare. În capitolul de faţă vom menţiona pe scurt alte câteva teste statistice care apar destul de frecvent în literatura de specialitate. Ele constituie o listă reprezentativă, nu exhaustivă, a alternativelor la cele trei teste prezentate până acum. Informaţiile despre aceste teste nu vor fi detailate, dar cititorii vor putea afla tot ceea ce au nevoie pentru a le putea folosi. Nu vor fi prezentate formule. Numai într-o singură discuţie (prima) există un exemplu despre cum sunt prezentate deobicei rezultatele şi asta pentru a clarifica cele prezentate în text. Obiectivul acestei scurte prezentări care va urma, este informarea despre cum lucrează aceste teste şi despre tipurile de situaţii de cercetare în care pot fi utilizate. Pentru a lua decizia finală privind oportunitatea folosirii testului şi cerinţele suplimentare necesare, cititorul va trebui să consulte alte lucrări pentru documentare.
10.1. Alternative pentru testele de asociere Hi2, favorit pentru orice asistent social, nu este potrivit pentru toate analizele statistice care implică variabile de nivel nominal; astfel dimensiunea eşantionului sau independenţa eşantionului pot obliga cercetătorul să caute alte teste. Vom examina pe scurt două dintre ele. Testul McNemar Acest test (cunoscut şi ca test pentru semnificaţia schimbării) este utilizat pentru “eşantioane legate“. El este cel mai utilizat în cercetările care angajează un plan iniţial şi unul final, deci două mărimi diferite ale unei aceleaşi variabile pentru aceiaşi subiecţi, obţinute la două momente de timp diferite. Este frecvent utilizat pentru a determina dacă un anume tip de intervenţie a avut sau nu efect. De exemplu, prezenţa unui program educaţional a fost sau nu asociată cu vreo schimbare în comportament sau atitudine? În practica asistenţei sociale, ne punem deseori întrebarea dacă o intervenţie a avut sau nu în final vreun efect. Fireşte, suntem interesaţi pentru o schimbare într-un anumit sens. Dar din cauza existenţei atâtor variabile care pot influenţa comportamentul clientului, adesea nu mai putem spune cu certitudine cum pot serviciile de asistenţă socială influenţa schimbările dorite. Testul McNemar poate, cel puţin, să producă un indicator care să arate prezenţa (sau absenţa) asocierii dintre “tratament “ şi schimbare. Exemplu Un asistent social, Carlos, a solicitat permisiunea de a expune la o întâlnire a unui grup de părinţi, părerea sa în favoarea angajării a patru noi asistenţi sociali pentru acel district. El s-a întrebat dacă părinţii vor fi influenţaţi de argumentele sale sau ei le vor asculta numai din politeţe. Sau poate că nu-l vor asculta deloc; gândinduse la ceea ce vor face la sfârşitul săptămânii, de exemplu. Înainte ca să ia din nou cuvântul în seara următoare, la întâlnirea unui alt grup de părinţi, el avea nevoie să
100
ştie dacă prima sa expunere a fost asociată cu schimbare dorită de el, în modul de gândire al părinţilor. Au fost testate părerile părinţilor în legătură cu problema angajată, înainte şi imediat după expunerea lui Carlos. Astfel părinţii au servit şi ca grup de control. Carlos a luat cele două seturi de măsurători şi le-a plasat într-un tabel 2x2, cu o singură variabilă (ca cel folosit pentru hi2). După aceea el a folosit formula potrivită şi a verificat tabelul pentru a vedea dacă există suport statistic pentru eliminarea ipotezei nule. Numerele plasate de Carlos în celulele tabelului reprezintă numărul cazurilor (frecvenţele absolute) (vezi Tabelul 10.1). Dacă, de exemplu, înaintea expunerii, d-l Brown a fost favorabil angajării asistenţilor sociali, iar după audiere el şi-a schimbat opinia, el va fi reprezentat ca unul din cele 13 cazuri din celula din colţul dreapta-jos (d). Testul McNemar caută schimbarea. Celulele a şi d reprezintă schimbarea; celulule b şi c reflectă nemodificarea poziţiei dintre momentul dinaintea şi cel de după expunerea lui Carlos. Testul nu ţine cont, de fapt, de cazurile în care schimbarea nu s-a produs. Astfel ţinta analizei vor fi celulele a şi d. Şansa (ipoteza nulă) afirmă că schimbarea poate surveni în anumite cazuri chiar dacă expunerea lui Carlos nu ar fi avut efect, dar totuşi tot ea spune că întâmplarea poate sta la baza schimbărilor într-un anumit sens pentru jumătate din cazuri şi în sens opus pentru cealaltă jumătate de cazuri. Tabelul 10.1 Presentare tabelară a testului de semnificaţie pentru analiza schimbării (Testul McNemar) După Înainte Pentru Împotrivă Total Împotrivă 5 (a) 4 (b) 9 Pentru 3 (c) 13 (d) 16 Total 8 17 25 2 x = 4.50, df = 1, p < .025 Statistic, testul McNemar caută să determine dacă ipoteza nulă poate fi respinsă prin demonstrarea că schimbările preponderente s-au produs într-o anumită direcţie. Carlos a putut astfel să respingă ipoteza nulă. Din păcate, direcţia indicată a legăturii arată că prezentarea sa este asociată mai mult cu schimbări în sens negativ (părinţii întorcându-se împotriva propunerii). Doar 7 părinţi nu şi-au schimbat părerile (celulule b şi c). Dar din cei 18 care şi le-au schimbat (celulele a şi d), doar 5 au trecut de la o atitudine negativă la una pozitivă (a), în timp ce 13 (d) care anterior erau favorabili ideii, s-au opus ei după prezentare. Demonstraţia semnificaţiei statistice a schimbării de atitudine indusă de prezentarea lui Carlos a fost un gir pentru schimbarea produsă, dar nu în sensul schimbării dorite de Carlos. A spus el oare ceva care să fi întors opinia părinţilor împotrivă, din moment ce atât de mulţi par să fie negativ afectaţi ? Aşa cum putem observa, testul McNemar este destul de limitat. El cere îndeplinirea câtorva condiţii privind mărimea şi tipul eşantionului şi se potriveşte cel mai bine când situaţia implică variabile de nivel nominal, culese înainte şi după experiment. In concluzie, este un test util pentru cercetătorii din asistenţa socială. Testul Exact Fisher Testul exact Fisher, ca si hi2, se utilizează când există două eşantioane independente. Eşantioanele independente trebuie să fie rezultatul unor procedee 101
aleatoare de eşantionare pentru identificarea celor două grupuri (de exemplu cosiliere individuală şi de grup). Principalul avantaj al testului exact Ficher, faţă de hi2 este că el poate fi utilizat şi atunci când volumul eşantionului este prea mic pentru hi2. El este deasemenea foarte potrivit pentru analiza datelor dintr-un tabel de contingenţă 2x2 adică atunci când există doar două valori posibile pentru fiecare din cele două variabile de studiat (variabile dihotomice), sau atunci când trei sau mai multe categorii a unei variabile pot fi grupate într-un tabel 2x2. Exemplu Joyce este un supervizor asistent social într-o agenţie de protecţia copilului. În cursul unei săptămâni recente lucrătorii ei au investigat 27 de cazuri în care se invoca abuz sexual. 20 de cazuri au fost închise din lipsă de dovezi. 18 din ele au fost investigate de asistenţi sociali bărbaţi. Ea a devenit preocupată de ideea dacă nu cumva s-au grăbit asistenţii sociali bărbaţi să închidă cazurile? Există oare o asociere între genul lucrătorilor sociali şi decizia de a închide cazurile raportate de abuz sexual? Joyce a plasat informaţiile într-un tabel, asemanător Tabelului 10.1. Analiza datelor a confirmat suspiciunea ei. Joyce a putut să dovedească existenţa unei asocieri statistic semnificative între genul lucrătorilor şi situaţia cazurilor de închidere sau nu a cazurilor. Supervizorii bărbaţi (conform datelor dintr-o lună) au fost aparent mai înclinaţi să închidă cazurile decât femeile. Fenomenul ar merita investigaţii suplimentare. Testul exact Fisher este ideal pentru nevoile unei cercetări ca aceea a lui Joyce. Pentru că se limitează la tabele 2x2, şi este cel mai potrivit pentru eşantioane mici, el se aplică adeseori la schiţarea unor tentative de concluzii care pot fi mai târziu verificate utilizându-se eşantioane mai mari şi planuri de cercetare mai complexe.
10.2. Alte teste pentru măsurători de nivel ordinal In ultimele două capitole s-au discutat două teste, (coeficientul de corelaţie r a lui Pearson şi testul t) care, când sunt folosite pentru testarea ipotezelor şi pentru alte analize, cer îndeplinirea unor condiţii riguroase. Coeficientul lui Pearson se foloseşte pentru a determina gradul de corelaţie între măsurile de nivel interval ale unei variabile şi măsurile de nivel interval ale unei alte variabile. Tesul t nu cere decât ca una din variabile să fie de nivel interval. Dar el este un test parametric: adică variabila de nivel interval trebuie să fie normal distribuită în populaţie. Dacă pentru variabila dependentă se pot produce măsurători precise de nivel interval, sau dacă există o scală rafinată de măsură a ei, şi (în cazul lui t) există o distribuţie normală, acestea pot fi testele alese. Dar ce se întâmplă dacă variabila dependentă nu este normal distribuită în populaţie, sau dacă lipsesc măsurătorile precise? S-ar putea ca scala de măsură folosită să fie relativ nouă şi să nu ne simţim încă confortabili declarând că intervalele dintre valori sunt egale. De multe ori variabilele sunt de natura “întodeauna, câteodată, niciodată“, “îmbunătăţire, nici o schimbare, înrăutăţire“, sau alte valori ordonatoare. Din fericire, există câteva alte teste bune pe care cercetătorul asistent social le poate avea în vedere pentru variabilele de nivel ordinal. Vom menţiona patru din ele şi vom da câte un scurt exemplu de cum pot fi ele folosite.
102
Mann-Whitney U Testul U Mann-Whitney este folositor în special în studiile de cercetare care folosesc două eşantioane mici. Se utilizează frecvent în experimentele mici sau ex post-facto, în situaţiile qvasi-experimentale pentru a determina dacă un anume “tratament“ aplicat unui grup experimental dar nu şi unui grup de control pare să fi condus la diferenţe în ceea ce priveşte o variabilă dependentă a cărei valori pot fi ordonate (de nivel ordinal). Grupurile nu trebuie să fie neapărat de aceleaşi dimensiuni. Este un test bun pentru efective foarte mici (sub 8) sau pentru mai mari, dar trebuie să fim atenţi să utilizăm tabela de valori critice cea mai adecvată în raport cu volumul eşantionului. Testul este uşor de calculat manual sau cu calculatorul de buzunar, mai ales dacă volumul eşantionului este mic. Se bazează pe ideea că un indicator bun al diferenţelor dintre cele două grupuri este numărul cazurilor dintr-un grup care cad sub rezultatul corespunzator din celălat grup, când toate rezultatele sunt aranjate în ordine. Premisa logică pusă în evidenţă este că o grupare a rezultatelor celor mai înalte într-un grup şi a rezultatelor celor mai mici în celălalt grup, probabil sugerează că, privit în ansamblu cele două grupuri sunt diferite în raport cu variabila independentă. U este o modalitate matematică de a determina când un astfel de pattern este suficient de puternic pentru a respinge ipoteza nulă. Exemplu Scott este un asistent social angajat într-o corporaţie mai mare. În iulie el a primit 17 referinţe despre lucrătorii săi ca având “probleme de atitudine“ în munca lor. El a cerut supervizorilor săi să numească câte un alt lucrător de acelaşi nivel pe care să-i poată descrie ca având o atitudine foarte bună şi care să se poată alătura lor când vor fi consiliaţi. Şapte dintre supervizori i-au satisfăcut cererea, iar ceilalţi zece nu au fost de acord. Scott s-a întâlnit cu toţi 17, cu cei 7 s-a întâlnit împreună cu câte un colaborator iar cu ceilalţi singuri, în cinci sesiuni. După al cincilea interviu a rugat suprvizorii să completeze o scală de atitudine faţă de serviciu, dezvoltat recent de departamentul de personal pentru evaluarea lucrătorilor supervizori. Scala conţinea 10 itemi şi totaliza maximum 5 puncte. A ordonat apoi rezultatele celor 17 şi a utilizat indicatorul U a lui Mann-Whitney pentru a testa independenţa grupului. El a fost prea optimist crezând că rezultatele obţinute de grupul “experimental“, care a folosit metoda consilierii împreună cu un colaborator, vor fi superioare celor din grupul de control, care au consiliat singuri, chiar dacă trei din primele 4 rezultate cele mai bune au fost obţinute de cei din grupul experimental. De fapt, U nu a permis respingerea ipotezei nule. Două din cele mai mici rezultate veneau tot din grupul experimental. Chiar dacă U ar fi demonstrat o semnificaţie statistică, explicaţii alternative la acest rezultat ar fi existat totuşi (lipsa repartizării aleatoare în grupuri, efectul altor variabile, etc.) pentru că planul de cercetare a lui Scott a fost fără rigoare. Scott a decis să refacă planul şi să continue cercetarea folosind eşantioane mai mari, şi incluzând şi un prestest. Testul U Mann-Whitney este folosit ca o metodă preliminară de examinare a relaţiilor dintre variabile fără să se investească prea mult efort în planul de cercetare şi implementatrea lui. Deoarece necesită doar date de nivel ordinal, este potrivit pentru situaţiile în care care dezvoltarea unui nou instrument de colectare a datelor, care să satisfacă pretenţiile cercetătorului privind precizia datelor (scale de nivel interval sau rapoarte), nu poate fi impusă. Cerinţele testului pentru eşantioane de dimensiuni mici îl fac şi ele adecvat pentru analiza preliminară a unei legături posibile.
103
Totuşi testul U nu trebuie interpretat ca un indicator brut al unei legături sau doar ca un instrument al evaluării timpurii. El este singurul test care a fost aplicat în câteva cercetări foarte serioase şi folositoare. În anumite situaţii - ca şi celelalte teste deja menţionate sau care le vom menţiona - este cea mai bună şi mai potrivită modalitate de analiză. Este unul din cele mai utilizate teste în cercetarea de asistenţă socială şi, de obicei, din motive corecte. Testul median Un alt test util în situaţiile când nu se pot asigura măsurători de nivel interval sau/şi o distribuţie normală este testul median. Ca şi t, el utilizează o măsură a tendinţei centrale, dar spre deosebire de t, se cer doar măsuri de nivel ordinal. Tot similar cu t este în aceea că el măsoară probabilitatea ca două sub-eşantioane (câteodată un grup experimental şi unul de control) să fie suficient de diferite unul faţă de celălat în ceea ce priveşte variabila dependentă, astfel ca respingerea ipotezei nule să fie garantată. Cum lucrează testul median? Se ordonează rezultatele şi se stabileşte rezultatul median pentru toate valorile. Apoi numărul rezultatelor peste şi sub mediană din fiecare grup se tabelează, iar frecvenţele se plasează într-un tabel de contingenţă 2x2. Apoi se calculează valoarea unui test cunoscut. Când numărul total al cazurilor (din ambele grupe) este între 20 şi 40, se utilizează de obicei un test exact Fisher pentru a determina probabilitatea de a comite o eroare de tipul I când se respinge ipoteza nulă. Cu eşantioane mai mari se potriveşte mai bine testul hi2. Testul median se bazează pe ideea că, dacă două grupuri nu sunt de fapt diferite, sau că ele reflectă diferenţe care se datorează în mare măsură întâmplării, ele vor avea acelaşi procent de cazuri sub şi peste mediană. O grupare a rezultatelor deasupra medianei într-un grup şi sub mediană în celălalt grup indică o diferenţă reală privind aceea variabilă, depinzând de puterea acestui pattern. Exemplu Lou Ann este un asistent social angajat într-un centru de consiliere genetică. Ea a observat că numai jumatate din gravidele mai în vârstă (peste 35 ani) care au fost sfătuite să efectueze un test de “amniocentesis“ (testul determină dacă fetusul are probleme genetice) s-au conformat sfatului. Din observaţiile sale mai degrabă neştiinţifice, ea crede că a găsit un factor legat de acest fenomen. Ei i se pare că acele femei care nu au efectuat testul tind să aibe deja mai mulţi copii, iar cele care l-au efectuat au mai puţini copii. Variabila “număr de copii“ este de nivel rapoarte. Dar Lou Ann ştie că acesta nu este normal distribuit în populaţie. Ea decide deci să utilizeze testul median. Ea a grupat datele în cele 4 celule a unei tabele de contingenţă, pe baza modului în care fiecare caz se situează faţă de variabila dependentă (a făcut / nu a făcut testul) şi faţă de variabila independentă, număr de copii (sub sau peste mediană). Criteriul privind dimensiunea frecvenţelor aşteptate pentru fiecare celulă pentru testul hi2 fiind satisfăcute (cel puţin 5%) ea a utilizat formula cunoscută. Impresia ei iniţială a fost confirmată prin utilizarea testului median. Speculând pe baza rezultatului s-a întrebat dacă e posibil ca naşterea unui copil, de exemplu, cu sindromul Down, nu reprezintă o preocupare pentru familiile mai numeroase pentru că grija şi ajutorul suplimentar necesar unor astfel de copii ar putea fi preluate de fraţi. Ea a decis să continue acest studiu căutând şi alte explicaţii posibile. Exemplul este puţin neobişnuit pentru că variabila independentă a fost tratată ca fiind de nivel ordinal. (De fapt ea a fost de nivel rapoarte dar cu o distribuţie foarte oblică). Mai tipice sunt cazurile în care variabila dependentă este ordinală, în timp ce 104
variabila independentă (de exemplu tipul tratamentului) este nominală. Testul este adecvat pentru oricare din aceste combinaţii cu privire la nivelul de precizie a măsurătorilor. Testul median, spre deosebire de celelalte teste prezente în acest capitol, a fost prezentat pentru că este potenţial folositor în cercetarea din asistenţă socială, şi nu pentru că este folosit des în cercetările de asistenţă socială. De prea multe ori observând că criteriile pentru testul t nu pot fi satisfăcute se trece de urgenţă la testul hi2. În multe cazuri testul median ar fi mai adecvat. El tratează măsurile de nivel interval sau de rapoarte ca ordinale, deci de o precizie mai mare decât presupune testul hi2, care tratează variabilele ca fiind doar de nivel nominal. Utilizând hi2 în asemenea situaţii înseamnă a ne asuma riscul de a pierde din precizia măsurătorilor şi de a creşte probabilitatea de a scoate o concluzie eronată din cercetarea noastră. Testul Kolmogorov-Smirnov, testul celor două-eşantioane Acest test (referit K-S în cele ce urmează) are similarităţi cu testul median. Dar el compară nu doar tendinţa centrală a datelor ci şi dispersia lor, oblicitatea şi alte caracteristici ale distribuţiei valorilor unei variabile de nivel ordinal din două eşantioane. (O variantă, testul K-S pentru un eşantion, lucrează similar, dar compară eşantionul cu o distribuţie teoretică a acelei variabile.) Testul K-S se bazează pe ideea că dacă două eşantione sunt aleator alese dintr-o aceaşi populaţie şi dacă ipoteza nulă este corectă, variaţiile variabilei ordinale şi distribuţiile valorilor variabilei trebuie să fie foarte asemănătoare. Dacă diferenţele dintre cele două eşantione sunt considerabile, ele nu sunt chiar diferenţe aleatoare pe care doar întâmplarea le-ar fi produs; trebuie să existe o diferenţă reală. Testul este un mod de a determina dacă diferenţele dintre distribuţiile valorilor variabilei sunt suficient de mari pentru a exclude şansa ca explicaţie şi pentru a justifica respingerea ipotezei nule. K-S analizează datele comparând frecvenţele cumulative pentru intervalele variabilei de nivel ordinal (de exemplu, cât de multe cazuri au fost evaluate ca “puţin îmbunătăţite“ în grupul de control faţă de grupul experimental). De fapt, formula se focalizează asupra punctului (intervalului) la care diferenţa frecvenţelor cumulative dintre cele două grupuri este cea mai mare. Exemplu Roland este un director districtual într-o agenţie de asistenţă publică. Mai mulţi dintre lucrătorii de culoare i s-au plâns că lucrătorii albi au afişat o atitudine excesiv de suspicioasă şi punitivă faţă de clienţii beneficiari de ajutor financiar (AFDC). Ei îi acuzau că clienţii nu au fost crezuţi şi că au fost etichetaţi ca “trişori“. Nedispunând de nici o metodă care să măsoare atitudinile suspicioase şi punitive, Roland a considerat că “numărul referatelor de investigare frauduloasă“ este instrumentul potrivit, chiar dacă mai puţin precis. Chiar dacă numărul exact al referatelor se poate afla cu exactitate, pentru măsurarea atitudinii (adevărata variabilă dependentă), doar valori de nivel ordinal pot fi luate în considerare. El a cerut secretarei să numere referatele de fraudă înaintate în ultimele 3 luni, pentru fiecare lucrător. A alcătuit apoi o distribuţie de frecvanţe cumulate pentru lucrătorii negri şi alta pentru cei albi, utilizând 8 intervale pentru numărul de referate. Decizia de a utiliza 8 intervale (numărul de referate era cuprins între 9 şi 32) s-a luat pentru a “conserva“ precizia măsurătorilor disponibile (utilizând de exemplu doar 3 intervale s-ar fi eliminat prea multe informaţii), dar în acelaşi timp pentru a nu considera că diferenţe de un singur referat, în plus sau în minus, indică o diferenţă reală de atitudine. Decizia s-a bazat deci pe simţul comun şi pe etica de cercetare. 105
După ce a identificat intervalul pentru care diferenţele cumulative ale distribuţiei difereau cel mai mult, Roland a aplicat formula K-S. El a aflat astfel că există doar diferenţe mici între albi şi negri relative la măsurile variabilei, cel puţin nu suficiente pentru a elimina şansa şi a respinge ipoteza nulă. Deşi el nu a privit cu neîncredere plângerile lucrătorilor săi (o măsură mai bună ar fi putut releva, poate, o diferenţă de atitudine), a simţit că nu are suficiente dovezi pentru a-şi confrunta lucrătorii cu ceea ce ei percep ca fiind o problemă. A hotărât în schimb, ca la următoarele întâlniri, să reexpună ceea ce crede el că ar fi o atitudine potrivită faţă de beneficiarii de ajutor financiar (clienţii AFDC). Testul K-S pentru două eşantioane este util pentru a privi la relaţiile dintre o variabilă de nivel ordinal şi una de nivel nominal, atunci când simpla comparaţie a tendinţei centrale nu este suficientă. Examinând întreaga distribuţie a valorilor unei variabile de nivel ordinal, vom avea un tablou mai complet al similarităţilor dintre două eşantioane. Un alt test, testul Wald-Wolfowitz Runs (care nu va fi expus aici), merge mai departe în a identifica diferenţe pe care testul K-S nu le poate detecta. Testul Wilcoxon Sign, al perechilor cu semn Cercetătorii asistenţii sociali găsesec adesea instrumente de măsură care sunt un pic mai precise decât cele de nivel ordinal, dar nu suficient de precise pentru a fi calificate de nivel interval. Aceasta este de obicei cazul noilor scale dezvoltate pentru măsurarea atitudinilor, percepţiilor sau convingerilor. Câteodată, natura amorfă a ceea ce măsurăm, ne impune să dorim etichete pentru valori care să reflecte intervale precise, adică diferenţe egale de cantităţi între două clase de valori. Testul Wilcoxon Sign este util în asemenea situaţii, unde, de exemplu, cunoaştem că un rezultat de 70 puncte este mai mare decât unul de 60 de puncte şi mai ştim că această diferenţă este mai mare decât diferenţa dintre 62 şi 60. Dacă această ultimă determinare poate fi făcută şi dacă ne interesează doar direcţia ei (mai mult, mai puţin, sau la fel) pentru diferenţele dintre perechile care constituie cele două grupuri, noi putem să facem abstracţie de precizia măsurătorii. Testul de semn poate fi potrivit şi când se pot face numai astfel de determinări mai puţin precise. Testul Wilcoxon Sign se bazează pe ideea că, dacă un tratament nu provoacă diferenţieri, nu vor exista diferenţe legate de variabila dependentă între cazurile dintrun grup şi perechea cazurilor din celălalt grup (ipoteza nulă). Acestă situaţie ideală presupune respectarea unor cazuri perechi identice (ca la gemeni). Dar, în practică cazurile perechi se determină pe baza unor pre-teste privind variabila dependentă şi/sau una sau mai multe variabile care se consideră că ar putea interveni. După ce perechile au fost identificate, membrii unuia din grupuri se identifică aleator, perechea lor intrând automat în celălalt grup. Testul examinează mărimea şi direcţia diferenţelor dintre perechi, generată de aplicarea tratamentului. În cursul procesului, diferenţele dintre perechi se ordoneză. Dacă preponderenţa diferenţelor sugerează rezultate mai mari pentru un grup şi cele mai mari diferenţe sunt tot printre aceste cazuri, testul Wilcoxon Sign va sugera o diferenţă statistic semnificativă între grupuri, şi ipoteza nulă va fi respinsă. Cu cât este mai puternică o astfel de tendinţă, în această direcţie, cu atât este mai probabil ca ipoteza nulă să fie respinsă, şi viceversa. Exemplu Denise este un consilier asistent social într-un centru de sănătate pentru studenţi. După ani de observaţii, s-a întrebat dacă studenţii de colegiu cu probleme de adaptare socială au beneficiat mai mult din consilierea făcută de studenţi voluntari neantrenaţi, sau din partea personalului antrenat. Folosind fişele de urmărire standard pe o perioadă de o lună, ea a identificat un grup prospectiv de clienţi diagnosticaţi ca având “probleme moderate de adaptare socială“. Înainte de repartizarea pentru 106
consiliere, ea a identificat 15 perechi potrivite (asemănătoare după criterii ca sexul, media la admitere, etc.) şi a repartizat aleator un membru al fiecărei perechi unui student voluntar; perechile lor au fost repartizate unui asistent social. După şase şedinţe de consiliere de câte o oră, clienţilor li s-a administrat o scală de adaptare socială. Instrumentul pe care Denise l-a considerat un indicator al adaptării sociale pentru studenţii din colegiu, era considerat capabil să genereze informaţii “mai mult decât ordinale“ necesare utilizării testului Wilcoxon Sign. Au fost comparate valorile pentru fiecare pereche în ceea ce priveşte direcţia şi mărimea diferenţelor. Diferenţele au fost ordonate într-o listă. Denise a putut astfel observa că acei membri ai perechilor care au fost consiliaţi de asistentul social s-au situat cu mult mai bine pe scala de adaptare socială decât perechile lor consiliaţi de studenţi voluntari. Testul Wilcoxon Sign i-a permis să se simtă mult mai confortabil în respingerea ipotezei nule: direcţia diferenţelor i-a permis să concluzioneze că acei clienţi care au fost consiliaţi de asistenţii sociali au obţinut valori mai mari pe scală. Desigur, ea nu a devenit pregătită să elimine voluntariatul studenţilor, doar pe baza acestui test, dar s-a întrebat dacă ei n-ar putea fi folosiţi mai bine în munca cu studenţii cu alte probleme. Ea a decis să repete micul ei studiu, utilizând o altă măsură a adaptării sociale ca să vadă dacä rezultatele ei rămân consistente. Testul Wilcoxon Sign se limitează numai la situaţiile în care identificarea perechilor este posibilă. Când există perechi, acest test este relativ puternic şi foarte potrivit pentru situaţiile în care măsurătorile variabilei sunt suficient de precise ca tratarea lor “doar ordinală“ să însemne a nu se profita de avantajele oferite de nivelul măsurătorilor.
10.3. Rezumat În acest capitol am menţionat alte câteva teste întâlnite frecvent în literatura asistenţei sociale. Ele sunt alternative utile pentru testele discutate în capitolele precedente. Cu excepţia lui t am tratat un singur tip de teste, cele neparametrice, care nu presupun o distribuţie normală. Cititorul trebuie să cunoască că un alt grup de teste, cele parametrice, sunt disponibile atunci când distribuţia datelor îndreptăţesc utilizarea lor. Mai subliniem că n-am focalizat pe înţelegerea elementară a testării statistice, şi că în procesul atingerii acestor obiective, am utilizat teste şi exemple care examinau cele mai simple relaţii, relaţiile dintre numai două variabile. Testele care explorează legături mai complexe au fost doar rareori menţionate. De fapt, una din cele mai comune utilizări eronate derivă din situaţiile când se aplică o serie de analize univariate sau bivariate, când ar fi potrivită analiza multivariată. O astfel de eroare poate conduce la concluzii eronate. Explicaţia noastră pentru această omisiune este că ne-am concentrat discursul în scopul asimilării unei înţelegeri elementare care să servească cititorul când şi dacă să continue în acest domeniu. Am ales să sacrificăm comprehensabilitatea pentru simplicitate cu scopul de a ne îndeplini obiectivul prin furnizarea unei introduceri “prietenoase“ în domeniul statisticii.
10.4. Întrebări pentru studiu 1. De ce este potrivit testul McNemar pantru asistenţii sociali care doresc să evalueze impactul unui experiment de grup despre stereotipiile despre minorităţi ? 107
2. În ce situaţii se poate utiliza testul Fisher şi nu se poate utiliza testul hi2 ? 3. Ce condiţii trebuiesc îndeplinite în mod particular pentru utilizarea testului U Mann-Whitney pentru un practician individual care evaluează efectivitatea unei noi metode de tratament ? 4. De ce testul median este preferabil testului hi2 atunci când datele de nivel interval sau rapoarte nu întrunesc condiţiile necesare utilizării testului t ? 5. De ce testul Kolmogorov-Smirnov este o comparaţie mai comprehensivă pentru datele de nivel ordinal sau pentru cele de nivel interval dar oblic distribuite din două grupuri, decât testul median? 6. Ce tip special de eşantionare este necesar pentru un test Wilcoxon Sign ? 7. Ce limite comune au toate testele descrise în acest capitol şi în cele precedente? 8. Cum lucrează toate testele în aceeaşi manieră ? 9. Discutaţi posibilele dezavantaje ale utilizării testelor statistice mai puţin cunoscute.
108
BIBLIOGRAFIE Babbie, Earl, 1991 – The Practice of Social Research, Wadsworth publishing Company, Belmont, California, 493 p. Bryman, Alan & Cramer, Duncan, 1992 – Quantitative data analysis for social scientists, Routledge Edition, 294 p. Norusis, J. Marija, 1992 – SPSS for Windows. Basw System User’s Guide, SPSS Inc., 672 p. Rotariu T., Bădescu G., Culic I., Mezei E., Mureşan C., 1999 – Metode statistice aplicate în ştiinţele sociale, Editura Polirom, Iaşi, 335 p. Weinbach R.W., Grinnell R.M. Jr., 1987 - Statistics for Social Workers, Longman Inc., New York / London
109