Statystyka: wprowadzenie do analizy danych sondażowych i eksperymentalnych  
 8373830472, 9788373830479 [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

Grażyna

Wieczorkowska oraz

Piotr Kochański Magdalena Eljaszuk

STATYSTYKA Wprowadzenie do analizy danych sondażowych i eksperymentalnych

I

Wydawnictwo Naukowe Scholar Warszawa 2003

Spis treści Redakcja i korekta: Magdalena Eljaszuk, Magdalena Pluta

9

Wstęp

Rozdział 1 Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań

Grafiki w tekście i na okładce: Rafał Kucharczuk

1.1. 1.2. 1.3. 1.4. 1.5. 1.6. 1.7.

Copyright © 2003 by Wydawnictwo Naukowe Scholar,

14

Literatura

Projekt okładki: Marta Kurczewska

Spółka

z 0.0., Warszawa

Wprowadzenie Operacjonalizacja zmiennych teoretycznych Badania korelacyjne Badania eksperymentalne Porównanie badań eksperymentalnych i korelacyjnych Analiza przykładów badań Test intuicji psychologicznej: zbiór danych "LEARN". Sposób zapisywania wyników w komputerze 1.8. Co oznaczają liczby w naukach społecznych? Skale pomiarowe. Zmienne nominalne, porządkowe i ilościowe (przedziałowe i ilorazowe) 1.9. Typ skali pomiarowej a rodzaj dopuszczalnych przekształceń

.

15

. . . . . .

15 18 20 22 24 27

.

30

. .

35 41

. .

45

. . . .

51

Rozdział

ISBN 83-7383-047-2

Tytuł

dotowany przez Ministerstwo Edukacji Narodowej i Sportu

2 Rozkład zmiennej w próbie i w populacji. Miary tendencji centralnej i rozproszenia 2.1. Rozkład zmiennej w próbie 2.2. Statystyki opisowe rozkładu zmiennej. Miary tendencji centralnej i rozproszenia 2.3. Standaryzacja 2.4. Rozkład zmiennej w populacji 2.5. Rozkład normalny (rozkład Gaussa) 2.6. Sposoby wykorzystania informacji dotyczącej normalności rozkładu zmiennej w populacji Rozdział

Wydawnictwo Naukowe "Scholar" Spółka z 0.0. ul. Krakowskie Przedmieście 62, 00-322 Warszawa tel./fax 828 95 63, 826 59 21,8289391 dział handlowy 6357404 wew. 219 lub jw. wew. 105, 108 e-mail: [email protected] http://www.scholar.com.pl Wydanie pierwsze Skład i łamanie: WN "Scholar" (Jerzy Łazarski) Druk i oprawa: Paper & Tinta, Warszawa

60 63 66

.

70

.

75

. . . .

75 80 83

3

Wizualizacja danych. Tworzenie wskaźników złożonych 3.1. 3.2. 3.3. 3.4.

45

Tworzenie wskaźników Typowe problemy występujące przy tworzeniu wskaźników Trafność i rzetelność wskaźnika. Współczynnik IX Cronbacha Ograniczenia i wady IX Cronbacha

86

r

3.5. Przykład zastosowania analizy czynnikowej do tworzenia wskaźników . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6. Wprowadzenie do wizualizacji danych. . . . . . . . . . . . . . . . . . . . . . . . . . 3.7. Wizualizacja rozkładu zmiennej 3.8. Wizualizacja zależności między zmiennymi. . . . . . . . . . . . . . . . . . . . .. Rozdział

88 97 99 111

4,

Testowanie hipotez statystycznych.

Rozkład

statystyki. . . . . . . . . . . . . . ..

117

4.1. Jak na podstawie próby możemy wnioskować o całej populacji? ..... 4.2. Rozkład zmiennej w populacji i w próbie oraz rozkład statystyki, na przykładzie populacji marsjańskiej. . . . . . . . . . . . . . . . . . . . . . . . . .. 4.3. Miary tendencji centralnej rozkładu statystyki. . . . . . . . . . . . . . . . . . .. 4.4. Miary rozproszenia rozkładu statystyki 4.5. W jaki sposób praktycznie wykorzystujemy znajomość rozkładu średnich (statystyki.M)? 4.6. Porównanie trzech typów rozkładów. . . . . . . . . . . . . . . . . . . . . . . . . . .. 4.7. Centralne Twierdzenie Graniczne. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4.8. Hipotezy statystyczne 4.9. Kierunkowe i bezkierunkowe hipotezy badawcze. . . . . . . . . . . . . . . . .. 4.10. Etapy testowania hipotez. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4.11. Etapy wnioskowania statystycznego na podstawie wydruku komputerowego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4.12. Ryzyko błędu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

117

Rozdział

118 123 124 126 128 130 134 138 140 154 155

5.

Test t Studenta.

Przedział ufności.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

159

5.1. Rozkład t Studenta 5.2. Zastosowanie testu t Studenta do testowania hipotezy dla pojedynczej próby '. . . . . . . . . . . .. 5.3. Zastosowanie testu t do testowania hipotezy o równości średnich na podstawie dwóch prób zależnych (schemat badawczy: Pretest-Posttest) 5.4. Zastosowanie testu t do porównania średnich na podstawie prób niezależnych ~ . . . . . . . . . . . . .. 5.5. Przedział ufności dla średnich. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

159

Rozdział

6.1. Ograniczenia stosowalności testu t Studenta. Dlaczego 3 jest lepsze niż 2? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.2. Jednoczynnikowa analiza wariancji. . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.3. RozkładFFishera . . . .. . .. .. . .. .. . . . . . . . . .. . ... . . .... . . . . . ..

193 210

Rozdział 7. Dwuczynnikowa analiza wariancji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

217

7.1. Efektinterakcji 7.2. Testowanie efektów głównych i interakcyjnych. . . . . . . . . . . . . . . . . .. 7.3. Porównanie wyników jednoczynnikowej analizy wariancji " z analizą dwuczynnikową 7.4. Analiza wariancji z powtarzanymi pomiarami

217 221 232 237

Rozdział 8,

Pomiar związku między zmiennymi ilościowymi: współczynnik korelacji liniowej i analiza regresji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 8.1. 8.2. 8.3. 8.4. 8.5.

8.6. 8.7. 8.8.

Związek liniowy między zmiennymi ilościowymi. Wykres korelacyjny (rozrzutu). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Przewidywanie wyników zmiennej zależnej na podstawie wartości zmiennej niezależnej. Błąd predykcji. . . . . . . . . . . . . . . . . . . . . . . . . . .. Testowanie istotności współczynnika korelacji. . . . . . . . . . . . . . . . . . .. Problemy w interpretacji współczynnika korelacji . . . . . . . . . . . . . . . .. Zastosowanie analizy regresji w badaniu LEARN. Modyfikujący wpływ trzeciej zmiennej (grupa eksperymentalna) na otrzymane zależnośd Regresja wielokrotna. Określanie związku zmiennej zależnej z więcej niż jednym predyktorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . .. Korelacje cząstkowe Wprowadzenie zmiennych nominalnych do równania regresji. . . . . . ..

242 242 245 253 257

258 260 264 267

161 Rozdział

9

2

166 172 181

6,

Jednoczynnikowa analiza wariancji. . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

6.4. Zastosowanie analizy wariancji do testowania hipotez o równości średnich. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.5. Testy porównań poszczególnych średnich w analizie wariancji. . . . . ..

186 186 187 190

Test X dla zmiennych nominalnych 9.1. Test hipotezy o zgodności rozkładu empirycznego z teoretycznym (oczekiwanym). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 9.2. Test hipotezy o niezależności dwóch zmiennych nominalnych 9.3. Wyliczanie współczynników siły związku. . . . . . . . . . . . . . . . . . . . . . .. Rozdział

270 270 275 285

10.

Podsumowanie i wskazówki dotyczące wyboru testu statystycznego

288

Tablice

303

Książkę dedykuję Januszowi Grzelakowi i Eugene 'owi Burnsteinowi, moim - w chronologicznej kolejności - profesorom, współpracownikom i przyjaciołom. Spędziłam z nimi wiele godzin, analizując dane zarówno eksperymentalne, jak i sondażowe.

G.W

Wstęp Od kilkunastu lat byłam namawiana do napisania podręcznika do statystyki. Nalegali na to zarówno psychologowie, jak i lekarze, których dane (tak eksperymentalne,jak i sondażowe) analizowałam i którzy cenili sobie wysoko wyniki współpracy. Jest tak zapewne dlatego, że mimo ukończonych studiów matematycznych statystyka interesuje mnie tylko o tyle, o ile pomaga nam w wydobywaniu interesują­ cych informacji ze zgromadzonych danych. Sama od ponad 20 lat rozwiązuję zagadki psychologiczne i jestem przekonana, że wiedzielibyśmy już znacznie więcej, gdyby badacze rozumieli, po co zbierają dane i co dalej się z nimi dzieje. Zrozumienie istoty statystyki jest potrzebne także tym, którzy sami nie przeprowadzają badań, ale je wykorzystują. Wszyscy dowiadujemy się, że wyniki badań wykazały wzrost notowań rządu, że należy pić sok pomidorowy itd. Jeżeli nie rozumiemy istoty statystyki, nie jesteśmy w stanie trafnie ocenić tych doniesień. Analizowałam sporo badań z różnych dziedzin psychologii, socjologii, edukacji, medycyny i widziałam bezradność na przykład w oczach lekarzy, którzy nie rozumieli, co mogą, a czego nie mogą powiedzieć na podstawie otrzymanych wyników. A przecież nie jest to trudne. Trzeba mieć tylko dobrego nauczyciela lub dobry podręcznik, który wskaże drogę. Niniejszy podręcznik jest efektem doświadczenia, jakie zebrałam w czasie prowadzenia dwuletniej specjalizacji "Metodologia badań społecznych" na Wydziale Psychologii Uniwersytetu Warszawskiego i wykładu "Metodologia ze statystyką" w Szkole Wyższej Psychologii Społecznej. Zaprosiłam do współpracy dwójkę młodych asystentów, którzy uczą "Zastosowań komputerów w psychologii" w SWPS. Piotr Kochański (który napisał m.in. część dotyczącą wizualizacji wyników) jest doktorem fizyki od lat pracującym z psychologami. Magda Eljaszukjest magistrem psychologii i doktorantkąInstytutu Studiów Społecznych Uniwersytetu Warszawskiego. To, jak należy uczyć analizy danych wszyscy troje mieliśmy okazję podpatrywać u mistrzów - profesorów wykładających w najlepszej szkole letniej w zakresie metodologii badań ilościowych w naukach społecznych, organizowanej już od 40 lat przez ICPSR (Inter-University Consortium for Political Science). Ja w 1990 roku, Piotr w 1999, Magda w 2002 roku. Było to możliwe dzięki stypendiom uzyskanym za pośrednictwemInstytutu Studiów Społecznych UW od Institute for Social Research, University ofMichigan, Ann Arbor.

9

10

Moi koledzy dziwią się, że nie nudzi mi się uczenie, co to jest wariancja, wynik istotny statystycznie itd. Nie nudzi mi się, ponieważ cały czas szukam najlepszego sposobu przekazania tej wiedzy. Zdecydowana większość moich studentów to ofiary nauczycieli matematyki, którzy wyrobili w nich przekonanie, że ta dziedzina nauki jest dla nich nie do pojęcia. Czasem mam wrażenie, że zamiast kursu statystyki prowadzę kurs zmiany postaw. Na początku wielu studentów twierdzi, że oni niczego, co jest związane z matematyką, nie są w stanie się nauczyć. Myślę sobie wtedy nie najlepiej o ich wiedzy psychologicznej. Powinni przecież wiedzieć, że zamiast pytania "CZY" należy postawić pytanie "JAK". I - jak wynika ze znanego porzekadła "Kto chce, szuka sposobów, kto nie chce, szuka powodów", należy się zastanowić, w jaki sposób zorganizować naukę, aby jak najlepiej odpowiadała naszym preferencjom poznawczym. "Statystyka" - to brzmi dla większości humanistów bardzo groźnie. Tym samym terminem określany jest przedmiot wykładany na matematyce, ekonomii, zarządzaniu, socjologii, psychologii. Uczy się tam jednak innych rzeczy - na matematyce przypomina to naukę budowy samochodu, na psychologii kurs jazdy samochodem. Człowiek, który zna teorię budowy samochodu może czuć się bezradny, gdy usiądzie za kierownicą. Dobry kierowca może nie znać takich szczegółów - choć jest dużo lepiej, jeżeli rozumie ogólne zasady funkcjonowania pojazdu. Podręcznik jest pisany dla praktyków, a nie teoretyków, i dlatego jest pełen uproszczeń. Stosując analogię do nauki sztuki kulinarnej, nie będziemy studiować procesów chemicznych zachodzących podczas duszenia mięsa, a skoncentrujemy się wyłącznie na heurystykach i algorytmach, jakie trzeba zastosować, aby to mięso smacznie przyrządzić. Takjak w rękach kiepskiego kucharza mięso może zostać spalone na węgiel, tak w rękach kiepskiego badacza ciekawe wyniki empiryczne mogą zostać niezauważone. Umiejętność stosowania statystyki też wymaga artyzmu. Ale zanim staną się Państwo artystami w analizowaniu danych, często obarczonych sporym szumem, czeka nas sporo palcówek. Proszę mi zaufać, choć często będą się one wydawały sztuczne, to wykonywanie ćwiczeń ma głębszy sens, niż się Państwu wydaje. Do nauki statystyki należy podejść jak do nauki języka. Najpierw trzeba nauczyć się słówek i sposobu budowania zdań. Wymaga to systematyczności. Części tych słówek będziemy się uczyć w dwóch językach równocześnie: angielskim i polskim, ponieważ ogólnie przyjęte skróty, takie jak SS na określenie sum kwadratów, pochodzą od angielskich terminów (SS - sum ojsquares). Tak jak w każdym języku, i tu jest sporo synonimów. Przykładowo,prawdopodobieństwopopełnieniabłędu L rodzaju określane jest jako poziom istotności lub poziom ufności. Symbol j3 oznacza zarówno prawdopodobieństwo popełnienia błędu II rodzaju, jak i standaryzowany współczynnik regresji itd. Treści zawarte w podręczniku są maksymalnie uproszczone. Każdy jest w stanie je przyswoić, o ile tylko zechce, tzn. będzie szukał sposobów, a nie powodów. Trzeba jednak czytać skrypt aktywnie - z ołówkiem, ewentualnie kalkulatorem, sprawdzać wszystkie obliczenia po kolei. Tylko aktywność własna może przynieść efekty. Po latach oszczędzania niepotrzebnego wysiłku uczniowi, karierę robi japońska szkoła nauczania matematyki, która podstawową rolę przypisuje wyuczeniu pew-

nych umiejętności, uzyskanie zaś wglądu jest zadaniem wtórnym. Do tego podejścia zachęcam Czytelnika. Proszę mi wierzyć - wykonanie ćwiczeń zawartych w podręczniku jest konieczne. Zostały czasem zostawione puste miejsca po to właśnie, aby skłonić Czytelnika do sięgnięcia po ołówek. Po każdym rozdziale jest kolorowa kartka, na której warto zapisać to, co powinniśmy zapamiętać. Inaczej będzie to jak oglądanie kasety z nauką jazdy samochodem. Oczywiście, że można obejrzeć, ale warto też usiąść za kierownicą. Rozwiązywanie ćwiczeń w podręczniku jest jak j azda z instruktorem. Przygotuje to Państwa do samodzielnego prowadzenia samochodu. Nawet jeżeli jesteśmy przekonani, że zrozumieliśmy co to jest wariancja, błąd standardowy, etapy testowania hipotez, to prawdziwe ukorzenienie tej wiedzy nastą­ pi dopiero wtedy, gdy samodzielnie przetestujemy kilkadziesiąt hipotez statystycznych. Ćwiczenia zostały tak dobrane, aby było to bardzo proste. O tym, że przyjęta przeze mnie metoda dydaktyczna jest skuteczna, przekonują mnie wysokie oceny studentów. Na 318 oceniających mnie w lutym 2003 roku studentów mediana oceny na pięciopunktowej skali na wymiarach: ciekawy wykład, kontakt ze słuchaczami, zrozumiałość wykładu wyniosła odpowiednio 4, 5, 4. To bardzo dobre oceny, biorąc pod uwagę fakt, że gdy wchodzę na salę po raz pierwszy, studenci patrzą na mnie z wielką niechęcią ze względu na nazwę przedmiotu. Zupeł­ nie inaczej jestem witana na pierwszym wykładzie z psychologii społecznej. Dlatego cieszą mnie dołączone do ankiet anonimowe uwagi: • ten wykładjest zrozumiały nawet dla "zatwardziałych humanistów"; • "dzięki" relacjom moich znajomych statystyka jawiła mi sięjako koszmar jakichkolwiek studiów. Dzięki pani otwartości wobec studentów oraz wyrozumiałej łopatologii, zaskakując samą siebie - polubiłam statystykę; • ponieważ nie przypuszczałam, abym rzeczywiście w życiu zawodowym korzystała z wiedzy przekazywanej w ramach przedmiotu - brak mi motywacji; JEDNAK - pani pro! tak interesująco prowadzi wykłady, iż zaczynam wierzyć, że naprawdę warto; • nigdy nie lubiłam statystyki, ale pani pro! ma talent, są to najlepsze wykłady, jakie mam w tym roku. Przedmiot trudny, wykłady bardzo pomagają, ale materiały są dla mnie nieczytelne. Odpowiedzią na ostatniąuwagęjestpodręcznik, który stanowi próbę zastąpienia moich wykładów. Na ile udaną - ocenią to Czytelnicy. Choć największy nacisk położyliśmy na wytłumaczenie,co to jest wynik istotny statystycznie, to nie należy oczekiwać, że stanie się to jasne po przeczytaniu podręcznika w ciągu jednego wieczoru. Pomalutku! Poznanie wnioskowania statystycznego można porównać do wchodzenia po drabinie. Najpierw trzeba opanować nowe słówka, potem regułę budowania zdań, aby pod koniec niespodziewanie spostrzec, że mówimy "po francusku" lub przynajmniej rozumiemy (może nie na 100%, ale dużo) ten język. Statystyki nie można nauczyć się wyrywkowo. Nie można dotrzeć na szczyt drabiny, jeżeli opuściliśmy parę szczebli. Więcej, szczebel #4 nie da się zdobyć,jeśli opuściliśmy szczebel #3. Dlatego, w odróżnieniu od nauk humanistycznych, syste-

11

matyczność

12

jest podstawą sukcesu. Nie chcę powiedzieć, że nie można wejść na szczebel #4, jeżeli się nie zrozumiało 100% materiału ze szczebla #3. Nieprawdapełne zrozumienie różnych treści może przyjść dopiero później. Zanim wejdziemy na następny szczebel, trzeba zapamiętać symbole, definicje, przykłady bez względu na to, czy się rozumie je w 100%, czy 20%. Osoby, które nie potrafią przejść dalej dopóki nie zrozumieją wszystkiego doskonale, będą miały sporo problemów, ponieważ ten podręcznik z definicji musi być pełen uproszczeń. Nie dowodzimy żadnego z wykorzystywanych twierdzeń, nie omawiamy wszystkich opcji, bo podręcznik rozrósłby się do ogromnego tomiska, które odstraszałoby większość Czytelników. Ten podręcznik zawiera tylko niezbędne minimum potrzebne psychologom, pedagogom, socjologom, specjalistom z innych nauk społecznych, w tym także lekarzom itd. do rozpoczęcia przygody z analizą i interpretacją danych. Jest to dziwne minimum, bo mimo podstawowego doboru treści, znalazły się tu zaawansowane, ale często wykorzystywane metody - na przykład użycia analizy czynnikowej do budowania wskaźników, analizy wariancji z powtarzanymi pomiarami czy regresji wielokrotnej, wizualizacji danych. Ze zrozumiałychwzględów nie są one wyczerpująco omówione (odsyłamy do literatury) - tu pokazaliśmy tylko, jak zinterpretować wyniki, które dzięki pakietom statystycznym każdy może łatwo wyprodukować, ale dużo gorzej jest z interpretacją. Niestety! Łatwo byłoby napisać podręcznik pełen wzorów matematycznych, staraliśmy się jednak ograniczaćje do niezbędnego minimum. We wszystkich wzorach dla uproszczenia zakładamy równą liczebność prób, ponieważ i tak większe analizy wykonywane są przy użyciu pakietów statystycznych. Aby je jednak zrozumieć, konieczne jest przeprowadzenie kilkunastu analiz samodzielnie. Pomijamy też często indeksy przy wzorach sumowania, zastępując je komentarzem. Podane przykłady zadań dotyczą śmiesznie małych prób po to, aby maksymalnie uprościć obliczenia. Używając statystyki w badaniach społecznych, można stosować standardy stanu idealnego: sprawdzać rygorystycznie wszystkie założenia, lub stanu normalnego, zgodnie z tym, co robią inni badacze. Przykładowo, nie ma dowodów na to, że skala odpowiedzi: (1) zdecydowanie się zgadzam, (2) zgadzam się, (3) trudno powiedzieć, (4) nie zgadzam się, (5) zdecydowanie się nie zgadzam, ma charakter przedziałowy, a jednak w badaniach publikowanych w najlepszych czasopismachjest ona tak traktowana. Dlatego w podręczniku stosujemy standardy nie rygorystyczne, ale uznawane w środowisku badaczy. Sama nie lubię powtórzeń, jednak dwudziestoletnie doświadczenie dydaktyczne nauczyło mnie, że są one niezbędne. Dlatego w skrypcie staraliśmy się nie unikać powtarzania ważnych informacji. Podręcznik można pisać, podając formuły ogólne lub też koncentrując się na ćwiczeniu wybranych przykładów w nadziei, że ich opanowanie pozwoli zapewne na generalizację. Dlatego przez cały podręcznik prowadzimy Czytelnika, posługując się przykładami z fikcyjnego badania LEARN i prowadzonego od początku lat 90. Polskiego Generalnego Sondażu Społecznego. Nie zakładamy, że Czytelnik, który dobrnie z nami do końca podręcznika będzie umiał analizować dane z badań społecznych. Nie od razu Kraków zbudowano. Cel

ostanie osiągnięty, jeżeli będzie on potrafił przeprowadzić (fizycznie i/lub mental-

~ie) wybrane analizy przedstawione w podręczniku. Gwarantujemy jednak, że statystyka przestanie być czarną magią· Do fizycznego przeprowadzenia analiz dużego zbioru danych potrzebny jest dostęp do jakiegoś pakietu statystycznego i umiejętność posługiwania się komputerem oraz tym programem. Wszystkie przykłady i sposoby prezentowane w skrypcie są wynikami używania pakietu statystycz~ego Stat~stical Pac~age for Social Scien~es (SPSS). Jest to bardzo potężne n~r~ędzl: ~~ analIzy d~nych.l ?l~tego ~d począ~~uJą­ cych (ale nie tylko) wymaga umleJętnoscllg~orowamaduzeJ lIc~by mformacJI. Na wydruku znajduje się wiele statystyk, które me wnoszą do badama potrzebnych danych. Początkujący użytkownik, który zechciałby zrozumieć wszystko, co jest wydrukowane, będzie skazany na klęskę· Chociaż nasze nazwiska figurują na okładce tego podręcznika, to trudno nazwać nas autorami zawartych w nim treści. Nie my pierwsi opisaliśmy rozkład normalny, analizę wariancji, etapy testowania hipotez statystycznych. Szukając najprostszego sposobu przekazu, korzystaliśmy z prac innych. Pomysł populacji marsjańskiej (choć nie tak się ona nazywała) i niektórych zadań pochodzi z podręczników amerykań­ skich. Zostały one jednak znacznie przystosowane do naszej koncepcji uczenia. Podręcznikpowstawał ewolucyjnie z przygotowywanych (i zmienianych co roku) materiałów do nauki statystyki. W pracy nad wersją sprzed paru lat brali udział: dr Grzegorz Król, mgr Jerzy Madej, mgr Irena Zinserling, dr Dorota Król, dr Piotr Radkiewicz, mgr Agata Bieniek, mgr Rafał Tomicki. Ostatnia edycja pracy jest zasługą mgr Marty Bizackiej. Najwyższe słowa uznania należą się profesorowi Jerzemu Brzezińskiemu, którego szczegółowe uwagi przyczyniły się do znacznego ulepszenia tekstu. Mam świadomość tego, że zbliżający się kolejny rok akademicki wymusza zakończenie pracy, choć tyle rzeczy warto byłoby poprawić, dodać. No cóż, jak powiedział Montaigne: "Umiejętności i sztuki nie powstają gotowe, jakoby odlane w formie, jeno tworzą się i kształtują pomalu, gdy się je obrabia i szlifuje..." Będziemy wdzięczni Czytelnikom za sygnalizowanie nam nieścisłości i propozycje zmian. Uspokaja mnie trochę to, co usłyszałam od dziekana MINI Politechniki Warszawskiej, że nawet w XX wydaniu zbioru zadań Gdowskiego i Plucińskiego wciąż są notowane błędy. Mogę obiecać, że dołożymy starań, aby kolejne wydanie tego bardzo potrzebnego podręcznika było jeszcze lepsze. Na stronie WWW.CQme.uw.edu.pl/gw znajdą Państwo odpowiedzi do ćwiczeń, zbiory danych, komentarze. Pracujemy też nad przygotowaniem kursu internetowego ze statystyki. Podręcznik stanowi wprowadzenie w problematykę i jestem przekonana, że po przeczytaniu go sięgną Państwo z zainteresowaniem do pozycji podanych w bibliografii. Grażyna Wieczorkowska

www.come.uw.edu.pl/gw 7 maja 2003 roku

([email protected]) 13

Literatura

14

[1] Aronson E., Ellsworth P.C., Carlsmith 1M., Gonzales M.H. (1990,2 wydanie). Methods ofresearch in social psychology. New York: McGraw-Hill. [2] Aronson E., Wieczorkowska G. (2001). Kontrola naszych myśli i uczuć (Skąd my to wszystko wiemy, s. 19-32, Jak odpowiadać na interesujące pytania?, s. 113-181). Warszawa: Santorski. [3] BlalockH.M. (1977). Statystyka dla socjologów (tłum. M. Tabin i in.). Warszawa: Państwowe Wydawnictwo Naukowe. [4] Brzeziński l (red.). (1987). Wielozmiennowe modele statystyczne w badaniach psychologicznych. Warszawa-Poznań: Państwowe Wydawnictwo Naukowe. [5] Brzeziński l (1996). Metodologia badań psychologicznych. Warszawa: Wydawnictwo Naukowe PWN. [6] Brzeziński l (2000). Badania eksperymentalne w psychologii i pedagogice. Warszawa: Wydawnictwo Naukowe "Scholar". [7] Cichomski B. (2000). Polskie Generalne Sondaże Społeczne: skumulowany komputerowy zbiór danych 1992-1999. Warszawa: Instytut Studiów Społecznych, Uniwersytet Warszawski. [8] Clegg F. (1994). Po prostu statystyka (tłum. E. Łakoma, W. Rzewuski). Warszawa: Wydawnictwa Szkolne i Pedagogiczne. [9] Cohen l, Cohen P. (1983). Applied multiple regressionlcorrelation analysis for the behavioral Sciences. Hillsdale: Lawrence Erlbaum. [10] Ferguson G.A., Takane Y. (1997). Analiza statystyczna wp~ychologii i pedagogice (tłum. M. Zagrodzki). Warszawa: Wydawnictwo Naukowe PWN. [11] Góralski P. (1987). Metody opisu i wnioskowania statystycznego w psychologii i pedagogice. Warszawa: Państwowe Wydawnictwo Naukowe. [12] Gómiak J., Wachnicki J. (2000). Pierwsze kroki w analizie danych. SPSS PL for Windows. Kraków: SPSS Polska. [13] Jacoby W.G. (1997). Statistical graphicsfor univariate and bivariate data. Thousand Oaks: Sage Publications. [14] Król G., Wieczorkowska G. (1996). Przykłady zastosowań modelowania strukturalnego w badaniach społecznych. Warszawa: Zeszyty Naukowe 1SS. Seria: Prace Metodologiczne. [15] Mitchell M., Jolley l (1996). Research design explained. Fort Worth: Harcourt Brace College Pub1ishers. [16] Nowojczyk M. (2002). Przewodnik po statystyce dla socjologów. Kraków: SPSS Polska. [17] Pagano R.R., Follett W.C. (1986). Understanding statistics in the behavioral sciences. St. Paul: West Publishing Co. [18] Paszkiewicz R (1985). Podstawy procesu badawczego w psychologii, w: L. Wołoszy­ nowa, Materiały do nauczania psychologii. Seria III, t. 4. (s. 128-158). Warszawa: Państwowe Wydawnictwo Naukowe. [19] Shaughnessy 1.1., Zechmeister RB., Zechmeister lS. (2002). Metody badawcze w psychologii. Gdańsk: Gdańskie Wydawnictwo Psychologiczne. [20] Skład M., Wieczorkowska G. (2001). Sztuka układania ankiet ewaluacyjnych, w: M. Lewicka, J. Grzelak (red.), Psychologia społeczna: jednostka - społeczeństwo ~ państwo (s. 250-266). Gdańsk: Gdańskie Wydawnictwo Psychologiczne. Wieczorkowska G., Król G. (1995/1997). O typowym zastosowaniu analizy czynniko[21] wej i skalowania wielowymiarowego w badaniach społecznych. Warszawa: Zeszyty Naukowe 1SS. Seria: Prace Metodologiczne.

Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań Pojęcia

kluczowe: badania eksperymentalne i korelacyjne; zmienne: (wskaźniki), niezależne, zależne

teoretyczne i empiryczne nominalne,

porządkowe i ilościowe (przedziałowe

(dyskretne),

wyjaśniające

i

wyjaśniane,

i kontrolowane,

i ilorazowe), ciągłe i nieciągłe

istotne i uboczne; operacjonalizacja;

skale pomiarowe

Wprowadzenie Czy normalny człowiek musi znać statystykę? Wysłuchałam [GW] niedawno audycji radiowej o żywieniu. Występująca w niej pani doktor wypowiadała się autorytatywnym tonem o tym, jak należy się odżywiać. Z pełnym przekonaniem formuło­ wała wnioski, które w rzeczywistości nie były uzasadnione, np. że wysoki poziom cholesterolu we krwi współwystępuje z chorobami układu krwionośnego, zatem nie należy jeść potraw zawierających cholesterol. Zależność między spożywaniem cholesterolu i wysokim poziomem tego składnika we krwi jest modyfikowana przez wiele innych zmiennych (np. w dużo większym stopniu zależy od czynności wątroby niż od rodzaju spożywanego pożywienia). Stosując taki schemat wnioskowania, można by założyć, że przy żółtaczce nie należy jeść żółtych produktów. Analogicznie nasze wnioski dotyczące pożytków ze stosowania diety wegetariańskiej są ograniczone ze wz~lęd~ na słabość badań. Wegetarianie różnią się od osób niestosujących tego rodzaJU dIety także na innych wymiarach, np. pod względem troski o własne zdrowie. Gdy z~dzwoniłam do radia i zwróciłam uwagę na ten aspekt redaktor prowadzącej audyCJę, była oburzona. "Co pani opowiada, to są przecież wyniki badań nauko-

15

Rozdział 1. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań

16

wych!". Tak, ale badania naukowe prowadzą do konkluzji o różnej sile pewności (większość z nich tylko uprawdopodobnia pewne tezy). Nawet jeśli sami nie prowadzimy badań naukowych, to jednak obserwujemy rzeczywistość, usiłując formułować wnioski o zależnościach przyczynowych między zmiennymi. Wyobraźmy sobie następującą sytuację· Znowu zasypiam nad sprawdzaniem prac magisterskich. Dobrze spałam w nocy, więc jestem wyspana. Może to pogoda? Muszę to zrobić do jutra. Wypiję zieloną herbatę. Nic nie pomaga, piję następną. Po godzinie czuję się świeża i wypoczęta. Czy to zasługa zielonej herbaty? Trudno powiedzieć, ponieważ mogły nastąpić zmiany w moich procesach biochemicznych, które są niezależne od tego, co robiłam. Aby być pewną wpływu zielonej herbaty, musiałabym być pewna, że JA o godzinie 10 i JA o godzinie 11 to ten sam obiekt i nic, poza wypiciem zielonej herbaty, się nie zmieniło. Tego nie mogę zagwarantować, powinnam więc powtórzyć eksperyment z zieloną herbatą w wielu punktach czasowych. Losuję dni tygodnia i godziny i o określonej porze oceniam swoje samopoczucie, następnie piję zieloną herbatę i po jakimś czasie oceniam ponownie. Podstawowe pytanie brzmi: po jakim czasie? Po 15 minutach, godzinie, 2 godzinach? Zielona herbata może mieć bardzo różny wpływ, gdy pijęją, kiedy jestem wyspana, zmęczona, podekscytowana... Sama czynność picia może mieć wpływ na zmianę samopoczucia, takjak przyjemnośćjedzenia może wynikać nie tylko z przyjmowania pokarmów, ale samego faktu używania mięśni, które zostały skojarzone z przyjemnością. Nasza pamięć zapisana jest także w mięśniach. Badania pokazały na przykład,że dowcipne rysunki podobają nam się bardziej, gdy w czasie oglądania trzymamy w ustach długopis w sposób, który wymaga układu mięśni takiego jak wówczas, kiedy się uśmiechamy, niż wtedy gdy nasze mięśnie układają się w smutny wzorzec. Pojawia się problem badacza znającego hipotezy. Jeżeli na przemian w wylosowanych punktach czasowych piję herbatę czarną i zieloną, to jestem świadoma, jaką herbatę piję i to może wpływać na moje oceny. Lepiej byłoby przygotować mieszanki zielonej i czarnej herbaty o różnym składzie procentowym, zakleić, ich opis schować do szafy pancernej i być nieświadomą, co w danej chwili piję· Myślę, że nie muszę dalej przekonywać, że bycie badanym i badaczem w jednej osobie jest bardzo trudne,jeżeli nie niemożliwe. Lepszym rozwiązaniembyłoby zbadanie wpływu zielonej herbaty na inne osoby. Mogę się zastanawiać, kto z moich znajomych pije zieloną, a kto czarną herbatę, następnie oszacować ich średnią ospałość i policzyć współczynnik korelacji (co to dokładnie oznacza, wyjaśnione jest w rozdziale 8.) między częstością picia zielonej herbaty a interesującą mnie zmienną. Załóżmy, że zaobserwowaliśmy dodatni związek - ci, którzy piją zieloną herbatę, mają wyższy poziom energii niż ci, którzy piją herbatę czarną. Czy mogę stwierdzić, że zielona herbata redukuje ospałość? Niekoniecznie, ponieważ ludzie pijący zieloną herbatę mogą różnić się od pozostałych stopniem dbania o zdrowie, częstością podejmowania aktywności fizycznej itd. Znalazłam właśnie tekst informujący, że picie określonego zestawu ziół zwiększa poziom energii. Broszura zawiera bardzo przekonujące opisy osób, których życie po rozpoczęciu picia tej mieszanki ziołowej zmieni-

Wprowadzenie

ło się radykalnie.

Czy mogę wierzyć tym argumentom? Nie bardzo! Aby ocenić wpływ tej zmiennej, musiałabym mieć informację także o tych, którzy pili i im nie pomogło. Nie ma metody, leku, który byłby skuteczny w 100% dla wszystkich. Analizując takie dane, musimy porównać cztery rodzaje informacji, tj. liczbę osób:

~

. które piły i wykazały poprawę; 2. które nie piły i wykazały poprawę; 3. które piły i nie było poprawy; 4. które nie piły i nie było poprawy.

Dopiero wtedy mogę określić stopień związku między obiema zmiennymi. Wszystkie materiały reklamowe, które "przekonują" nas o cudownych środkach gwarantujących pozbycie się nadwagi, cellulitu, trądziku itp. zawierają tylko jedną z tych informacji i dlatego są bezwartościowe. W USA wprowadzono nakaz rzetelnego informowania konsumentów i we wszystkich telewizyjnych materiałach reklamowych pojawia się maleńki napis: "Rezultaty mogą się różnić u różnych osób". Nie da się ukryć, że biznes żerujący na naszych marzeniach, aby stać się piękny­ mi i młodymi bez "trudu i bólu", kwitnie. Ładnie to opisał już Fromm w Sztuce istnienia. Co mamy zatem robić, aby ocenić skuteczność nowego, wspaniałego środ­ ka? Jedynym rozwiązaniem jest stosowanie metod naukowych, które:

o składają się z szeregu uporządkowanych procedur, stosowanych do analizowania i problemów; e korzystają z informacji zebranych w obiektywny sposób jako faktycznej podrozwiązywania

stawy do wyciągania wniosków;

O opierają się na empirycznym materiale dowodowym; O polegają na stosowaniu nietendencyjnych metod przeprowadzania obserwacji, zbierania danych i formułowania hipotez i twierdzeń (o tym, czy coś jest prawdziwe lub uznawane, nie decydują ani autorytet, ani osobiste przekonania). Spełnienie wyżej

wymienionych warunków powoduje, że uzyskujemy dane, które można zademonstrować wielokrotnie; zarówno może czynić to naukowiec, który je odkrył, jak i inne osoby. Wyniki, których nie da się uzyskać ponownie (zreplikować) nie są godne zaufania. Dla odpowiedzi na pytanie o wpływ zielonej herbaty najlepszą metodą jest eksperyment. Wystarczyłobypodzielić losowo grupę ochotników na dwie części. Następnie zmierzyć ich nastrój, poziom energii. Zaproponować im potem do wypicia zieloną lub czarną herbatę (niestety, nie można im pozwolić wybierać), zająć ich czymś przez następną godzinę i znów mierzyć ich poziom energii. Czy chcemy tego czy nie, podejmujemy codzienne decyzje, kierując się wynikami badań, bądźmy więc świadomi ich wartości. Wszystkie badania mają pewne cechy wspólne. Zaczniemy od wprowadzenia i zdefiniowania podstawowych pojęć. Badanie

17

Rozdział l. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań

naukowe zaczyna się od postawienia pytania. Czy zielona herbata podnosi poziom naszej energii? Czy przeżywanie stresu prowadzi do zwiększonej podatności na choroby somatyczne? Jak wpływa na nasze zachowanie oglądanie przemocy w TV? Pytanie jest dobrze sformułowane,jeżeli można na nie odpowiedzieć, dokonując obserwacji. Każde pytanie może stać się naukowym, pod warunkiem że spełnia wymóg empirycznej rozstrzygalności,a więc możliwe jest określenie,jakie fakty, zjawiska czy procesy należy zaobserwować, aby udzielić na nie odpowiedzi. Takiej możliwości nie daje np. pytanie o wpływ wyboru płci i IQ (ilorazu inteligencji) nienarodzonego dziecka na strukturęspołeczną,ponieważ rodzice jeszcze nie mogą podejmować takich decyzji. Po sformułowaniu "rozstrzygalnego empirycznie" zagadnienia musimy zdecydować, co dokładnie chcemy obserwować, żeby odpowiedzieć na pytanie.

Operacjonalizacja zmiennych teoretycznych

18

Podejście naukowe wymaga opisu rzeczywistości za pomocą zmiennych. Jeżeli chcemy sprawdzić, czy frustracja (przerwanie zachowania ukierunkowanego na cel np. z powodu jakiejś arbitralnej ingerencji innej osoby) wzbudza negatywny afekt, który wywołuje agresywne myśli, gniew oraz skłonność do zachowań agresywnych, to mamy dwie zmienne teoretyczne: frustracja i agresja. Jeżeli interesuje nas wpływ obserwacji przemocy na agresywnośćzachowania, to w tak ogólnie sformułowanym pytaniu mamy też dwie zmienne teoretyczne: oglądanie przemocy i agresja. Aby pytanie spełniało wymóg empirycznej rozstrzygalności, musimy występują­ ce w nim zmienne teoretyczne zoperacjonalizować, czyli wskazać operacje, które trzeba wykonać, aby określić wartość, jaką przyjmuje zmienna. Zmiennąmoże być każda cecha, która przyjmuje różne wartości (a więc nie jest stała, jak np. płeć zakonników w zakonie męskim) i jest w sposób jednoznaczny przypisana interesującym nas obiektom. Niektóre zmienne, takie jak wzrost, są ciągłe i mogą przyjmować każdą wartość z interesującego nas zakresu (a więc 173 cm i 1 mm, 173 cm i 2 mm itd.), choć nasze narzędzia pomiarowe często czynią z ciągłych zmiennych zmienne nieciągłe (dyskretne, skokowe) - przyjmujące tylko całkowite wartości z kontinuum. Inne zmienne, takie jak np. konkretne zachowania w sytuacji eksperymentalnej (1 - pomógł, 2 - odmówił pomocy, 3 - obiecał pomóc później) są z definicji nieciągłe, bo mogą przyjmować tylko określoną liczbę wartości. Aby zoperacjonalizować zmienne teoretyczne, musimy określić, jak obserwacje otaczającej nas rzeczywistości można przełożyć na coś, co będziemy mogli analizować, czyli na dane. Celem pomiaru jest umieszczenie osób badanych na pewnym kontinuum, tak aby odległość dwóch osób (różnica w wynikach w danej zmiennej empirycznej) odzwierciedlała ich odległość na kontinuum przedstawiającym zmienną teoretyczną. Jeżeli naszą zmienną teoretycznąjest POZIOM WIEDZY ze statystyki zoperacjonalizowany w postaci zmiennej empirycznej: WYNIKI z egzaminu, to oczekujemy, że różnica między poziomem wiedzy Kasi i Janka powinna odpowiadać różnicy

Operacjonalizacja zmiennych teoretycznych

w ich wynikach na egzaminie. Wiemy też, że zmienna empiryczna WYNIK egzamina~ cyjny może być lepszym lub gorszym wskaźnikiem zmiennej teoretycznej POZIOM WIEDZY, ponieważ na jej wartości wpływają także zmienne zakłócające, takie jak: stopień motywacji, poziom koncentracji, błędy w systemie oceniania, pomyłki itd. Jeżeli nasz egzamin składa się z dwóch pytań, to jego wynik będzie zapewne dużo gorszym wskaźnikiem zmiennej teoretycznej niż wtedy, gdy pytań było dwadzieścia. Zmienną teoretyczną OGLĄDANIE PRZEMOCY w TV możemy doprecyzować, mówiąc o ilości czasu, jaki dana osoba poświęca na oglądanie programów zawierających przemoc. Możemy próbować mierzyć związek między ilością czasu, jaki dziecko spędza na oglądaniu aktów przemocy w telewizji, a jego tendencją do wybierania agresywnych rozwiązań dla swych problemów. Musimy ustalić, jak zmierzymy obie zmienne. Analogicznie, musimy podjąć wiele podobnych decyzji, budując wskaźnik agresywności zachowania. I tu pojawia się często zadawane przez studentów pytanie: jak zmierzyć agresywność zachowania? Odpowiadając na to pytanie, można przytoczyć anegdotę o profesorze, który pokazał swoim studentom ziemniaka i zapytał, jak go zmierzyć. Studenci podeszli twórczo do problemu i prześcigali się w propozycjach, aby podać jego wagę, kształt, kolor, stopień zawartości wody itd. Dopiero po chwili zrozumieli, że nie można odpowiedzieć na to pytanie, zanim nie ustali się, co nas w tym ziemniaku interesuje. Chcąc określić agresywność zachowania, musimy powiedzieć dokładnie, jaki aspekt agresywności nas interesuje i sprecyzować, o co będziemy pytać rodziców, nauczycieli, rówieśników. Wskaźnikiem ilości czasu mogą być odpowiedzi badanych na pytania dotyczące tego, jakie programy oglądają i jak często. Możemyoto samo zapytać rodziców. Musimy też ocenić, które programy są niebezpieczne, np. na podstawie oceny ekspertów. Jeżeli Adaś mówi, że ogląda systematycznie filmy pełne scen przemocy, to nasz wskaźnik powinien mieć dla niego wyższą wartość niż dla Krzysia, który nie ogląda tych filmów, aj edynie filmy przyrodnicze. Bez względu na to,jakijest nasz stosunek do matematyki, operacjonalizacja zmiennej OGLĄDANIE PRZEMOCY w TV zakończysię przypisaniem każdemu dziecku pewnej liczby. Szczegóły tej operacji poznamy w następnym rozdziale. Przy budowaniu wskażników zmiennych teoretycznych wskazane jest odwoływanie się do operacjonalizacji opisanych w pracach innych autorów.

"'--t

19

Rozdział

1. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje

badań

Tenninem zmienna określamy zarówno zmienne teoretyczne, jak i obserwacyjne, inaczej empiryczne. Badacze często określają swoje zmienne na różnym poziomie ogólności (np. agresywność, skłonność do udziału w bijatykach, wynik w kwestionariuszu mierzącym agresję). Brak standardowych operacjonalizacji zmiennych teoretycznych powoduje, że często badacze tworzą własne definicje (i operacjona1izacje). Po latach walki o definicje takich pojęć, jak inteligencja, motywacja czy osobowość, uznano, że są to pojęcia naturalne, których w sposób tradycyjny (przez podanie warunków koniecznych i wystarczających) zdefiniować się nie da. Nie sposób porównać wyników badań np. nad zależnościądobrostanu od inteligencji, jeżeli nie znamy operacjona1izacji zmiennych. Konsekwencją tego jest tendencja do fonnułowania hipotez w języku zmiennych empirycznych, a nie zmiennych teoretycznych. Spotkamy się więc często ze sfonnułowaniem"wpływ systemu nagradzania na wynik w teście", choć można sądzić, że badacz jest w rzeczywistości zainteresowany funkcjonowaniem intelektualnym, a nie tylko wynikiem w konkretnym teście. Zalecane jest jednak fonnułowanie hipotez w tenninach nieobserwowalnych zmiennych teoretycznych z równoczesnym wskazywaniem operacjona1izacji, czyli sposobu budowania zmiennych empirycznych (czytaj: związków wskaźników ze zmiennymi teoretycznymi). Nie sposób przecenić roli teorii w badaniach naukowych. W tym podręczniku poświęconymanalizie danych jest ona pominięta, ale zakładamy, że Czytelnik zapozna się z literaturą metodologiczną [1,5, 19].

Badania korelacyjne Każda osoba biorąca udział w badaniu jest przedstawiona jako punkt, którego pierwsza współ­ rzędna (X) odpowiada jej poziomowi stresu, natomiast druga współrzędna (Y) jej wynikowi

w teście.

y

~

o

!-,--~-~--~-~-------J"x STRES1

Rysunek 1.1. Przykład pozytywnego (dodatniego) liniowego związku między poziomem stresu a sprawnością intelektualną (współczynnik korelacji wynosi 0,77) y

"r-:-------------,

Badania korelacyjne Jeżeli badamy związek między dwiema zmiennymi, np. poziomem stresu egzaminacyjnego a wynikiem w teście, to może się okazać, że jest on: 1. pozytywny (współczynnikkorelacj i między dwiema zmiennymi ilościowymi omówiony w rozdziale 8. jest dodatni (patrz rysunek 1.1), co oznacza Geżeli jest istotny statystycznie), że im wyższy poziom stresu, tym wyższy wynik w teście lub 2. negatywny (ujemny-patrz rysunek 1.2), co oznacza Geże1ijest istotny statystycznie), że im wyższy poziom stresu, tym niższy wynik w teście. Jeżeli związek między poziomem stresu a sprawnością intelektualną jest krzywoliniowy, współczynnik korelacji liniowej może wynieść zero, co przez początku­ jących badaczy bywa błędnie interpretowane jako brak związku (patrz rysunek 1.3), a oznacza jedynie brak związku liniowego. Badania, w których obserwujemy jedynie współwystępowaniezmiennych nazywane są badaniami korelacyjnymi.

~

-_~-~--~-~-~

o!-,

x

STRES1

Rysunek 1.2. Przykład negatywnego (ujemnego) liniowego związku między poziomem stresu a sprawnością intelektualną (współczynnik korelacji wynosi -0,80) y

.1--------_._---------~ ~ '~-_o-____."----~-----J,, X STRES!

20

Ry~~n~k 1.3. Przykład krzywoliniowego związku między poziomem stresu a spraw0,05)

nosclą rntelektualną (współczynnik korelacji wynosi

21

Badania eksperymentalne

Rozdział 1. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań

Badania eksperymentalne Załóżmy, że stwierdziliśmy dodatnią korelację między zmiennymi OBSERWACJA PRZEMOCY i AGRESJA. Czy to oznacza, że oglądanie agresji w TV jest przyczyną agresywności u dzieci? Niekoniecznie. Może to także znaczyć, że dzieci z natury agresywne, po prostu lubią oglądać przemoc i że byłyby one równie agresywne, nawet gdyby całymi dniami oglądały ckliwe dobranocki. Aby wykazać zależność przyczynową między oglądaniem przemocy w TV a zwiększeniem agresywności, musimy przeprowadzić badania eksperymentalne. Jak można to zrobić? Na przykład dzieląc losowo dzieci na dwie grupy. Jednej grupie (grupa eksperymentalna) pokazujemy odcinek serialu telewizyjnego, w którym ludzie zachowują się bardzo agresywnie przez 50 minut w ciągu odcinka. Inne dzieci, przydzielone losowo do grupy kontrolnej, przez tyle samo czasu oglądają film niezawierający przemocy. Najważniejsze jest to, że każde dziecko ma równe szanse, iż będzie wybrane do oglądania serialu, dzięki temu w eksperymencie zostają zneutralizowane wszelkie różnice między dwiema grupami eksperymentalnymi pod względem charakteru dzieci. Jeżeli dzieci, które oglądały serial, wykazywały potem większą agresywność w zabawach niż dzieci, które oglądały neutralny film, to fakt ten wyraźnie sugeruje, że oglądanie przemocy może doprowadzić do jej stosowania. Gdy interesuje nas zależność przyczynowa, hipotetycznąprzyczynę nazywamy zmienną niezależną, ponieważ to eksperymentator ustala jej wartości - manipuluje nią. Jest ona niezależna od innych wpływów.

Zmienną niezależną nazywamy tę, której wpływ chcemy zbadać. Zmienna zależna jest tym, co mierzymy, aby ocenić skutki "działania" zmiennej niezależnej.

22

W omawianym eksperymencie "manipulowaliśmy" rodzajem oglądanej audycji telewizyjnej - zmiennąniezależną było oglądanie lub nieoglądanie filmu pokazującego przemoc. Zmienna niezależna przyjmowaławięc dwie wartości (O - film bez przemocy; 1 - film z przemocą). Efekt manipulacji eksperymentalnej powinien się przejawić w zmianach zmiennej zależnej, nazwanej tak, ponieważ eksperymentator spodziewa się wyniku zależnego od zmian wprowadzonych przez zmienną niezależną. W tym eksperymencie zmienną zależną był stopień agresji przejawianej w zachowaniu. Model teoretyczny tworzony przed rozpoczęciem badań zawiera zazwyczaj wię­ cej zmiennych niż te, których pomiaru dokonamy. Brzeziński [5] proponuje, aby podzielić je na istotne i nieistotne, wyróżnić zmienne uboczne - zakłócające.

Często zbieramy dodatkowe informacje, które mogą być wykorzystywane w dalszych analizach, np. notujemy płeć, wiek badanych, mierzymy u nich poziom lęku. Tego typu zmienne nazywane są zmiennymi kontrolowanymi, ponieważ możemy je wprowadzić do analizy.

Operacjonalizacja zmiennej

niezależnej

w badaniach eksperymentalnych W eksperymencie psychologicznym wartości zmiennej niezależnej wyznaczane są przez różnice w sytuacjach eksperymentalnych, a zmienna zależna jest pomiarem reakcji badanego. Zmienna musi mieć co najmniej dwie wartości - inaczej byłaby stałą. Potrzebne są co najmniej dwie wartości zmiennej niezależnej, by móc zademonstrować, że manipulacja przyniosła efekt, podczas gdy eksperyment z tylko jedną wartością zmiennej niezależnej nie pozwala określić, czy jego rezultat, wyrażany za pomocą wartości zmiennej zależnej, ma coś wspólnego z obecnością zmiennej niezależnej. W eksperymencie AGRESJA wprowadzono dwie wartości zmiennej niezależnej : oglądanie filmu z przemocą lub bez, i to one wyznaczały podział na grupę eksperymentalną (z przemocą) i grupę kontrolną (bez przemocy). Zmienne niezależne nazywane są często czynnikami, a ich wartości poziomami czynnika. Stosując tę terminologię, powiedzielibyśmy, że w naszym badaniu czynnik "przemoc" miał dwa poziomy. Kiedy pytanie zostanie już przekształcone w twierdzenie stanowiące hipotezę badawczą, eksperymentator musi zdecydować, jak zaprojektowaćprocedurę eksperymentalną. Jednym z najtrudniejszych zadań badacza jest przełożenie hipotezy na specyficzne, obserwowalne zdarzenia. Jeżeli chcemy się dowiedzieć, czy ludzie szybciej reagują (naciskając odpowiedni klawisz) na zapalające się światło, gdy towarzyszy mu dźwięk, zmienna niezależ­ na jest określona w sposób oczywisty - obecność lub brak dźwięku. Jeżeli jednak chcemy określić, czy agresywność dzieci wzrasta po obejrzeniu filmu z dużą dawką przemocy, zmienna niezależna - przemoc, jest dużo trudniejsza do zdefiniowania. Potrzebujemy definicji operacyjnej, czyli operacjonalizacji naszej zmiennej teoretycznej. Oznacza to, że musimy określić operacj e, jakie trzeba wykonać, aby wprowadzić daną wartość zmiennej niezależnej. Operacjonalizacja przypomina przepis kulinarny, ponieważ określa dokładnie, co inny badacz, który chce zreplikować nasz eksperyment, powinien zrobić. W badaniu poświęconym wpływowi oglądanej w telewizji agresji operacjonalizacja zmiennej niezależnej musi określać, co należy zrobić, aby uznać dany film za "niebezpieczny", tzn. zawierający dużo aktów przemocy. Możemy pokazać różne filmy losowo wybranej grupie 100 osób i określić jako niebezpieczny ten, który uzyska ponad 75% wskazań. Innym sposobem jest zadanie 10 pytań typu: "Czy w filmie pokazywano bójki?", "Czy któryś z bohaterów poniżał inną osobę?" itp. Możemy założyć, że film, który otrzymał co najmniej dwie odpowiedzi TAK, jest niebezpieczny. Analogiczny problem pojawi się przy operacjonalizacji zmiennej zależnej.

23

Rozdział

1. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań

W eksperymencie możemy obserwować zachowanie dziecka w pokoju z zabawkami po obejrzeniu "niebezpiecznego" filmu i porównywać je z zachowaniami dzieci, które oglądały "bezpieczny" film. Potrzebne będą skale, na których obserwatorzy (określani jako sędziowie kompetentni) będą oceniać zachowanie dzieci. Operacjonalizacja zmiennych teoretycznych jest podstawowym i bardzo trudnym krokiem, ponieważ w naukach społecznych brak jest standardowych procedur. Dla bardzo wielu zmiennych teoretycznych, takich jak: poczucie winy, niepokój, poczucie własnej godności czy agresja, nie ma jednej, "prawdziwej" operacjonalizacji. Prowadzi to do problemów w porównywaniu wyników badań, które na poziomie teoretycznym dotyczą tej samej zależności, ale w praktyce wykorzystują zupełnie inne operacjonalizacje zmiennych. Dzieje się tak dlatego, że operacjonalizacja jest ściśle związana z kontekstem eksperymentu. Nie możemy stosować tego samego filmu, badając dzieci i młodzież. Inaczej też musimy zoperacjonalizować agresywność zachowania u dzieci i młodzieży. Podobnie jest w badaniach korelacyjnych. O inne pogramy będziemy pytać dzieci, o inne młodzież. Warto zauważyć, że o ile w badaniach eksperymentalnych zmienna niezależna, którą manipulujemy, jest wyznaczona jednoznacznie, to w badaniach korelacyjnych role zmiennych możemy łatwo odwrócić. Możemy sądzić, że to agresywność dzieci wpływa na wybór programów telewizyjnych, a więc jest zmiennąniezależną, od której zależy ilość oglądanej w telewizji przemocy (zmienna zależna). Należałoby więc w badaniach korelacyjnych zrezygnować z używania terminologii "zmienna niezależna - zmienna zależna", zastępując określenia "niezależna" przez wyjaśniająca, "zależna" przez wyjaśniana. Zgodnie z umową społeczną używamy jednak pojęć "zmienna niezależna" i "zależna", także w badaniach korelacyjnych.

Porównanie badań eksperymentalnych i korelacyjnych

24

Powtórzmy: Pierwszym krokiemjest sformułowanienaszego ogólnego zainteresowania problemem w postaci konkretnego pytania badawczego ujętego jako zależność między zmiennymi teoretycznymi. Następnym krokiemjest znalezienie sytuacji, w których możemy zaobserwować interesujące nas zjawisko. Jeśli jesteśmy zainteresowani wpływem sposobu odżywiania na samopoczucie, powinniśmy określić typy diet, które mają tę różni­ cę w zakresie samopoczucia powodować. W przypadku pewnych pytań musimy poczekać na zaistnienie okoliczności umożliwiających obserwację. Psychologowie społeczni, którzy chcą studiować ludzkie reakcje na klęski żywiołowe, zmuszeni są "czekać na": powódź, tornado, trzęsienie ziemi lub inne nieszczęścia. Analogicznie astronomowie oczekują na zbliżenie się komety do Ziemi, aby dokonać swoich obserwacji. Eksperyment różni się od innych typów naukowych dociekań tym, że zamiast czekać na zaistnienie interesujących nas wydarzeń naturalnych, eksperymentator kreuje warunki potrzebne do obserwacji. Ma to dwie podstawowe zalety:

Porównanie

badań

eksperymentalnych i korelacyjnych

Po pierwsze, konstruowanie sytuacji eksperymentalnej pozwala na uwypuklenie czynników nieistotnych. Na przykład w badaniu ZIELONA HERBATA sytuację eksperymentalną można zaaranżować w taki sposób, że jedni badani piją zieloną herbatę na czczo, podczas gdy druga grupa pije na czczo czarną herbatę. W codziennym życiu wpływ herbaty mógłby być modyfikowany np. przez rodzaj spożywanego śniadania. Po drugie, eksperymentator może kontrolować i systematycznie zmieniać warunki, aby zbadać dokładnie tę samą sytuację zawierającą lub nie pewne elementy (np. herbata na czczo, herbata po obiedzie). Gdyby badacz chciał zastosować nieeksperymentalny schemat badania, musiałby znaleźć "naturalne" grupy pijące herbatę różnego rodzaju. Ludzie pijący herbatę niejednakowych rodzajów mogą się różnić pod wieloma względami. Znalezienie dwóch grup, które są podobne do siebie pod wszystkimi względami (dieta, aktywność, ciśnienie krwi) z wyjątkiem jednego interesującego badacza czynnika, jest bardzo trudne, jeżeli nie niemożliwe. Co ważniejsze, eksperymentator ma możliwość decydowania o tym, które osoby będą przydzielone do danych warunków eksperymentalnych. W naturalnych warunkach ludzie wybierają grupy (herbatę) w zależności od swoich preferencji. Dbający o zdrowie mogą wybierać zielonąherbatę, nie zważając na jej smak, inni natomiast lubią słod­ ką, czarną herbatę z cytryną. W eksperymencie losowo przydzielamy badanych do poszczególnych grup. Jeżeli badani w grupie pij ącej zieloną herbatę popełniali o wiele mniej błędów w żmudnych zadaniach rachunkowych, eksperymentator wiedział, że był to efekt wypicia zielonej herbaty, a nie preferencji czy uzdolnień badanych. Wyniki eksperymentu, w odróżnieniu od innych procedur badawczych, dają solidną podstawę do formułowania wniosków o przyczynowości. Eksperyment, choć jest najlepszą, to nie jedyną metodą odpowiadania na interesujące nas pytania i czasami wybieramy inny schemat badawczy [1, 5, 6, 15, 19]. Są trzy powody, które mogą skłonić nas do prowadzenia badań nieeksperymentalnych. Pierwszym może być brak zainteresowania przyczyną danego zjawiska. Badacz chce, na przykład, przewidzieć, kto zwycięży w następnych wyborach prezydenckich i nie interesuje go, dlaczego jeden kandydat jest bardziej popularny niż inny, lub też pragnie po prostu wykazać występowaniejakiegoś uniwersalnego zjawiska, takiego jak niezależność ekspresji mimicznej od kultury czy skłonność do przeceniania powszechności naszych gustów i zachowań (efekt fałszywej powszechności). W przypadku pytań badawczych, które nie dotyczą przyczyn danego zjawiska eksperyment nie jest nieodzowny, chociaż może być przydatny. Drugim powodem prowadzenia badań nieeksperymentalnych jest to, że pewne sytuacje w warunkach eksperymentu mogą okazać się nieetyczne lub niemożliwe do zaaranżowania. Jeżeli chcemy odpowiedzieć na pytanie, dlaczego małżeństwa niepodobnych do siebie ludzi częściej kończą się rozwodem niż małżeństwa ludzi podobnych, musimy zbadać tę kwestię nieeksperymentalnie. Nie możemy bowiem dla potrzeb eksperymentu skłonić stu kobiet do poślubienia mężczyzn podobnych do nich i stu innych kobiet - do poślubienia mężczyzn zupełnie odmiennych. Trzecim powodem, dla którego badacze podejmują badania nieeksperymentalne jest to, że ich rezultaty mogą poprzedzać lub uzupełniać wnioski z prac eksperynajważniejszych elementów i pominięcie

25

Rozdział 1.

Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań

mentalnych. Przez lata zależność między paleniem papierosów i rakiem płuc była stwierdzania jedynie w badaniach korelacyjnych i można było ją podważać, dopóki w badaniach eksperymentalnych nie wykazano wpływu wyodrębnionej w dymie papierosów substancji, która powoduje raka. Oba typy badań są więc wartościowe, choć prawdziwy eksperyment - czyli taki, który umożliwia poznanie relacji przyczynowej - jest nieoceniony. Czytając o wynikach badań, trzeba umieć odróżniać badania.korelacyjne od eksperymentalnych. Badania korelacyjne mówią jedynie o współwystępowaniu zmiennych, nie pozwalając na proste wnioskowanie przyczynowe*. Ostatnio można było przeczytać, że naukowcy z Uniwersytetu w Bristolu przeprowadzili trwające 20 lat badania 2438 mężczyzn, w czasie których zmarło 835 mężczyzn. Zaobserwowano, że ci, którzy nie golą się codziennie, są bardziej podatni na ataki serca i zawały. Czy czytający te rewelacje mężczyźni mogą uchronić się przed zawałem, goląc się jak najczęściej? Nie, ponieważ jak łatwo było to przewidzieć, okazało się także, że mężczyźni, którzy nie golą się każdego dnia, mniej chętnie się żenią, częściej pracują w zawodach o niskim statusie, co wiąże się np. z paleniem papierosów i niezdrowym stylem życia, częściej też chorują na anginę. Tabela 1.1. Zestawienie na nych z korelacyjnymi Porównanie eksperymentu i badania korelacyjnego

przykładzie

Zmienna

podstawowych cech

niezależna

"oglądanie

przemocy"

Zmienna zależna "zachowanie agresywne"

badań

eksperymental-

Wnioskowanie przyczynowe

badanie eksperymentalne

manipulacja poziomy zmiennej X są losowo przypisywane osobom badanym

wystandaryzowany pomiar zachowania w jednej sytuacji

możliwe przy losowym doborze do grup

badanie korelacyjne

wystandaryzowany pomiar częstości

wystandaryzowany pomiar zachowania

w prosty sposób niemożliwe -

oglądania

dotyczący najczęściej

zależność między

"niebezpiecznych" programów

sytuacji

wielu

Analiza przykładów badań

W literaturze przedstawiany jest podział metod na: (1) obserwacyjne; (2) korelacyjne; (3) eksperymentalne. Jest to klasyfikacja myląca, ponieważ metody obserwacyjne są stosowane zarówno w badaniach korelacyjnych, jak i eksperymentalnych. Podstawowym wymiarem klasyfikacji jest stopień ingerencji badacza w analizowany proces. Ingerencja ta może dotyczyć zarówno pomiaru zmiennej, jak i manipulacji wartościami zmiennej niezależnej Metody pomiaru mogą ingerować w badany proces lub nie. Stosując nieinwazyjną metodę ob.. serwacyjną, przyglądamy się ludziom i rejestruje- {f!J I / ' . \~ my to, co robią, np. za pomocą ukrytej kamery. ~;W. Możemy interesować się m.in. zachowaniami niewerbalnymi (ekspresją mimiczną, ruchami ciała), pewnymi cechami językowymi (tempem mówienia, wysokościągło­ su), zachowaniami werbalnymi. W obserwacji systematycznej przeszkoleni wcześniej obserwatorzy kodują swoje spostrzeżenia według zbioru wcześniej przygotowanych kryteriów. Szczególnym przykładem nieinwazyjnej metody obserwacyjnej jest analiza danych archiwalnych, np. dokumentów, artykułów prasowych, reklam. Nawet przy zwykłej obserwacji świa­ domość, że jest się obserwowanym może wpływać na jej wynik. W inwazyjnych metodach pomiaru ingerujemy w badany proces, choćby zadając naszym badanym pytania, np. w formie kwestionariusza. Możemy wnioskować, jak się osoba czuje, obserwując (np. zza lustra weneckiego) jej twarz lub możemy ją o to zapytać. Ten drugi sposób wskaźnikowania zmiennej SAMOPOCZUCIE jest przykładem metody inwazyjnej, ponieważ nie jesteśmy w stanie wykluczyć, że konieczność odpowiadania na pytanie wywoła zmiany w samopoczuciu pytanego.

fe

.':?;-'

l

dwiema zmiennymi

Analiza

może być

przykładów badań

spowodowana przez trzecią zmienną, nieuwzględnioną

w badaniu

W charakterze ćwiczenia w ocenie wyników badań naukowych przeanalizujmy przykłady zaczerpnięte z artykułu Artura Włodarskiego ("Alkohol tuczy czy wy-

szczupla")*.

Podział na badania korelacyjne

i eksperymentalne jest podstawowy. Trzeba jednak pamiętać, że został on tutaj zaprezentowany w możliwie najprostszej postaci. Istnieje bardzo wiele schematów badawczych odpowiednich do zastosowania do różnych pytań badawczych, które są dokładnie omówione w podręcznikach metodologii [l, 5, 15, 19].

26

• Gdy dysponujemy wiekszą liczbą danych, możemy zwiększyć moc wnioskowania, stosując modelowanie strukturalne [por. 14].

Badanie ALKOHOL 1 "W 1991 r. Colditz zakończył serię zakrojonych na szeroką skalę badań. Pod jego kierownictwem kilkunastoosobowy zespół naukowców przeanalizował dane • Gazeta Wyborcza 26.02.2001.

27

Rozdział

Analiza przykładów badań

1. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań

dotyczące spożycia alkoholu, wagi ciała, sposobów spędzania wolnego czasu i nawyków żywieniowych 138 tys. osób. Ich losy śledzono przez 10 lat. Chodziło o to, by ustalić bezpośredniązależność pomiędzy tuszą a spożyciem alkoholu. Bezpośrednią, to znaczy taką, która wykluczałabywpływ innych czynników. Dzięki temu możemy teraz z czystym sumieniem powiedzieć, że ktoś jest chudszy, bo pije wino do obiadu, a nie np. dlatego, że odżywia się zdrowiej czy chodzi na basen - wyjaśnia uczony. Colditz uprzedza jednak tych, którzy już wpadli na pomysł, aby metodą wysokoprocentowąpozbyć się nadmiaru kilogramów: - Różnica nie jest duża: mniej więcej pięć procent w przypadku mężczyzn i siedem-osiem u kobiet - o tyle popijający są lżejsi od stroniących".

Zmienna

niezależna

Ilość spożywanego

wiele Zmienna

zależna

Zmienne kontrolowane

alkoholu (zmienna

przyjmująca

Zmienna

niezależna

Postać spożywanych

Zmienna

zależna

Waga

Zmienne kontrolowane

Produkty przemiany materii

Typ badania

Eksperymentalne

Uwagi

Zamiana ról jest silną stroną tego badania, bo nawet jeżeli grupa pijąca alkohol charakteryzowała się zwiększoną aktywnością mimowolną i w związku z tym szybciej spalała kalorie, to w drugiej części badania ta sama grupa była w drugim warunku eksperymentalnym. Zastrzeżenie może dotyczyć manipulacji zmienną niezależną. Nie można wykluczyć, że różnica między drinkiem grapefruitowoalkoholowym a napojem grapefruitowym była zbyt MAŁA, aby wpłynąć istotnie na wagę. Jeżeli manipulujemy np. wielkością kary, to zbyt mała różnica między karami zastosowanymi w dwóch grupach może nie wpłynąć na wyniki uczenia. Nie sposób także wykluczyć, że sok grapefruitowy modyfikuje trawienie alkoholu. Wniosek: należy powtórzyć badanie, zmieniając w tym samym schemacie eksperymentalnym operacjonalizację zmiennej niezależnej.

zapewne

wartości)

Waga (mierzona BMI? normy dla wieku,

płci

- nadwaga?)

Sposoby spędzania wolnego czasu, nawyki żywieniowe, zapewne także płeć, wiek, rodzaj wykonywanej pracy itp.

Typ badania

Korelacyjne

Uwagi

Podstawową zaletą tego badania jest duża liczba osób badanych (138 tysięcy!), która pozwala na porównywanie grup wyrównanych pod względem innych zmiennych, np.

gospodynie domowe o tym samym statusie socjoekonomicznym, wieku, wykształceniu itd. Tak naprawdę mamy zapewne do czynienia z dwoma szeregami czasowymi (10 pomiarów średniego (?) spożycia alkoholu i 10 pomiarów wagi) - możemy więc liczyć opóżnione korelacje - spożycie alkoholu w roku 1985 i waga w latach 1986, 1987, 1988, 1989,1990,1991). Bardzo interesujące możliwości, ale wiemy za mało o badaniu. Oczywiście wykazuje ono wszystkie słabości badań korelacyjnych, ale duża próba i seria pomiarów stanowią jego siłę.

kalorii (alkohol, cukier)

Badanie ALKOHOL 3 "Na uniwersytecie w Maastricht (Holandia) przez 5 tygodni organizowano specjalne sesje sałatkowe, których uczestnicy mogli raczyć się sokami owocowymi, wodą mineralną lub wysokoprocentowymi drinkami. Napoje podawano mniej więcej na pół godziny przed potrawami (makaron, szynka, ser, owoce, warzywa i dodatki). Żaden z 52 uczestników badań nie wiedział, że talerz, z którego jadł, miał wmontowaną elektronicznąwagę, a każdy kęs przełykanego jedzenia był uprzednio rejestrowany przez ukryte w blacie stołu kamery. Kiedy już wszystko zmierzono i policzono, okazało się, że ci, którzy pili drinki, jedli z reguły mniej i wolniej od tych, którzy wybierali inne napoje".

Badanie ALKOHOL 2

28

"Przez cztery miesiące 48 ochotników dzień w dzień pochłaniało tę samą ilość kalorii, ale w różnych postaciach. Pierwsze dwa tuziny popijały posiłki drinkiem grapefruitowo-alkoholowym, drudzy napojem grapefruitowym, gdzie alkohol zastąpiono odpowiadającą mu pod względem liczby kalorii ilością węglowodanów. I tak przez dwa miesiące. Potem obie grupy zamieniły się rolami. A działo się to w laboratorium naszpikowanym aparaturą do pomiaru wszystkiego, co tylko czło­ wiek pochłania (j edzenie, picie, powietrze), i wszystkiego tego, co z siebie wydziela (płynne, stałe i gazowe produkty przemiany materii). Wynik? - Wbrew naszym przewidywaniom, wszyscy ważyli po tyle samo. Niezależnie od tego, czy pili alkohol, czy łykali cukier. Wniosek: kaloria jest kalorią bez względu na to, czy pochodzi z ponczu, czy z pączka".

Zmienna

niezależna

Rodzaj napoju (sok, woda, alkohol)

Zmienna

zależna

Ilość

zjadanego pokarmu, czas jedzenia

Typ badania

Korelacyjne

Uwagi

Brak losowego przydziału wartości zmiennej niezależnej. Nie sposób wykluczyć, że osoby pijące drinki jadłyby mniej i dłużej od reszty nawet wtedy, gdyby wcześniej piły wodę. Należy powtórzyć badanie, wręczając badanym losowo jeden z trzech napojów, zmieniając następnego dnia przydział itd. Dla każdego badanego moglibyśmy wtedy policzyć średnią wagę i czas posiłku po (1) wodzie, (2) soku i (3) alkoholu. Taki schemat nazywa się badaniem z powtarzanymi pomiarami.

29

Rozdział

l. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań

Test intuicji psychologicznej: zbiór danych "LEARN". Sposób zapisywania wyników w komputerze Podręcznik poświęcony jest

analizie danych, której dokonywać będziemy najza pomocąjakiegośprogramu statystycznego. Dlatego pierwszy krok stanowi zapisanie zbioru danych. Wyobraźmy sobie, że przeprowadziliśmy badanie, w którym chcieliśmy stwierdzić, czy poziom stresu wpływa na wyniki w sprawdzianie intuicji psychologicznej. Osoby badane zostały losowo przydzielone do 3 grup eksperymentalnych. W grupie 1. ("Strach") straszono studentów konsekwencjami niezaliczenia testu. W grupie 2. osoby były uspokajane, że będą mogły poprawiać test tak długo, aż osiągnązadowa­ lający je wynik. Grupę tę nazwaliśmy "Relaks". W grupie 3. ("Kontrolna") nie wprowadzono dodatkowych informacji. Oprócz testu intuicji psychologicznej badani wypełniali zmodyfikowanąskalę samooceny Rosenberga (5 pytań) i wpisywali informację o swoim wykształceniu,wieku i płci. (Przykładową ankietę z tego badania przedstawia rysunek 1.4). Badacz wprowadził (zakodował) wyniki w komputerze i otrzymał następującą tablicę danych (tabela 1.2). Patrząc na tę mnogość liczb, nawet najbardziej zagorzały przeciwnik statystyki uzna, że aby sformułować jakiekolwiek wnioski, trzeba coś policzyć. Ale jak? Niestety, czeka nas tutaj wiele pułapek, ponieważ liczby wprowadzone do komputera mają różne znaczenie. Zaczynamy od wypisania zmiennych: częściej

30

1. Nr osoby (nr). 2. GRUPA (gr) eksperymentalna różnicowała badanych ze względu na poziom stresu. Przyjmuje ona 3 wartości (1 - "Strach", 2 - "Relaks", 3 - "Kontrolna"). Mówimy, że zmienna GRUPA występowała na 3 poziomach. 3. PLEĆ (pl) - kodując dane, wpisywaliśmy 1 dla kobiet, 2 dla mężczyzn. 4. WYKSZTAŁCENIE (ed) - kodując dane, wpisywaliśmy 1- gdy osoba badana wpisała "wykształcenie średnie ogólne", 2 - gdy wpisała "średnie zawodowe", 3 - gdy wpisała "policealne", 4 - gdy wpisała "licencjat". 5. WIEK (age) - jest to zmienna, która przyjmuje wiele wartości. 6. SI do S5 - odpowiedzi na pytania w teście samooceny. Zakodowaliśmy je następująco: 1 - zdecydowanie tak, 2 - tak, 3 - nie, 4 - zdecydowanie nie, 5 trudno powiedzieć. 7. Pl do PlO - odpowiedzi w teście intuicji psychologicznej. Był to testjednokrotnego wyboru spośród 4 odpowiedzi. Zakodowaliśmy odpowiedzi na poszczególne pytania: 1- gdy została wybrana pierwsza odpowiedź, 2 - gdy druga itd. 8. Pll- pytanie to dotyczyło źródeł czerpania informacji o psychologii. Było to pytanie wielokrotnego wyboru, czyli badany mógł zakreślić więcej niż jed-

Test intuicji psychologicznej: zbiór danych "LEARN" ... ną odpowiedź spośród

czterech możliwych (a, b, c, d). Jeśli odpowiedź została zaznaczona, wpisywaliśmy 1, jeśli nie - O. 9. TIME2. Test intuicji psychologicznej został przeprowadzony powtórnie po dwóch dniach za pomocąrównoważnej wersji testu. Liczbę poprawnych odpowiedzi zakodowano w kolumnie oznaczonej TIME2. W SPSS zmienną jest kolumna w zbiorze danych, np. odpowiedzi na poszczególne pytania. W psychologii mówimy o zmiennych teoretycznych, np. o samoocenie. Odpowiedzi na pytania sąje­ dynie wskaźnikami zmiennej teoretycznej. Będziemy je określaliwedług terminologii SPSS,jako zmienne, dodając przymiotnik "teoretyczna", gdy będziemy mówili o "nor~~ malnych" zmiennych psychologicznych. Przykładowo, badanie wpływu strachu na zachowania afiliacyjne wprowadza dwie zmienne teoretyczne: strach i zachowania afiliacyjne. Muszą one zostać zoperacjonalizowane, czyli przedstawione w formie zmiennych obserwacyjnych (wskaźników). Te wskaźniki będą nazywane zmiennymi w czasie obliczeń, ale zarówno hipotezy, jak i wnioski zostaną sformułowane w języku zmiennych teoretycznych.

31

,

Rozdział

1. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje

badań

Rysunek 1.4. Ankieta LEARN

Test intuicji psychologicznej: zbiór danych "LEARN" ...

Kodowanie

Nr osoby badanej ....... 1.......

nr = 1

GRUPA ....... 1.......

gr = 1

PŁEĆ

[jjJ

kobieta

O

pl = 1

mężczyzna

WYKSZTAŁCENIE [ji średnie

ogólne, O

średnie

zawodowe, O policealne, O licencjat lub

wyższe

ed = 1

WIEK ....... 23....... Ludzie różnie myślą o sobie. Prosimy, abyś określił, na ile poniższe zdania są zgodne z tym, co myślisz o sobie. Żałuję, że nie mogę darzyć siebie większym szacunkiem.

0,27) = 0,39

przy założeniu, że Ho jest prawdziwa

bI) p(M < 4,9)

Chcielibyśmy się przekonać,

czy studenci z badania LEARN nie różnią się pod względem intuicji psychologicznej od populacji, z której zostali wylosowani. Wiemy, że wyniki w sprawdzianie intuicji psychologicznej (IP) mają w populacji studentów rozkład normalny, o średniej 5 i odchyleniu standardowym 2. Innymi słowy, pragniemy się dowiedzieć, czy nasza próba pochodzi z populacji o średniej fi = 5 i a= 2.

= p(z < -0,27) =

cI) p(4,9 5,5) =p(z > 1,35) = Formułujemy

Hl

(hipotezę badawczą)

i

przeciwstawną

do niej Ho

(hipotezę

b2) p(M < 4,5)

zerową).

Hl: Studenci z badania LEARN różnią się pod względem intuicji psychologicznej od populacji studentów. Ho: Studenci z badania LEARN nie różnią się pod względem intuicji psychologicznej od populacji studentów.

..

.

= p(z < -1,35) = 0,09

c2) p(4,5 6 lub 3 < M < 5 przy założeniu, że fi = 5. Obliczmy, jakie jest prawdopodobieństwootrzymania w naszym badaniu i przy takim założeniu średniej:

5,5

Dzięki

a3) p(M> 5,72) =p(z > 1,96) = 0,025 b3) p(M < 4;28) = p(z > -1,96) = .......... c3) p(4,28 0,023.

Zmienna: wynik w teście IQ (zmienna

i ich skal pomiarowych, sforhi otez:

ilościowa)

Z1. Próba losowa N = 16 Z2. Wyniki IQ w populacji mierzone są na skali przedziałowej i mają rozkład N(100, 16)

H1: ,u > 100

Z3. Ho: ,u = 100

Sformułowaliśmy kierunkową hipotezę badawczą, ponieważ

chcemy wykazać, że nasz trening podnosi, a nie obniża IQ. Otrzymanie średniej istotnie niższej od 100 nas nie interesuje.

b) mniejsza od 100 c) większa od 95 d) zawierać się w przedziale (95,105) e) zawierać się w przedziale (98, 102). Ile wyniosą prawdopodobieństwa, gdy próba będzie 9-elementowa?

Wybór testu statystycznego i stat styki: Spełnione są założenia CTG, więc

,uM =,u,

Rozkład lęku w populacji ma rozkład normalny ze średnią,u = 40 i odchylen!e~ stan~ardowym (J= 10. Dla każdej z poniższych prób podejmij decyzję, czy prawdopodoblenstwo, ze została

Statystyka

(J M

ZM

(J = .JN ' czyl'I

ma

rozkład

określenie rozkładu

wiemy, że statystyka M ma rozkład N(,u, (JM), gdzie

,uM =

,

(JM

=

..

N(O, 1)

wylosowana z tej populacji jest mniejsze od 0,05. a) próba N

=9 osób o średniej M =43 z

_ M - f.1 M-

(J M

=M

- f.1

= 43 -

40

(J

10

--

--

.JN

J9

= _3_ '" 0.90 3,33

,'o

iW"

,{

;\>K'"

'~:1KROK3'

;l;~ \ w~h

~;" ~

f"~

reguły decyzyjnej. Wybór poziomu istotokreślenie obszaru krytycznego i wartości

Ustalenie ności

a,

krytycznej statystyki z: Jeżeli

hipoteza zerowa jest prawdziwa, to statystyka M ma rozkład N(100,4).

Jeżeli

b) próba N = 100 osób z wynikiem M = 43, c) próba N = 81 osób o średniej M = 37,

144

d) próba N= 16 osób o średniej M= 37.

z > Zk, to odrzucamy Ho.

Jeżeli

z < Zk, to stwierdzamy brak podstaw do odrzucenia Ho.

145

Rozdział

Rozkład statystyki

4. Testowanie hipotez statystycznych.

Etapy testowania hipotez

Obliczanie wartości statystyki na podstawie otrzymanych wyników: Rozważmy różne wyniki:

Posługując się danymi zawartymi w powyższym przykładzie, dokonaj weryfikacji

M1 = 104

=

.

a) stosując test dwustronny dla a= 0,05

= ZM3 =

.. .

b) stosując test jednostronny dla a= 0,01

ZM1

=107 M3 =108 M2

ZM2

M4 = 96

ZM4

=

..

=88

ZMS

=

.

Ms

c) stosując test dwustronny dla a = 0,01. M1 Zs

Test jednostronny a= 0,05 Podjęcie

-104 =-3

Z1 Zk

Z3 > Zk

więc

więc

= 96 =-1

Z4 Zk{Z>

Test dwustronny a= 0,01

otrzyman.ia wyniku

1,96 lub

Z

< -1,96}

jest mniejsze od 0,05.

zk=1,96

146

Rysunek 4.8. Obszar krytyczny z =1,96

• b.p.d.o. Ho- brak podstaw do odrzucenia Ho

147

Rozdział

4. Testowanie hipotez statystycznych. Rozkład statystyki

Powtórzmy: Testy hipotez kierunkowych to testy jednostronne. Testy hipotez bezkierunkowych to testy dwustronne. Wartości krytyczne z, potrzebne do podjęcia decyzji o odrzuceniu lub nieodrzuceniu hipotezy zerowej sprawdzamy w tablicy rozkładu normalnego. Jeżeli Hl: J1 > 100 (kierunkowa hipoteza badawcza) przewiduje wyniki w naszej próbie większe od 100, to bierzemy pod uwagę tylko prawy (dodatni) koniec rozkładu z, a wartością krytyczną z jest wartość, powyżej której znajduje się 5% rozkładu z. W tym przypadku wartością krytyczną z jest 1,64, ponieważ 5% obszaru rozkładu z znaj duj e się powyżej 1,64. W takim przypadku zapada decyzja o odrzuceniu hipotezy zerowej, jeśli z jest większe od 1,65. Analogicznie, jeżeli Hl: J1 < 100 (kierunkowa hipoteza badawcza) przewiduje wyniki w naszej próbie mniejsze od 100, to bierzemy pod uwagę tylko lewy (ujemny) koniec rozkładu z, a wartością krytyczną z jest wartość, poniżej której znajduje się 5% rozkładuz. W tym przypadku wartościąkrytyczną Z jest-1,64, ponieważ 5% obszaru rozkładu z znajduje się poniżej -1,64. W takim przypadku zapada decyzja o odrzuceniu hipotezy zerowej, jeśli z jest mniejsze od -1,64. Porównajmy teraz tę wartość krytyczną z wartością krytyczną otrzymaną dla hipotezy bezkierunkowej przy tym samym poziomie a. Wartości krytyczne dla hipotezy bezkierunkowej uwzględniają, że wartość statystyki może być dodatnia albo ujemna - są położone tak, że połowa znajduje się powyżej wartości dodatniej, a połowa poniżej wartości ujemnej. Dla wybranej przez nas istotności a= 0,05, co oznacza, że będzie nas interesowało 2,5% (0,025) rozkładu z znajdujące się powyżej dodatniej wartości krytycznej i 2,5% (0,025) rozkładu z znajdujące się poniżej ujemnej wartości krytycznej. Rysunek 4.8 pokazuje wartości krytyczne z odczytane z tablicy rozkładu normalnego -1,96 i +1,96 dla a = 0,05. W tym przypadku zapada decyzja o odrzuceniu Ho, jeśli z jest większe niż +1,961ub mniejsze niż-1,96. Można zauważyć, że jeżeli z jest dodatnie, potrzebnajest mniejsza wartość bezwzględna z, że­ by odrzucić Ho, gdy jest testowana dodatnia hipoteza kierunkowa (np. Hl: J1 > 100) niż gdy jest testowana hipoteza bezkierunkowa. Z tego powodu badacz stosujący testy jednostronne może być podejrzewany o to, że przerobił swoją hipotezę badawczą na kierunkowąpo obejrzeniu wyników, widząc, że otrzymał wynik niepozwalający na odrzucenie hipotezy zerowej za pomocą testu dwustronnego. Aby uniknąć takich podejrzeń, najlepiej jest stosować testy dwustronne nawet wtedy, gdy teoria dokładnie przewiduje kierunek zależności. Jeżeli przyjmiemy a= 0,01 (chcemy się mylić nie częściej niż 1 raz na 100), to przy dodatniej hipotezie kierunkowej wartość krytyczna z wynosi 2,33. W tym przypadku hipoteza zerowa jest odrzucana tylko wtedy, jeżeli z jest większe od +2,33 w teście jednostronnym. Dla hipotezy bezkierunkowej wartości krytyczne są równe: +2,58 i -2,58. W tym przypadku Ho jest odrzucana, jeżeli z jest większe niż +2,58 lub mniejsze niż -2,58.

Etapy testowania hipotez

Określ wartość krytyczną z dla następujących poziomów istotności: a) a = 0,05 dla testu dwustronnego b) a = 0,05 dla testu jednostronnego. Szukamy w tablicach rozkładu normalnego: dla testu dwustronnego P2 = 1/2a i odczytujemy wartość z = 1,96; dla testu jednostronnego P2 = a i odczytujemy wartość z = 1,64.

Określ wartość krytyczną z dla następujących poziomów istotności: c) a = 0,02 dla testu dwustronnego d) a = 0,02 dla testu jednostronnego e) a = 0,01 dla testu dwustronnego f) a = 0,01 dla testu jednostronnego g) a = 0,001 dla testu dwustronnego h) a = 0,001 dla testu jednostronnego.

Test

a= 0,05 a= 0,02 a= 0,01 a= 0,001 jednostronny 1,64 dwustronny

'0'idzim~, ż.e przy tej samej wartości średniej otrzymanej w naszym badaniu może się zdarzyć ze podejmiemy zupełnie inne decyzje dotyczące Ho w zależności od: ' 1. sposobu sformułowania H 1: kierunkowo (test jednostronny) lub bezkierunkowo (test dwustronny); 2. wyboru poziomu ryzyka - poziomu istotności a.

Używ~jąc d~ustronnego testu na poziomie istotności a = 0,01 oraz a = O 05 przeprowad . test hlp~~ez, ze nast~pujący zbiór wyników X: 1, 2, 3, 4, 5, 6, 7, 8, 9 został W;los~wany z dan~ populaCji o rozkładzie normalnym, gdy: a) M = 5; N = 9; f1 = 6,5; (]'= 3

3 (jM= J9=1 dla a

148

1,96

5-65

z = - - ' =-15 1 '

=0,05 Zk =1,96, więc nasza decyzja to b.p.d.o Ho

dla a= 0,01 Zk = 2,33, więc nasza decyzja to b.p.d.o Ho.

149

Rozdział

4. Testowanie hipotez statystycznych.

Rozkład statystyki

Etapy testowania hipotez

Ustalenie reguły decyzyjnej: Posługując się

o

rozkładach

danymi zamieszczonymi w przykładzie 4.9, zweryfikuj hipotezy dla populacji normalnych, gdy:

Poziom istotności dla testu jednostronnego a = 0,05

b).u=6,5;

0'=1

Wartość krytyczna Zk = 1,64

c).u=4;

0'=4

Jeżeli

d) .u=4;

0'=2

e).u=3,5;

0'=2

f) .u=7;

0'=2

g) .u = 3;

O' = 4.

ZM

= 1,64, odrzucimy Ho. Jeżeli

ZM

Obliczanie wartości statystyki:

9

eJ M

Parametry

Zk dla

ZM

a)

.u =6,5

0'=3 -1,5

b)

.u =6,5

0'=2

c)

.u=4

0'=4

d)

.u=4

0'=2

e)

.u =3,5

0'=2

f)

.u=7

0'=2

g)

.u=3

0'=4

a = 0,01

2,33

Decyzja

a = 0,05

Zk dla

b.p.d.o. Ho

1,96

= J25 = 1,8

z= 46-45 =056 1,8 '

Decyzja b.p.d.o. Ho Podjęcie decyzji: Ponieważ ZM

< 1,64, to b.p.d.o. Ho.

SCHEMAT WNIOSKOWANIA Zmienne

Wynik w teście - zmienna ilościowa

Założenia

Spełnione są założenia testu z.

Ho:.u =45

Hipotezy

Wybór testu i rozkład statystyki Wyniki w

teście

< 1,64, b.p.d.o. Ho.

kompetencji szkolnych po gimnazjum

mają rozkład

normalny N(45,9).

Firma AVANTI reklamuje swoje kursy przygotowujące do tego egzaminu, jako dające pewność jego pomyślnego zdania. Spośród uczniów, którzy ukończyli ten kurs wylosowano 25osobową próbę. Średni wynik w tej grupie wyniósł 46 punktów. Czy mógłbyś na tej podstawie potwierdzić prawdziwość reklamy?

Reguła

H1:.u > 45

Statystyka Z ma rozkład normalny N(0,1).

decyzyjna

Test jednostronny a

=0,05; Zkryt =1,64;

Odrzucimy Ho, jeżeli z> 1,64 .

Obliczenia eJ M

=

9 J25 = 1,8

Decyzja

z=

46-45 =0,56 1,8

b.p.d.o. Ho

SCHEMAT WNIOSKOWANIA Określenie zmiennych i ich skal mułowaniezałożeń i hipotez::

pomiarowych, sfor-

Zmienne (skale pomiarowe): wynik w teście - zmienna ilościowa Założenia:

N(45,9), próba losowa N = 25

150

Statystyka z ma

rozkład

normalny N(0,1)

,,-(,

C:~J~~enie4.12. ..,' ,,"

Dziewię~iu uczniów szkoły artystycznej wypełniało test językowy i popełniło następującą licz-

bę błędow: 13,10,11,12,13,14,15,16,13.

M=13N=9

Hipotezy: Ho: .u = 45; H1 : .u > 45

Wybór testu i ustalenie

'j'.

rozkładu statystyki:

~rzeprowadź test hipotezy, że uczniowie szkoły artystycznej nie różnią się pod względem liczby błędów w teście językowym od a) populacji N(14,2) b) populacji N(11,2) c) populacji N(12,3) d) populacji N(15,3). Zastosuj test dwustronny i wybierz poziom istotności a = 0,05.

151

-

Etapy testowania hipotez

Rozdział 4. Testowanie hipotez statystycznych. Rozkład statystyki

c) N(12,3) SCHEMAT WNIOSKOWANIA

a) N(14,2) SCHEMAT WNIOSKOWANIA

Zmienne Zmienne Założenia

Spełnione są założenia testu

z.

Założenia

Spełnione są założenia

testu z.

Spełnione są założenia

testu z.

Hipotezy Hipotezy

Wybór testu i rozkład statystyki

Wybór testu i rozkład statystyki

Reguła

Reguła decyzyjna

decyzyjna

Obliczenia Obliczenia Decyzja Decyzja

d) N(15,3) SCHEMAT WNIOSKOWANIA

b) N(1l,2) SCHEMAT WNIOSKOWANIA

Zmienne Zmienne Założenia

Hipotezy

Wybór testu i rozkład statystyki Reguła

decyzyjna

Spełnione są założenia testu z.

Założenia

Hipotezy

Wybór testu i rozkład statystyki Reguła

decyzyjna

Obliczenia Obliczenia

Decyzja

Decyzja

153 152

Ryzyko

Rozdział 4. Testowanie hipotez statystycznych. Rozkład statystyki

Etapy wnioskowania statystycznego na podstawie wydruku komputerowego Omówiliśmy procedurę testowania hipotez na podstawie porównania otrzymanej wartości statystyki z odpowiednią wartością krytyczną· Dziś statystyki obliczane są najczęściej przez komputer, a na wydrukach zamiast wartości krytycznych podawane są prawdopodobieństwa. Przy dostępnej mocy obliczeniowej komputerów wyliczenie dokładnychprawdopodobieństwnie stanowi żadnego problemu. Drukowane prawdopodobieństwoto prawdopodobieństwo uzyskania, przy założeniuprawdziwościHo, bezwzględnej wartości statystyki równej lub większej od bezwzględnej wartości statystyki wyliczonej z naszej próby. Wartość bezwzględna

błędu

Porównanie wartości prawdopodobieństwawydmk;:>wanef/o przy '!"~rtości statystyki z wybranym poziomem IStotnoscl a.

3:~i: ;:~~~~i ~~~:f~fe~~~bieństwa wydrukuje komputer, jeżeli w badaniu otrzymaliśmy ZM = 1?

oznacza pomijanie znaku liczby.

Jeżeli średnia, którą otrzymaliśmy w naszym badaniu, po standaryzacji wynosi 2, to na wydruku otrzymamy prawdopodobieństwozwiązane z ZM= 2 lub ZM = -2, ponieważ standardowo pakiety statystyczne wykonują test dwustronny (testująhipotezę bezkierunkową). Dla ZM = 2 wydrukowana wartość p

Sz~kamy w tablicach wartości P2 dla z = 1. Wynosi ono P2 = O 1587 stWierdzamy brak podstaw do odrzucenia hipotezy zerowej. ,.

ZM

Odrzucamy Ho, gdy p (poziom istotności z wydruku)

f.1( -x;" 35; N 10; SD 3,57.

Ponieważ

a 'LD w

Jak wspomnieliśmy, w badaniu LEARN dysponujemy pomiarami wyników w teście intuicji psychologicznej, w dwóch punktach czasowych TIME1 i TIME2, czyli dla każdej osoby badanej dysponujemy parą pomiarów, które są od siebie zależne. Możemy więc przetestować hipotezę, że dla mężczyzn (powiedzmy, że szczególnie interesują nas mężczyźni) różnica mię­ dzy wynikiem pierwszego i drugiego testu wynosi O (Ho: /lo = O).

=

=

Ho: /lo = O Nie ma różnicy między pierwszym a drugim pomiarem w teście intuicji psychologicznej. Wyniki pierwszego i drugiego pomiaru pochodzą z populacji o tych samych

średnich.

H1 : /lo # O. Jest różnica między pomiarem pierwszym i drugim. W teście intuicji psychologicznej wyniki pierwszego i drugiego pomiaru pochodzą z populacji o tych samych

średnich.

Wybór testu i ustalenie rozkładu statystyki: Statystyka t ma rozkład

t Studenta dla df = N - 1 = 13

=

Ustalenie reguły decyzyjnej:

SCHEMAT WNIOSKOWANIA

Poziom istotności: a = 0,05

Zmienne Załoźenia

Hipotezy

Spełnione są założenia testu

t.

Wartość krytyczna: Nie musimy znać wartości krytycznej t, z wydruku odczytamy istotność

p.

Odrzucimy Ho. jeżeli p = 0,05 ,

Wybór testu i rozkład statystyki Reguła decyzyjna

Obliczenia

'" " K~OK I

,

' '\ Obliczanie wartości statystyki: "

Tabela 5.6. Statystyki dla prób zależnych Średnia

170

Decyzja

N

Odchylenie standardowe

Błąd standardowy średniej

Para

TIME1

6,00

14

1,96

0,52

1

TIME2

6,00

14

2,24

0,60

171

Zastosowanie testu t do porównania średnich na podstawie prób

Rozdział 5. Test t Studenta. Przedział ufności

niezależnych

Tabela 5.7. Test dla prób zależnych Różnice w próbach zależnych

Istotność

Błąd

Średnia

Para 1 TIME1 - TIME2

-0,50

t

Odchylenie standardowy standardowe średniej

-0,69 13

0,72

2,71

df

(dwustronna) 0,502

Biolog uważa, że temper~tura otoczenia ma wpływ na kumkanie żab. Grupa żab laboratoryjnych została losowo podzielona na 2 podgrupy i umieszczona w identycznych terrariach. Grupa kontrolna żab jest trzymana w stałej temperaturze 22°C. Grupa eksperymentalna jest trzymana w temperaturze 30°C. Zliczano liczbę odgłosów wydanych przez żaby w ciągu 10-minutowego pomiaru. Ilustrują to następujące dane: Grupa kontrolna (1) 22° C

30° C

Liczba odgłosów

Liczba odgłosów

13,10,11,12,16,14,15,13

52,40,44,48,56,60,64,52

Podjęcie decyzji:

0,502> 0,05, więc nie możemy odrzucić Ho (b.p.d.o. Ho). Stwierdzamy, że nie ma istotnej różnicy w poziomie intuicji psychologicznej między pomiarami.

Czy temperatura wpływa na kumkanie żab? Przetestuj hipotezę, stosując SCHEMAT WNIOSKOWANIA i wiedząc, że:

M1 =13 gdzie n -

Zastosowanie testu t do porówll,ania średnich na podstawie prób niezależnych Gdy chcemy przetestować hipotezę o równości średnich na podstawie badania dwóch niezależnych prób, możemy skorzystać z kolejnego twierdzenia dowiedzionego przez Gosseta. Test t dla prób niezależnych:

Grupa eksperymentalna (2)

M2 =52

s1=2

s2=8

liczebność każdej

df=2(n-1),

z grup.

SCHEMAT WNIOSKOWANIA Określeniezmiennych

i ich skal pomiarowych sfor'

mułowaniezałożeń i hipotez:

Zmienna niezależna: TEMPERATURA (zmienna ilościowa, tu przyjmuje dwie wartości: 22°C i 30°C; traktowana jak zmienna nominalna) Zmienna zależna: LICZBA ODGŁOSÓW (zmienna ilościowa) Założenia:

Zmienna LICZBA ODGŁOSÓW ma w populacji rozkład normalny, próby losowe, wariancje w odpowiednich podpopulacjach są równe, pomiary niezależne. Hipotezy:

Ho: Jeżeli:

Dwie niezależne, równoliczne próby zostały wylosowane z populacji o rozkładzie normalnym i zakładając, że:

Ho: /11 = /12

oraz

2 (J' l

f.J1

H1: f.J1

= f.J2 Temperatura nie wpływa na

liczbę odgłosów

wydawanych przez żaby.

*' f.J2 Temperatura wpływa na liczbę odgłosów wydawanych przez żaby.

= (J'22 '

Wybór testu i ustalenie

rozkładu statystyki:

to statystyka Statystyka t ma rozkład

M 1 -M2

t Studenta dla df = 2(n -

1) = 14.

t =---,~=,,~ s,':s,' ma rozkład t Studenta dla df= 2(n - 1)

=N -

gdzie n - liczebność każdej z prób

i N=2n.

Ustalenie

2, Poziom Wartość

istotności:

krytyczna:

reguły decyzyjnej:

a = 0,05

tkryt (14) = 2,145

Odrzucimy Ho, jeżeli t> 2,145 lub t < -2,145.

172

173

Zastosowanie testu t do porównania średnich na podstawie prób

Rozdział 5. Test t Studenta. Przedział ufności

Metoda wzmocnień

Metoda tradycyjna

Obliczanie wartości statystyki:

t = MI -M2 = 13-52 = -39 = -39 = -13,36 s'+s' J4+64 ~8 5 292 _'_2 8 "'\lo,J ,

(minuty)

(minuty)

10,14,16,13,11,12,15,13

13,17,23,19,15,21,19,25

Przetestuj odpowiednią hipotezę, stosując SCHEMAT WNIOSKOWANIA i wiedząc, że:

II

S22

Podjęcie

SCHEMAT WNIOSKOWANIA

Zmienna niezależna: TEMPERATURA (zmienna ilościowa, przyjmuje dwie wartości: 22°C i 30°C; traktowana jak zmienna nominalna) Zmienna zależna: LICZBA ODGŁOSÓW (zmienna ilościowa) Spełnione są założenia

Założenia

Hipotezy

Zmienne

Założenia

SCHEMAT WNIOSKOWANIA

Ho:

= 16

decyzji:

-13,36 < -2,145 więc możemy odrzucić Ho. Stwierdzamy, że temperatura wpływa na liczbę odgłosów wydawanych przez żaby.

Zmienne

niezależnych

f11

Spełnione są założenia testu

t.

Hipotezy Wybór testu i rozkład statystyki Reguła decyzyjna

testu t.

Obliczenia

=f12 Temperatura nie wpływa na liczbę

odgłosów

wydawanych przez żaby.

H1 : f11 "* f12 Temperatura wpływa

na liczbę odgłosów wydawanych przez żaby.

Decyzja

Wybór testu i rozkład statystyki

Statystyka t ma rozkład t Studenta dla df Odrzucimy Ho, jeżeli

Reguła decyzyjna

Obliczenia

t-

-

M 1 -M2 fĘI SI :8 2

-

-

=N - 2 =14.

t> 2,145 lub t < -2,145

13-52 = -39 = -39 =-1336 J 4+ 64 2,92 ' 8

J83

-13,36 < -2,145, więc możemy odrzucić Ho.

Decyzja

Czy możesz zaproponować inny sposób przeprowadzenia tego eksperymentu, dający biologowi więcej infonnacji?

;;, Y'Ówiczenie 5.~. 1 ',J

ThF

174

'"

;

j,

..,

'"

'"

'.E~...'

, 0,05, to brak podstaw do odrzucenia Ho,

(0,1 > p > 0,05 - to tendencja statystyczna).

2,145, więc możemy odrzucić Ho. Stwierdzamy, że istnieje istotny statystycznie liniowy między liczbą randek a satysfakcją z życia.

związek

Przyjmij,

że

elipsy przedstawione na

poniższych

reprezentują

wykresy korelacyjne.

Twoim zadaniem jest uporządkowanie rysunków ze względu na wartość współczynnika korelacji od najmniejszego do największego.

o (E)

Rysunek 8.5. Siła

254

rysunkach

związku między

o zmiennymi

255

Rozdział 8. Pomiar związku między zmiennymi ilościowymi: współczynnik korelacji liniowej ...

Problemy w interpretacji

współczynnika

korelacji

Tabela 8.3. Korelacje parami dla próby N =30 (poprawki) Jeżeli mierzymy korelację inteligencji z ocenami szkolnymi i mamy dane tylko od dwóch osób, to jakie wartości może przyjąć współczynnik korelacji?

TIME1

Korelacja Pearsona Istotność

TIME2

Na podstawie analizy współczynnika korelacji możemy określić siłę związku (procent wspólnej wariancji). Sprawdź istotność oraz procent wspólnej wariancji liczonych dla prób o różnej liczebności N na podstawie współczynników korelacji.

0,4

0,6

r=

N= 27 N= 102

Istotność

Wspólna wariancja

Istotność

statystyczna

t = 3,75 Wynik istotny b) t = 7,5 Wynik istotny

a)

statystyczna

0,36

c)

0,36

d)

SAMOOCENA

Korelacja Pearsona

,

2

'

,

6~ 100

0,64

Korelacja Pearsona

-,11

-,30

(dwustronna)

,566

WIEK

Korelacja Pearsona Istotność (dwustronna)

,392

PŁEĆ

Korelacja Pearsona

,00

Istotność

(dwustronna)

, ,19

,038 -0,18

1,000

-,38

1

-,38

-,16

,392

,11

,105

,336

PŁEĆ

-,16

,566 -,30

1

,

Istotność

-,11

,014

,44

WIEK

-,18

,038

,336

,19

,12

,318

,516

1

-,03

,318

,

,12

-,03

,516

,00 1,000

,866

,866

1

,

Problemy w interpretacji współczynnika korelacji =062-=375 ' O8 ,

'

Na rysunku 8.6 przedstawiono wykresy korelacyjne czterech różnych grup wyników, dla których współczynnik korelacji wyników jest taki sam i wynosi r = 0,816. We wszystkich przypadkach zmienne mają takie same średnie Mx = 9 My = 7,5, równanie regresji jest dokładnie takie samo. Y' = 3 + 0,5 x X.

= O6..!.Q.. = 75 ' 0,8 ' [a] Tylko dla tego zestawu danych wyniki są wiarygodne

c)

d)

e:>

,... ""

co

co

'O

'O

..::r

4

Na podstawie wydruku macierzy korelacji wypisz pary zmiennych, które są ze sobą istotnie związane.

[c] Przypadek skrajny (outlier)

6

8

10 12 14

..::r ,...

4

6

8

10 12 14

[d] Związek pozorny, przypadek wpływowy (leverage)

,... "" e:> ,...

e:> ,...

co

'O

....

..::r

..::r

4

Rysunek 8.G.

""

[b] Związek krzywoliniowy

..::r ,...

C\I ,...

co

Uwaga: PŁEĆ jest zmienną nominalną, ale ze względu na to, że przyjmuje tylko dwie wartości, założenie o równości przedziałów jest zawsze spełnione i dlatego możemy ją traktować jak zmiennąilościową.

..

,...

"",...

..::r

256

, 0,14

Wspólna wariancja

b)

t = 0,6 102 - 2 = O 1- 0,6 2 '

,44

1

Istotność (dwustronna)

a)

t=06~7-2 =06~ O64 25 , 1- O6

(dwustronna)

Samoocena

TIME2

TIME1

Przykład

6

8

10 12 14

danych Anscombe'a.

5

10

15

20

257

Rozdział 8.

Pomiar związku między zmiennymi

ilościowymi: współczynnik korelacji

Zastosowanie analizy regresji w badaniu LEARN.

liniowej ...

Pierwszy i podstawowy wniosek: należy oglądać dane. W spółczynnik korelacji liniowej służy do badania siły i kierunku związku liniowego między pomiarami, reprezentowanego przez linię prostą. Zatem adekwatny jest tylko do danych typu [a] (rysunek 8.6). Gdy związek nie jest liniowy, możemy zastosować regresję krzywoliniową, czyli zamiast linii prostej dopasowywać krzywą· Powszechnym błędem popełnianym przez badaczy jest stwierdzanie braku związku między zmiennymi, gdy współczynnik korelacji jest nieistotny. W takim wypadku możemy stwierdzić jedynie brak związku linowego. Innym problememjest wrażliwośćwspółczynnikakorelacji na przypadki skrajne i ograniczenie zakresu zmienności zmiennej niezależnej [9].

Tabela 8.4. Model- podsumowanie Model

R

R-kwadrat

Skorygowany R-kwadrat

1

,44

,20

,17

1

Suma kwadratów

Regresja

i=



o



• •

10

TIME1

Rysunek 8.7. Wykres korelacyjny (rozrzutu) wyników obu sprawdzianów w badaniu LEARN z linią regresji dla wszystkich badanych łącznie

kwadrat

38,69

1

38,69

28

5,69

Ogółem

198,00

29

F

Istotność

6,80

,014

Współczynniki Współczynniki

Współczynniki

niestandaryzowane

standaryzowane

b

O-l--_~-_--_-_----ł

Średni

df

159,31

Model

1

[li

2,39

Reszta

Tabela 8.G.

• •

::;

Błąd

standardowy oszacowania

Tabela 8.5. Analiza wariancji

12...---------------, 10

trzeciej zmiennej ...

a Predyktory: (Stała), TIMEl b Zmienna zależna: TIME2

Model

Zastosowanie analizy regresji w badaniu LEARN. Modyfikujący wpływ trzeciej zmiennej (grupa eksperymentalna) na otrzymane zależności

Modyfikujący wpływ

Błąd

(Stała)

2,78

1,31

,54

,21

Istotność

2,12

0,43

2,61

,014

Beta

standardowy

TIME1

t

,44

Wniosek: wyniki sprawdzianu pierwszego są istotnym (p < 0,05) predyktorem dla przewidywania wyników sprawdzianu drugiego. Współczynnik korelacji równy standaryzowanej wadze regresji (fi) wynosi 0,44 i jest istotnie różny od zera. Współczynnik determinacji (R2) wyniósł 0,20, co świad­ czy o tym, że wyniki ze sprawdzianu TIMEl pozwalają wyjaśnić 20% zmienności wyników sprawdzianu TIME2. 12r-------------,

258

Przeanalizujmy wydruk analizy regresji wyników drugiego sprawdzianu (TIME2) z jednym predyktorem (TIME1). Współczynnik korelacji zmiennych wynosi 0,44, współczynnik determinacji (R2) 0,20 (tabela 8.4). Test F porównuje wariancję zmiennej TIME2 wyjaśnioną przez TIMEl do wariancji niewyjaśnionej. Istotność F(p < 0,014) pozwala nam stwierdzić zasadność modelu (tabela 8.5). Z tabeli 8.6 możemy odczytać współczynnik regresji b = 0,54 i standaryzowany współczynnikregresji fJ= 0,44. Takjak stwierdziliśmywcześniej,fJ= r. Zależność ta nie jest jednak prawdziwa, gdy w równaniu jest więcej niż jeden predyktor. Dwie ostatnie kolumny tabeli 8.6 zawierają wartości testu t, który pozwala nam ocenić istotność danej wagi regresji.

10

o i---r'~,..L-:::--~7----1

~

i=

o

o o

GRUPA

02

O;!--_-,--_----,-_ _.,--_--,----_---1.

O TIME1

W

1

Rysunek 8.8. Wykres korelacyjny (rozrzutu) wyników obu sprawdzianów w badaniu LEARN z liniami regresji dla 3 grup

259

Rozdział 8.

Pomiar związku między zmiennymi

ilościowymi: współczynnik korelacji

liniowej ...

Na wykresie korelacyjnym (rysunek 8.7) linia prosta wydaje się być dość dobrze dopasowana do danych, choć niepokoją punkty leżące blisko osi OX wskazujące na 4 osoby, które źle wypadły w sprawdzianie 2., choć uzyskały bardzo różne wyniki w czasie sprawdzianu l. Naniesienie na korelacyjny wykres rozrzutu na rysunku 8.8, identyfikatorów grup eksperymentalnych pokazuje, że wyniki osób z grupy STRACH (Grupa l) są doskonale dopasowane do linii prostej, zaś wyniki grupy RELAKS (Grupa 2) nie wykazują żadnej zależności, co potwierdza prosta regresji równoległa do osi Ox.

Dwóch studentów, niezależnie od siebie, badało związek między częstością uśmiechania a pozycją socjometryczną w grupie. Obaj przeprowadzili badanie na grupach o takich samych liczebnościach. Jeden otrzymał r 0,5, drugi r 0,6. Jaka jest różnica w zdolności przewidywania pozycji socjometrycznej na podstawie częstości uśmiechania się między tymi badaniami? się

=

=

Regresja wielokrotna.

Określanie związku

zmiennej zależnej z więcej niżjednym predyktorem

Możemy także policzyć współczynnik korelacji

wielokrotnej R między wara wartościami przewidywanymi na podstawie równania regresji (kombinacją liniową predyktorów). Podniesiony do kwadratu, pozwala on ocenić procent zmienności zmiennej zależnej, wyjaśniony łącznie przez dany zestaw predyktorów. Ze względu na brak miejsca nie będziemy tutaj wprowadzać wzorów, a skoncentrujemy się wyłącznie na analizie przykładów. tościami

zmiennej

zależnej

Współczynniki

Liczba Predyktory predyktorów

1

X1 -

staż

regresji wyznaczane są przez minimum sumy kwadratów (Y 81 -

Y)2

=(b 1X 1 +

Y)2

Wyliczone równanie regresji Y =$ 520X1 + $ 20411

Porównaj siłę związku między zmiennymi, gdy współczynniki korelacji wynoszą odpowiednio 0,70 i 0,80, 0,2 i 0,3.

Interpretacja współczynników

regresji

każdy dodatkowy rok pracy po doktoracie związany jest z przyrostem wynagrodzenia o $ 520

(średnio)

1

X 2 -liczba publikacji

(Y 82 -

Y)2

=(b 2X2 +

Y)2

Y =$ 566X2 +$21106

każda dodatkowa publikacja związana jest z przyrostem wynagrodzenia o $ 566

(średnio)

Jaka powinna być korelacja między X i Y, aby można było twierdzić, że 64% zmienności X jest wyjaśnione przez zmienność Y?

Regresja wielokrotna. Określanie związku zmiennej zależnej z więcej niż jednym predyktorem Analiza regresji Uedna zmienna zależna, jeden predyktor) daje się łatwo uogólna przypadek regresji wielokrotnej Uedna zmienna zależna, wiele predyktorów). Dopasowujemy wtedy nie prostą, ale hiperpłaszczyznę regresji. Regresja wielokrotna ma olbrzymie znaczenie, ponieważ pozwala ocenić ważność każdego z predyktorówprzy kontrolowaniu wpływu pozostalych. Wagi P(standaryzowane współ­ czynniki regresji) pokazują, o ile zmienia się zmienna zależna wskutek standaryzowanej zmiany predyktora przy zachowanej kontroli pozostałych zmiennych i dzięki testom istotności pozwalają ocenić, który z predyktorów jest istotny.

2

X 1 - staż X 2 -liczba publikacji

=

(Y - Y)2 (b 1X 1 + b2X 2 + 812 - Y)2

Y =$ 479X1 + $ 88X 2 +$20138

każda

dodatkowa publikacja związana jest z przyrostem wynagrodzenia jedynie 0$ 88 (średnio), jeżeli uwzględnimy

w przewidywaniu zarobków także staż (X1 )

* na podstawie [9]

nić

260

261

Rozdział

8. Pomiar związku między zmiennymi

ilościowymi: współczynnik korelacji

Regresja wielokrotna.

liniowej ...

Określanie związku

zmiennej zależnej z więcej n iż jednym predyktorem

Tabela 8.8. Analiza wariancji Suma kwadratów

Model Wzorując się

na

przykładzie

8.4,

uzupełnij następującą tabelę:

Liczba Wyliczone Predyktory predyktorow równanie regresji X1 -

1

Y =$ 800X1 + $ 20000 b1 =

staż

a1

X 2 -liczba publikacji

1

Y =$ 1000X2 + $ 19000 b2 = a2

X 1 - staż X 2 -liczba publikacji

2

=

=

Y =$ 500X1 + $ 100X2 + $ 1950

Interpretacja równania regresji

1 Przewidywania

każdy dodatkowy rok pracy po doktoracie związany jest z przyrostem wynagrodzenia o $

Osoby 3 lata po doktoracie powinny zarabiać średnio y =

każda

dodatkowa publikacja związana jest z przyrostem wynagrodzenia o $ (średnio)

Osoby z 5 publikacjami powinny zarabiać średnio y =

każda

Osoby 3 lata po doktoracie i 5 publikacjami powinny zarabiać średnio Y=

dodatkowa publikacja związana jest z przyrostem wynagrodzenia jedynie $ (średnio) jeżeli o uwzględnimy

w przewidywaniu zarobków także staż (X1 )

W badaniu LEARN chcemy znajomości 3 zmiennych:

wyjaśnić

Regresja

56,09

18,70 5,46

Reszta

141,91

26

198,00

29

F

Istotność

3,43

0,032

Współczynniki

Model

Współczynniki

Współczynniki

niestandaryzowane

standaryzowane

Błąd

b 1

kwadrat

3

Ogółem

Tabela 8.9.

Średni

df

standardowy

(Stała)

5,73

2,13

TIME1

,51

,20

Płeć

Samoocena

t

Istotność

2,69

,012

2,49

,019

Beta

,42

,79

,86

,15

,91

,370

-,51

,36

-,24

-1,41

,171

Tylko wynik sprawdzianu pierwszego (TIME1) był istotnym predyktorem dla przewidywania wyników sprawdzianu drugiego (TIME2). Wprowadzenie dodatkowych zmiennych (choć nieistotnych) polepszyło procent wariancji wyjaśnianej przez model z 20% (tabela 8.4) do 28,3%, jednak nie jest to zmiana istotna statystycznie. Trzeba podkreślić, że wagi regresji zależą od innych predyktorów uwzględnionych w równaniu. Jeżeli pominęlibyśmy SAMOOCENĘ w analizie regresji, współczynniki ftzwiązane z TIME1 i PŁEĆ byłyby różne od tych przedstawionych na wydruku.

wyniki w drugim sprawdzianie (TIME2) na podstawie

1. wyniku pierwszego sprawdzianu (TIME1), 2.

W badaniu PGSS (panel 2003) przeprowadzono analizę zależności wagi respondenta - zmienna 8MI (Body Mass Index) od:

płci,

3. samooceny.

• umiejętności kontroli jedzenia - zmienna DYSC (wysokie wyniki świadczą o braku takiej

a. Predyktory: (Stała), PŁEĆ, TIME1, SAMOOCENA b. Zmienna

zależna:

zdolności),

TIME2

• wieku - zmienna AGE, • płci respondenta - zmier-tna SEX (1 - mężczyzna, 2 - kobieta).

Tabela 8.7. Model- podsumowanie

262

Na podstawie

Model

R

R-kwadrat

Skorygowany R-kwadrat

1

,53

,28

,20

poniższego

wydruku

sformułuj

wnioski.

Błąd

standardowy oszacowania 2,34

Tabela 8.10. Model - podsumowanie Model

R

R-kwadrat

Skorygowany R-kwadrat

1

,401 (a)

,160

,154

Błąd

standardowy oszacowania 3,806

263

Rozdział 8.

Pomiar związku między zmiennymi ilościowymi: współczynnik korelacji liniowej ...

Tabela 8.11. Analiza wariancji Model Regresja Reszta Ogółem

Korelacje

to korelacj a

Suma kwadratów

df

1027,619 5375,161 6402,780

3 371 374

Średni kwadrat

342,540 14,488

F

Istotność

23,642

0,000'

cząstkowa między

dwiema zmiennymi przy kontroli zmiennej WYdo zapoznania się z alternatywnymi definicjami korelacji cząstkowych w [5, 6, 9]. Zostało to schematycznie przedstawione w tabelce: KSZTAŁCENIE.Zachęcamy Czytelnika

Zróżnicowanie Zróżnicowanie zmiennej

Model

p - waga pracy

Współczynniki

Współczynniki

niestandaryzowane

standaryzowane

b

DYSC SEX AGE * wartość

21,544 0,375 -1,577 0,119

Błąd

standardowy

1,162 0,182 0,401 0,016

R - waga religii

t

Istotność

Beta

0,098 -0,189 0,352

18,540 2,055 -3,938 7,377

0,000* 0,041 0,000* 0,000*

zaokrąglona

Korelacj e cząstkowe

264

Błąd

(reszta regresji)

wykształcenie

Tabela 8.12. Współczynniki

(Stała)

zmiennej

wyjaśnione przez

• wartość zaokrąglona

1

cząstkowe

Jednym z najważniejszych problemów procesu badawczego jest kontrola zmiennych, które mogą wpływać na kształt związku między zmienną nie zależną i zależną. Wpływ ten może mieć charakter mediatora lub moderatora. Zależność między masą ciała mierzoną za pomocąBMI a samooceną może być istotna tylko dla kobiet, a nieistotna dla mężczyzn. Powiemy wtedy, że płeć jest zmienną modyfikującązwiązek między BMI a samooceną. Zależność między wagąprzypisywanąpracy a wagą przypisywaną religii może zależeć od wykształcenia respondenta. Wykształcenie może być mediatorem relacji między wagą, którą respondenci przypisują pracy i religii. Jeżeli obie zmienne (niezależna i zależna) są skorelowane z trzecią, należy policzyć korelacje cząstkowe. Jest to współczynnik korelacji uwzględniający związek obu zmiennych z wykształceniem. Jeżeli przeprowadzilibyśmy analizę regresji wagi pracy z jednym predyktorem: wykształceniem, to zróżnicowanie wagi pracy zostałoby podzielone na część wyjaśnioną przez zmienną niezależną: wykształcenie i część niewyjaśnioną, nazywaną przez nas błędem regresji, a którą określa się także jako resztę regresji. Jeżeli przeprowadzilibyśmy analizę regresji wagi religii z jednym predyktorem: wykształce­ niem, to zróżnicowanie wagi pracy zostałoby podzielone na część wyj aśnioną zmienną niezależną: wykształcenie i część niewyjaśnioną (resztę regresji). Te dwie reszty regresji określają zróżnicowanie zmiennych z wyłączeniem zróż­ nicowania wyjaśnionego przez wykształcenie. Korelacja tych dwóch reszt regresji

Pw - zróżnicowanie wagi pracy wyjaśnione przez

Pb - zróżnicowanie wagi pracy niewyjaśnione przez

wykształcenie

wykształcenie

Rw - zróżnicowanie wagi religii wyjaśnione przez

Rb - zróżnicowanie wagi religii niewyjaśnione przez

wykształcenie

wykształcenie

dotyczy związku P i R. Współczynnik korelacji (przy kontroli wykształcenia) to współczynnik korelacji między Pb i Rb. Stosując regresję wielokrotną, możemy liczyć reszty regresji przy większej liczbie predyktorów, np. wiek, wykształcenie, wielkość zarobków itd., co oznacza możli­ wość analizy współczynników korelacji cząstkowej przy większej liczbie zmiennych kontrolowanych. Nie podajemy wzorów, bo obliczenia te dokonywane są za pomocą programu komputerowego. Reszty regresji mogą być zapisywane jako nowe zmienne i poddawane dalszym analizom. Prosty

współczynnik korelacji

cząstkowej

W badaniu PGSS (panel 2003) analizowano związek między 8MI (Body Mass Index) i problemami z nadwagą (zmienna NADWAGA) ze spostrzeganą trudnością w zmianie zachowań sprzyjających zdrowiu (przykład analizowany w rozdziale 3.). Wysokie wartości 8MI i NADWAGA świadczą odpowiednio o dużej nadwadze rzeczywistej i spostrzeganej. Na podstawie wydruków korelacji prostych i cząstkowych ustosunkuj się do 13 przedstawionych poniżej twierdzeń, odpowiadając: 1 P - kiedy dane twierdzenie jest prawdziwe, F - kiedy jest fałszywe lub? - kiedy nie można udzielić odpowiedzi.

Tabela 8.13. Korelacje proste 8MI oraz NADWAGĄ

między

odpowiedziami na pytania 1-17 i wskaźnikiem Korelacje

CHi

CH2

CH3

CH4

CH5

CH6

CH7

CH8

CH9

CH10

BMI

0,03

-0,04

0,15

0,13

0,10

0,065

0,01

0,12

-0,01

0,05

p=

0,62

0,46

0,00

0,01

0,07

0,224

0,83

0,02

0,84

0,39

NAD

0,02

-0,07

0,09

0,05

0,04

0,014

0,04

0,17

0,06

0,13

p=

0,53

0,17

0,09

0,30

0,41

0,796

0,49

0,00

0,27

0,01

265

Rozdział

8. Pomiar związku między zmiennymi

ilościowymi: współczynnik korelacji

liniowej. ..

Korelacje

CH11 CH12 CH13 CH14 CH15 CH16 CH17

4 5 6 7

8 9 10

0,04 -0,03 -O,OS -0,06

O,OS

0,10

0,09

p=

0,49

0,57

0,24

0,15

0,07

0,08

NAD

0,10

0,03 -0,04 -0,09

0,11

0,14

0,10

p=

0,05

0,62

0,04

0,01

0,05

0,16 0,43

0,09

w planowaniu posiłków (CH1), tym większe BMI. planowanie godzin posiłków i ścisłe trzymanie się tego planu (CH2), tym mniejsze kłopoty z nadwagą. Im trudniejsze jest niezjadanie niczego bezpośrednio z lodówki, prosto z opakowania lub garnka (CH3), tym większe BMI. Im trudniejsza całkowita rezygnacja z dokładek (CH4), tym większe problemy z nadwagą. Im szybsze jedzenie (CH5), tym większe BM!. Im trudniejsze przerywanie jedzenia, kiedy czujemy, że moglibyśmy coś jeszcze zjeść (CH7), tym mniejsze BMI. Im łatwiejsze powstrzymanie się od zjedzenia reszty już nałożonego na talerz posiłku w chwili, gdy poczujemy sytość (CH8), tym większe problemy z nadwagą. Im trudniejsze niepodjadanie między posiłkami (CH9), tym większe problemy z nadwagą. Im łatwiejsza pełna koncentracja w czasie jedzenia na przeżuwaniu produktów (CH10), tym mniejsze BMI. Im trudniejsze przeczekiwanie pierwszego głodu (CH11), tym mniejsze problemy z nad-

1 Im 2 Im 3

BMI

większa trudność łatwiejsze

Wprowadzenie zmiennych nominalnych do równania regresji Oceń ponownie poprawność zdań, posługując się macierzą korelacji cząstkowych (po wyłą­ czeniu wpływu płci i wieku respondentów).

Tabela 8.14. Korelacje cząstkowe między odpowiedziami na pytania 1-17 oraz wskaź­ nikiem 8MI i NADWAGĄ przy kontroli zmiennej PŁEĆ i WIEK Korelacje cząstkowe (płeć - wiek)

CH1

CH2

CH3

CH4

CH5

CH6

CH7

CHS

CH9

CH10

8MI

O,OS

0,06

0,15

,022

0,09

0,05

0,11

0,22

0,14

0,17

0,04

0,00

0,23

0,49

0,15

0,00

0,06

0,02

p=

0,26

0,40

NAD

0,14

0,09

0,21

0,21

O,OS

0,04

0,15

0,31

0,22

0,24

p=

0,06

0,23

0,00

0,00

0,26

0,58

0,04

0,00

0,00

0,00

Korelacje cząstkowe (płeć - wiek)

NAD

CH11 CH12 CH13 CH14 CH15 CH16 CH17 0,11 -0,01 -0,05 -0,06 0,11 0,05 0,14 0,15 0,87 0,48 0,44 0,13 0,49 0,05 0,17 0,07 -0,03 -O,OS 0,13 0,09 0,15

p=

0,02

8MI p=

0,36

0,64

0,26

0,07

0,24

0,04

wagą.

łatwiejsze jest wykonywanie codziennych ćwiczeń gimnastycznych (CH12), tym więk­ sze problemy z nadwagą. 12 Im łatwiejsza jest dla nas regularna aktywność fizyczna (CH16), tym niższe BMI. 13 Im łatwiejsza rezygnacja z jazdy autobusem czy samochodem, jeśli można dojść pieszo (CH17), tym mniejsze problemy z nadwagą.

11 Im

Twierdzenia

266

1 2 3 4 5 6 7 8 9 10 11 12 13

Korelacje proste p - prawda, F F

Korelacje fałsz,

cząstkowe

? - nie wiadomo F

Wprowadzenie zmiennych nominalnych do równania regresji Z przeprowadzonych wcześniej analiz wariancji w badaniu LEARN'wiemy, że manipulacja miała istotny wpływ na wyniki w 2. sprawdzianie. Zmienna niezależna GRUPA jest zmienną nominalną i przyjmuje 3 wartości. W żadnym przypadku nie możemy jej traktować jako zmiennej ilościowej. Ten przywilej mają tylko zmienne dychotomiczne, takie jak płeć. Czy to znaczy, że nie możemy jej uwzględnić w równaniu regresji? Możemy, jeśli przekształcimyjąna dwie zmienne, nazywane kontrastowymi (instrumentalnymi, w języku angielskim dummy). Zmienną nominalną maj ącą k wartości możemy zamienić na k - 1 zmiennych kontrastowych. Sposób tworzenia kontrastów zależy od tego, co nas interesuje. My wybraliśmynastępujące porównania: 1. kontrast między grupą STRACH i RELAKS; 2. kontrast między obiema grupami a grupą kontrolną.

Sposób nadania wartości nowym zmiennym w zależności od wartości zmiennej nominalnej przedstawiony jest w tabeli poniżej:

267

Rozdział

8. Pomiar związku między zmiennymi

k1grupa

liniowej ...

1

-1

RELAKS

-1

-1 2

O

Wprowadzenie zmiennych nominalnych do równania regresji

Budowanie równań regresji jest sztuką i przedstawione wyżej przykłady w ża­ den sposób nie wyczerpują zagadnienia. Do równania regresji predyktory mogą być wprowadzane w różnej kolejności, w grupach, możemy wprowadzać też interakcje predyktorów. Ten rozdział stanowi jedynie wprowadzenie do tego sposobu analizy danych.

k2grupa

STRACH KONTROLNA

ilościowymi: współczynnik korelacji

Istotność zmiennej klgrupa w analizie regresji oznacza, że różnica między gruSTRACH i RELAKS istotnie wpływa na wyniki w 2. sprawdzianie. Istotność zmiennej k2grupa oznaczałaby, że grupa kontrolna różniła się istotnie od reszty. pą

Tabela 8.15. Model - podsumowanie

a

Model

R

R-kwadrat

Skorygowany R-kwadrat

1

,82 a

,67

,60

Błąd

standardowy oszacowania 1,66

Predyktory: (Stała), K2GRUPA, K1GRUPA, TIME1, PŁEĆ, SAMOOCENA

Tabela 8.16. Analiza wariancji

1

Suma kwadratów

Regresja

131,90

5

26,38

66,10

24

2,75

198,00

29

Reszta Ogółem

df

kwadrat

F

Istotność

9,58

,oooa*

a

Predyktory: (Stała), K2GRUPA, K1 GRUPA, TIME1, PŁEĆ, SAMOOCENA;

*

wartość zaokrąglona

Tabela 8.17.

Współczynniki

Model

Współczynniki

Współczynniki

niestandaryzowane

standaryzowane

b 1

a

268

Średni

Model

(Stała)

Błąd

standardowy

t

Istotność

3,93

,001

Beta

5,96

1,52

TIME1

0,49

,14

,40

3,38

,002

Płeć

-,79

,61

-,15

-1,29

,209

Samoocena

-,55

,26

-,25

-2,13

,044

K1GRUPA

1,94

,37

,62

5,24

,000

K2GRUPA

,07

,22

,04

,31

,760

Zmienna

zależna:

TIME2

Analiza regresji wykazała istotny wpływ trzech predyktorów: wynik sprawdzianu TIME1, samooceny i zmiennej kontrastowej (porównującej grupę STRACH z grupą RELAKS). Procent wyjaśnianej wariancji wzrósł do 67%.

269

Wpisz definicje kluczowych pojęć wprowadzonych w tym rozdziale oraz zapisz nowe symbole

Test hipotezy zgodności rozkładu empirycznego z teoretycznym (oczekiwany!.!!2

40% kobiet, 60% mężczyzn, połowa kobiet i mężczyzn powinna nie mieć więcej niż 40 lat.

Test 1'2 dla zmiennych nominalnych Pojęcia

test

kluczowe: test

niezależności

zgodności rozkładu

empirycznego z teoretycznym'

dwóch zmiennych nominalnych; miary

siły związku

Chcemy sprawdzić, czy lista 100 losowo wybranych kandydatów spełnia te warunki? Wśród 100 kandydatów powinno być 20 młodszych i 20 starszych kobiet oraz 30 młodszych i 30 starszych mężczyzn. Są to liczebności teoretyczne oznaczane literą T. Okazało się, że lista losowo wybranych kandydatów zawiera nazwiska 30 młod­ szych i 5 starszych kobiet oraz 20 młodszych i 45 starszych mężczyzn. Są to liczebności obserwowane oznaczane literą O. Aby ocenić zgodność rozkładu teoretycznego (tak jak być powinno) z empirycznym (tak jak jest), musimy policzyć jakąś statystykę o znanym rozkładzie.

zmiennych nominalnych

Nowe symbole:.i, rp, C Udowodniono, że statystyka X

Zdarza się, że nasze zmienne nie pozwalają na liczenie średnich i odchyleń standardowych. Co wtedy? Czy możemy orzekać o istnieniu i sile związku między zmiennymi nominalnymi? Odpowiedź na to pytanie jest pozytywna, pod warunkiem że dysponujemy dużymi próbami. W podręczniku przedstawimy dwa typy analiz zmiennych nominalnych. Tak jak pisaliśmy w rozdziale 1., decyzja dotycząca zakupu nowego, cudownego środka na pamięć, porost włosów, dobre samopoczucie itp. powinna być poprzedzona analizą związku dwóch zmiennych nominalnych. Aby wykazać skuteczność cudownego środka, powinniśmy móc odrzucić hipotezę zerową zakładającą brak związku między zażywaniem cudownego środka a wystąpieniem jego efektów. Obie zmienne to zmienne nominalne: Zmienna 1: TERAPIA (zażywał vs nie

zażywał)

Zmienna 2: SKUTECZNOŚĆ (sukces vs porażka). tów

Zanim nauczymy się to robić, pokażemy jak można sprawdzić, czy lista kandydaspełnia ustalone parytety.

Test hipotezy zgodności rozkładu empirycznego z teoretycznym (oczekiwanym)

Z

=L

(O-T)z T

ma znany rozkład dla k - 1 stopni swobody, gdzie:

k - liczba wartości zmiennej nominalnej, O - to liczebności obserwowane, T -liczebności teoretyczne (oczekiwane). Zapamiętaj:

• Liczebności zaobserwowane to liczebności (frekwencje) otrzymane z wyników badania. • Liczebności teoretyczne otrzymujemy na podstawie hipotezy lub rozumowania teoretycznego. Hipoteza badawcza w naszym przykładzie dotyczy poprawności listy wyborczej kandydatów. Pytamy o stopień zgodności liczebności teoretycznych i obserwowanych. Jeśli liczebności obserwowane i teoretyczne różnią się istotnie, to mamy podstawy do odrzucenia hipotezy zerowej mówiącej, że rozkład cech demograficznych kandydatów jest zgodny z przyjętymi postulatami (rozkładem teoretycznym).

Hipoteza zerowa, jaką testujemy przy użyciu.t dotyczy zgodności liczebności obserwowanych i teoretycznych.

Rozważmy następujący przykład:

270

Partia Równościowego Ucisku postanowiła, że listy wyborcze powinny być skomponowane według następującego klucza:

271

Test hipotezy zgodności rozkładu empirycznego z teoretycznym (oczekiwanym)

Rozdział 9. Test X2 dla zmiennych nominalnych

SCHEMAT WNIOSKOWANIA

Tabela 9.1. Sposób wyliczenia wartości.t dla wyników z przykładu

Cechy demograficzne kandydata (płeć, wiek) - 4 kategorie (zmienna nominalna)

Zmienne

~ młode

kobiety

starsze kobiety młodzi mężczyźni

starsi mężczyźni

T

20 20 30 30

O

30 5 20 45

T-O

(T - 0)2

-10 15 10

100 225 100

-15

225

(T-O)' T

Założenia

100/20 225/20

Hipotezy

Ho:

100/30 225/30

Rozkład zmiennej z rozkładem

H1:

Rozkład

nie jest zgodny z

;f '" 27,08

r

Na wartość składa się suma różnic pomiędzyliczebnościamiobserwowanymi i teoretycznymi, podniesionych do kwadratu i podzielonych przez liczebności teoretyczne. Im większa rozbieżność pomiędzy liczebnościami obserwowanymi i teoretycznymi, tym większawartość testu Interpretacja otrzymanej wartości wymaga znajomościrozkładu statystyki (patrz tablice.r na końcu podręcznika). Aby odczytać wartość krytyczną z tablic rozkła­ du musimy znać liczbę stopni swobody.

r.

Próba losowa 100 kandydatów partii PRU. ;f badania zgodności rozkładu empirycznego z teoretycznym.

Spełnione są załoźenia testu

X:,yt (3) = 7,82

Reguła decyzyjna Wartość

zmiennej nominalnej rozkładem teoretycznym.

=3 stopni swobody ma rozkład ;f.

Statystyka ;f dla k - 1

Wybór testu i rozkład statystyki

nominalnej jest zgodny teoretycznym.

Odrzucimy Ho. jeśli

X:"z

~ 7,82 .

X:'n "" 27,08

statystyki

X:"' "" 27,08 > X:ryt (3) = 7,82

Decyzja

,więc odrzucamy Ho.

r

r,

Tablice rozkładu X

2

r

W tablicach w wierszach podane są stopnie swobody df= k - 1 (gdzie k to liczba wartości zmiennej nominalnej), a w kolumnach poziomy istotności. W tablicach najczęściej podane są wartości krytyczne tego testu dla df ~ 30, z dwóch powodów:

Przetestuj hipotezę dotyczącą poprawności listy wyborczej, na której znalazło się po 25 młod­ szych i starszych kobiet oraz po 25 młodszych i starszych mężczyzn.

~ młode

kobiety

starsze kobiety młodzi mężczyźni

starsi

mężczyźni

r

1) bardzo rzadko liczony jest dla df = 30, ponieważ przy takiej liczbie wartości zmienna jest zwykle traktowana jako porządkowa lub ilościowa i dostęp­ nych jest wiele innych, bardziej czułych i precyzyjnych testów; 2) dla df> 30 rozkład z próby dąży do rozkładu normalnego.

r

T

O

T-O

(T - 0)2

(T _0)2 T

20

25 25 25 25

20 30 30

;f= ..............

SCHEMAT WNIOSKOWANIA Zmienne Założenia

Spełnione są założenia testu zgodności rozkładu

;f badania empirycznego z teoretycznym.

Hipotezy Stosując SCHEMAT WNIOSKOWANIA, zweryfikujemy hipotezę dotyczącą zgodności rozkła­ du empirycznego z teoretycznym na przykładzie kandydatów z listy wyborczej Partii Równościowego

Ucisku.

Wybór testu i rozkład statystyki Reguła decyzyjna

Wartość statystyki

Decyzja

272

273

Rozdział

9. Test Xl dla zmiennych nominalnych

Test hipotezy o niezależności dwóch zmiennych nominalnych

Studenci oczekują, że w teście jednokrotnego wyboru będzie tyle samo poprawnych odpowiedzi a), b), c), d). Sprawdź, czy następujący rozkład odpowiedzi: po 25 poprawnych odpowiedzi a) i b) oraz po 15 poprawnych odpowiedzi c) i d) różni się istotnie od oczekiwań studentów.

~ młode

O 25

starsze kobiety

20

25

młodzi mężczyźni

20

15

20

15

mężczyźni

T-O

(T - 0)2

(T -O)'

Gdy chcemy zbadać związek między zmiennymi nominalnymi, takimi jak płeć, wybór kandydata w głosowaniu, region zamieszkania, możemy analizować jedynie liczebności.

T 20

starsi

kobiety

T

Test hipotezy o niezależności dwóch zmiennych nominalnych

Możemy sprawdzać hipotezę mówiącą, że ćwiczenia fizyczne są bardziej skuteczne w odchudzaniu niż dieta. Dysponujemy danymi pochodzącymi od 100 osób, z których 30 stosowało dietę, a 70 intensywnie uprawiało ćwiczenia fizyczne. Po 6 miesiącach można było ustalić, czy dana osoba osiągnęła zamierzony cel (sukces), czy nie (porażka).

fl= ....·.·....···

SCHEMAT WNIOSKOWANIA

Dieta

Zmienne Założenia

Spełnione są założenia testu zgodności rozkładu

fl badania ,

Porażka

10

20

Ćwiczenia

50

20

RAZEM"

60

40

empirycznego z teoretycznym.

Hipotezy

Sukces

liczebności

RAZEM'

30 70 100

brzegowe

Wybór testu i rozkład statystyki Reguła decyzyjna

Wartość statystyki

Decyzja

Hipoteza zerowa przewiduje, że wybór diety bądź ćwiczeń nie ma wpływu na odniesienie sukcesu. Pierwszym krokiem jest wyliczenie liczebności teoretycznych, przy założeniu prawdziwości Ho. Jeżeli w naszej próbie sukces odniosło 60 osób na 100 (czyli 60%), a 30 stosowało dietę, to jeśli odniesienie sukcesu nie jest związane z typem oddziaływania (dieta vs ćwiczenia), to sukces powinno też odnieść

60

Stosując

analogiczny sposób myślenia, możemy za pomocą testu.t sprawdzać zgodność rozkładu naszej zmiennej z rozkładem normalnym, ponieważ w rozdziale 2. dowiedzieliśmy się, że rozkład normalny charakteryzuje się ściśle określonymi proporcjami przypadków wyznaczonymi przez krzywą Gaussa.

60% wśród stosujących dietę, czyli -x30 = 18 osób

100

i 60% intensywnie ćwiczących, czyli -

60

100

x 70 = 42 osoby.

Analogicznie wyliczamy liczebności teoretycznie dla liczby porażek wśród ćwiczących i osób na diecie. Te liczebności możemy też wyliczyć, odejmując liczebności teoretyczne dla sukcesu (18,42) odpowiednio od liczebności brzegowych dla obu grup (30 osób na diecie, 70 osób ćwiczących).

Liczebności teoretyczne zostały zestawione w tabeli 9.2. Kiedy znamy już liczebności teoretyczne, dalsze postępowanie jest analogiczne jak przy teście badania zgodności z rozkładem empirycznym.

274

275

Test hipotezy o niezależności dwóch zmiennych nominalnych

Rozdział 9. Test X2 dla zmiennych nominalnych

Tabela 9.2.

Liczebności

teoretyczne

Ustalenie Sukces

Porażka

Dieta

30 60x-=18 100

30 40x-=12 100

30

Ćwiczenia

70 60x-=42 100

70 40x-=28 100

70

60

40

100

Dieta Ćwiczenia

Sukces

Porażka

18 42 60

12 28 40

Poziom

30 70 100

Wartość

istotności:

krytyczna

Odrzucimy Ho.

reguły decyzyjnej:

a = 0,05

X~ryt (1) = 3,84

jeżeli X~trz (1) ~ 3,84. Obliczanie wartości statystyki:

schudł

nie

na diecie

schudł

na diecie

(O-T)'

T

O

18 12

10 20

-8 8

64 64

64/12 =

42

50

8

64

64/42 =

28 12,7

20

8

64

64/28 =

O-T

(O - T)2

T 64/18 =

schudł, ćwicząc

intensywnie

Liczbę stopni swobody dla testu:r, testującego

nie schudł, ćwicząc intensywnie

r",

niezależnośćdwóch zmiennych nominalnych, wyliczamy ze wzoru:

df= (r-1) x (c-1), gdzie: r-Iiczba poziomów pierwszej zmiennej, c -liczba poziomów drugiej zmiennej.

Podjęcie decyzji:

xL, (1) "'" 12,7 > X:"./ (1) = 3,84, zatem odrzucimy Ho mówiącą, że efekt nie zależy Stosujemy SCHEMAT WNIOSKOWANIA, tak jak przy poznanych wcześniej testach.

od rodzaju

oddziaływań.

SCHEMAT WNIOSKOWANIA Określeniezmiennych

i ich skal pomiarowych, sformułowaniezałożeń i hipotez:

Korzystając z informacji zawartych w przykładzie 9.2, zweryfikuj hipotezę, że efekt nie zależy od rodzaju oddziaływań, w przypadku gdy zaobserwowane wyniki mają inny rozkład Uak pokazano w poniższej tabeli).

TYP ODDZIAŁYWANIA (dieta vs ćwiczenia) - zmienna nominalna EFEKT (sukces vs porażka) - zmienna nominalna

T

O

18 12

5 25

42

30

28 ;:( '" 12,7

40

Hipotezy:

Ho: Efekt nie zależy od typu

schudł

oddziaływania.

nie

H1: Efekt zależy od typu oddziaływania.

na diecie

schudł

na diecie

O-T

(O - T)2

(O-T)'

T

schudł, ćwicząc

Wybór testu i ustalenie Statystyka

276

r ma rozkład r dla df= 1.

rozkładu statystyki:

intensywnie nie schudł, ćwicząc intensywnie

277

Rozdział 9.

Test X2 dla zmiennych nominalnych

Test hipotezy o niezależności dwóch zmiennych nominalnych

SCHEMAT WNIOSKOWANIA

Tabela 9.3. Zależność sądów o przeszłości (R) jedzenie od stanu faktycznego (P)

Zmienne Spełnione są założenia testu .t badania

Założenia

zgodności rozkładu

Tabela

empirycznego z teoretycznym.

krzyżowa

dotyczących

pieniędzy

na

PxR R (6 lat temu)

Hipotezy R=O

Wybór testu i rozkład statystyki Reguła

braku

NIE P=O

decyzyjna

Wartość statystyki

p 1997

NIE

brakowało

TAK

brakowało

P =1

Decyzja

.

Ogółem

N

OJozp N

OJozp N

OJozp

brakowało

R= 1 TAK

brakowało

Ogółem

.

178

39

217

82,0%

18,0%

100,0%

87

64

151

57,6%

42,4%

100,0%

265

103

368

72,0%

28,0%

100,0%

O - oznacza brak problemów finansowych, 1 - oznacza występowanie takich problemów • liczebności brzegowe W badaniu PGSS (panel 2003) pytaliśmy respondentów, czy brakowało im w ostatnim roku pieniędzy na: a) jedzenie, b) kształcenie, c) leczenie. Każda

ze zmiennych

przyjmowała dwie wartości:

O- nie

brakowało;

1-

brakowało.

Prosiliśmy także o odtworzenie roku 1997 i stwierdzenie, czy wtedy brakowało pieniędzy na wymienione cele. Połączyliśmy te dane z informacjami o rzeczywistych odpowiedziach udzielonych w 1997 roku przez te same osoby. Mamy więc 9 zmiennych, z których każda przyjmuje 2 wartości (po 3 zmienne w każdej z 3 dziedzin). Możemy analizować łączne rozkłady liczebności.

P - oznacza odpowiedzi udzielone przez respondenta w 1997 roku. R - oznacza

retrospekcję,

Możliwe są więc

czyli to, co w 2003 roku osoba

a) P = O i R = O - osobie nie odtwarza tę sytuację; b) P

sądzi, że odpowiedziała w

1997.

4 konfiguracje odpowiedzi:

= O i R = 1 - osobie nie

brakowało pieniędzy

brakowało pieniędzy

na jedzenie w 1997 roku i poprawnie

w 1997, ale 6 lat

póżniej źle

odtwarza



sytuację;

c) P

=1 i R = O-

osobie

brakowało pieniędzy

na jedzenie, ale 6 lat

później uważa, że

nie

brakowało;

d) P

= 1 i R =1 -

osobie

brakowało pieniędzy w

1997 i poprawnie odtwarza

tę sytuację

6 lat

później.

W tabeli krzyżowej P x R przedstawione są liczebności w poszczególnych grupach i procenty dobrze i źle odtwarzających własną sytuację sprzed 6 lat, osobno wśród tych, którym brakowało na jedzenie i tych, którzy byli "zaspokojeni".

278

Na podstawie tabeli krzyżowych odpowiedz, czy respondenci dobrze odtwarzają problemy finansowe w różnych dziedzinach życia sprzed 6 lat.

Z tabeli 9.3 możemy odczytać, że w 1997 roku 217 osób nie miało problemów finansowych w płaceniu rachunków za żywność, 151 osób je miało. Odtwarzając6 lat później - 265 osób twierdziło, że w 1997 roku nie miało problemów, 103 - że miało. Tyle możemy dowiedzieć się z liczebności brzegowych. Analiza tabeli krzyżowej ujawnia, że: a) 82% (178 osób) z tych, którzy nie mieli w 1997 roku problemów finansowych, odtwarza tę sytuację poprawnie 6 lat póź­ niej; b) 18% (39 osób) twierdzi, że miało problemy, choć w 1997 roku twierdziło co innego; c) 42,4% (64 osoby) z tych, którzy mieli problemy finansowe w 1997 roku, odtwarza tę sytuację poprawnie 6 lat później; d) 57,6% (87 osób) z tych, którzy mieli problemy finansowe w 1997 roku, twierdzi, że ich nie mieli. Wartość testu.t = 26,03;

P < 0,001 pozwala nam na odrzucenie Ho, mówiącej o braku związku między posiadaniem problemów finansowych w roku 1997 a poprawnością odtwarzania przeszłości. Więcej błędów popełniają ci, którzy w 1997 roku mieli problemy finansowe.

279

Rozdział

Test hipotezy o niezależności dwóch zmiennych nominalnych

9. Test X2 dla zmiennych nominalnych

Tabela 9.5. Zależność sądów o przeszłości (R) leczenie od stanu faktycznego (P) Na podstawie danych z tabeli 9.4, zawierającej informacje o problemach finansowych w ceniu za edukację, uzupełnij poniższy tekst.

Tabela

pła­

krzyżowa

dotyczących

kształcenie

Zależność sądów

o przeszłości (R) od stanu faktycznego (P)

dotyczących

braku

R (6 lat temu)

pieniędzy

NIE

na

p=o

Tabela krzyżowa P x R

NIE

p 1997

NIE

p=o NIE

P 1997

brakowało

P TAK

.

=1

brakowało

N %zP N %zP N

Ogółem

%zP

R=1

brakowało

TAK brakowało

TAK

.

Ogółem

Ogółem

268

34

302

88,7%

11,3%

100,0%

40

21

61

65,6%

34,4%

100,0%

308

55

363

84,8%

15,2%

100,0%

osób nie miało problemów finansowych Z tabeli 9.4 możemy odczytać, że w 1997 roku w płaceniu za edukację, osób je miało. Odtwarzając 6 lat później osób twierdziło, że w 1997 roku nie miało problemów, ......... że miało. Tyle możemy dowiedzieć się z liczebności brzegowych. Analiza tabeli krzyżowej ujawnia, że:

b)

rza b) c)

tę sytuację

%(

brakowało

%zP N %zP N %zP

na

R=1 TAK

brakowało

.

Ogółem

221

30

251

88,0%

12,0%

100,0%

75

40

115

65,2%

34,8%

100,0%

296

70

366

80,9%

19,1%

100,0%

występowanie

takich problemów

Z tabeli 9.5 możemy odczytać, że w 1997 roku osób nie miało problemów finansowych w płaceniu za leczenie, osób je miało. Odtwarzając 6 lat później osób twierdziło, że w 1997 roku nie miało problemów, ......... że miało. Tyle możemy dowiedzieć się z liczebności brzegowych. Analiza tabeli krzyżowej ujawnia, że: a)

%(

.

=1

N

brakowało

o - oznacza brak problemów finansowych, 1 - oznacza • liczebności brzegowe

o - oznacza brak problemów finansowych, 1 - oznacza występowanie takich problemów • liczebności brzegowe

a)

brakowało

P

R (6 lat temu) R=O

pieniędzy

PxR

R=O Tabela 9.4.

braku

osób) z tych, którzy nie mieli w 1997 roku problemów finansowych, odtwapoprawnie 6 lat później;

c)

%( osób) z tych, którzy nie mieli w 1997 roku problemów finansowych odtwarza tę sytuację poprawnie 6 lat później; %(

osób) twierdzi, że miało problemy, choć w 1997 roku twierdziło co innego;

%( osoby) z tych, którzy mieli problemy finansowe w 1997 roku, odtwarza sytuację poprawnie 6 lat później;

d)

%(



osób) z tych, którzy mieli problemy finansowe w 1997 roku, twierdzi, że nie

mieli.

osób) twierdzi, że miało problemy, choć w 1997 roku twierdziło co innego;

Wartość testu j1 = 28,55; P < 0,001 (tego wyniku nie zamieszczono w wydruku), pozwala I nie pozwala nam na odrzucenie Ho, mówiącej o braku związku między posiadaniem problemów



finansowych w roku 1997 a poprawnością odtwarzania przeszłości. Więcej błędów popełniają

%( osoby) z tych, którzy mieli problemy finansowe w 1997 roku, odtwarza poprawnie 6 lat później;

sytuację

d)

%( nie mieli.

osób) z tych, którzy mieli problemy finansowe w 1997 roku twierdzi,

że

ich

Wartość testu j1 = 18,77; P < 0,001 (tego wyniku nie zamieszczono w wydruku), pozwala I nie pozwala nam na odrzucenie Ho, mówiącej o braku związku między posiadaniem problemów finansowych w roku 1997 a

280

poprawnością

odtwarzania

przeszłości. Więcej błędów popełniają

Na podstawie danych z tabeli 9.5, zawierającej informacje o problemach finansowych w ceniu za leczenie, uzupełnij poniższy tekst.

pła­

Analogicznie można analizować rozkłady więcej niż 2 zmiennych. Odtwarzanie przeszłości jest modyfikowane przez aktualną sytuację. W badaniach sprawdzaliśmy, czy odtwarzanie przeszłości (R) zależy od rzeczywistej sytuacji w 1997 roku (P) i aktualnej sytuacji w 2003 roku (A).

281

Rozdział

Test hipotezy o niezależności dwóch zmiennych nominalnych

9. Test X2 dla zmiennych nominalnych

Tabela 9.6. Zależność sądów o przeszłości (R) dotyczących braku jedzenie od stanu faktycznego w 1993 r. (P) i aktualnej sytuacji (A) Tabela

krzyżowa

pieniędzy

na Na podstawie tabeli 9.7, poniższy tekst.

PxR R (6 lat temu)

R=O NIE p=o A=O NIE

P

NIE

1997

P=1 TAK

2003

brakowało

brakowało

A= 1 TAK

1997

2003

brakowało

P=1 TAK

%zP

brakowało

Ogółem

88,7%

11,3%

100,0%

40

21

61

65,6%

34,4%

100,0%

308

55

363

84,8%

15,2%

100,0%

37

28

65

56,9%

43,1%

100,0%

45

47

92

48,9%

51,1%

100,0%

82

75

157

52,2%

47,8%

100,0%

N %zP

o- oznacza brak problemów finansowych,

Tabela 9.7. Ogółem

302

N %zP

brakowało

34

N %zP

TAK

268

N

%zP p=o

NIE

%zP

N

Ogółem

P

N

R= 1

brakowało

1 - oznacza

występowanie

takich problemów

Wśród

tych, którzy w 2003 roku mają problemy finansowe z płaceniem za żywność 56,9% odtwarza prawidłowo brak problemów tego typu w 1997, zaś 51,1 % odtwarza prawidłowo istnienie tego typu problemów w roku 1997. Oznacza to, że liczba błędów zależy od oceny aktualnej i przeszłej wynosi:

• 7,2% dla zaspokojonych teraz i

kiedyś; kiedyś;

• 43,1% dla niezaspokojonych teraz i zaspokojonych

kiedyś;

• 48,9% dla niezaspokojonych teraz i niezaspokojonych

r=

kiedyś.

=

14,65; P < 0,001 liczonego osobno dla zaspokojonych teraz (A O) pozwala na odrzucenie hipotezy o niezależności ocen sformułowanych w przeszłości (P) i tego, co teraz na ten temat sądzą respondenci (R). Tak jak należałoby oczekiwać, to co respondenci sądzą na temat zaspokojenia potrzeb w przeszłości zależy od rzeczywistego stanu w roku 1997. Nie można tego powiedzieć w sytuacji, gdy potrzeby nie są aktualnie zaspokojone. Dla tej grupy respondentów (A = 1) nie można odrzucić hipotezy o niezależności ich sądów o przeszłości od tego, co miało miejsce w przeszłości = 1,31; P > 0,05.

r

282

opłacaniu

edukacji,

uzupełnij

o przeszłości (R) dotyczących braku pieniędzy na stanu faktycznego w 1993 r. (P) i aktualnej sytuacji (A) Tabela

krzyżowa

Px R R (6 lat temu) R= 1

R=O NIE P=O

2003 NIE

p

NIE

1997

N %zP

P=1 TAK

A=O

brakowało

brakowało

N %zP N

Ogółem

%zP p=o

2003 TAK

p

NIE

brakowało

TAK

brakowało

1997

%zP

P=1

Ogółem

o-

N N %zP N %zP

brakowało

TAK

brakowało

Ogółem

219

14

233

94,0%

6,0%

100,0%

21

6

27

77,8%

22,2%

100,0%

240

20

260

92,3%

7,7%

100,0%

49

20

69

71,0%

29,0%

100,0%

19

15

34

55,9%

44,4%

100,0%

68

35

103

66,0%

34,0%

100,0%

oznacza brak problemów finansowych, 1 - oznacza

występowanie

takich problemów

Z tabeli krzyżowej (tabela 9.7) możemy odczytać, że wśród tych, którzy w 2003 nie mieli problemów finansowych % twierdziło, że w 1997 nie miało problemów finansowych, mimo że faktycznie było inaczej. Wśród

• 71,2% dla zaspokojonych teraz i niezaspokojonych

Wartość testu

problemów finansowych w

Zależność sądów

kształcenie od

A= 1 Z tabeli krzyżowej (tabela 9.6) możemy odczytać, że wśród tych, którzy w 2003 roku nie mieli problemów finansowych - 71,2% twierdziło, że w 1997 nie miało problemów finansowych, mimo że faktycznie było inaczej.

dotyczącej

tych, którzy w 2003 roku mają problemy finansowe z płaceniem za edukację % odtwarza prawidłowo brak problemów tego typu w 1997, zaś % odtwarza prawidłowo istnienie tego typu problemów w roku 1997. Oznacza to, że liczba błędów zależy od oceny aktualnej i przeszłej 1997 i wynosi: • % dla zaspokojonych teraz i kiedyś; • % dla zaspokojonych teraz i niezaspokojonych kiedyś; • % dla niezaspokojonych teraz i zaspokojonych kiedyś; • % dla niezaspokojonych teraz i niezaspokojonych kiedyś.

r

Wartość testu = 6,58; P < 0,01 liczonego osobno dla zaspokojonych teraz (A = O) pozwala / nie pozwala na odrzucenie hipotezy o niezależności ocen sformułowanych w przeszłości (P) i tego, co teraz na ten temat sądzą respondenci (R). To, co respondenci sądzą na temat zaspokojenia potrzeb w przeszłości, zależy / nie zależy od rzeczywistego stanu w roku 1997. W sytuacji, gdy potrzeby nie są aktualnie zaspokojone: dla tej grupy respondentów (A = 1) można / nie można odrzucić hipotezy o niezależności ich sądów o przeszłości od tego, co miało miejsce w przeszłości - r 2,33; P > 0,05.

=

283

Rozdział

9. Test Xl dla zmiennych nominalnych

WYliczanie

Wyliczanie Na podstawie tabeli 9.8, dotyczącej problemów finansowych w płaceniu za leczenie, uzupełnij poniższy tekst.

Tabela 9.8. Zależność sądów o przeszłości (R) dotyczących braku leczenie od stanu faktycznego w 1997 r. (P) i aktualnej sytuacji (A) Tabela

krzyżowa

pieniędzy

na

PxR

R= 1

R=O P=O A=O NIE

P

NIE

1997

P=1 TAK

2003

brakowało

brakowało

TAK

2003

NIE

brakowało

P=1

1997 TAK Ogółem

%zP %zP

P=O P

N N

Ogółem

A= 1

N %zP

brakowało

N %zP N %zP N %zP

brakowało

TAK

brakowało

176

16

192

8,3%

100,0%

40

5

45

88,9%

11,1%

100,0%

216

21

237

91,1%

8,9%

100,0%

45

14

59

76,3%

23,7%

100,0%

35

35

70

50,0%

50,0%

100,0%

80

49

129

62,0%

38,0%

100,0%

O-oznacza brak problemów finansowych, 1 - oznacza

występowanie

x2 = L (2xO-2xT)2 =2 x L(O-T)2

Ogółem

91,7%

2xT

.

T

Analogicznie, jeżeli zwiększymy liczebność próby ośmiokrotnie,zachowującproporcje, to ośmiokrotnie zwiększy się wartość x'. W praktyce, w próbie powyżej 1000 osób bardzo trudno jest uzyskać wartość testu x', która pozwoliłaby na nieodrzucenie hipotezy zerowej - z wyżej wymienionych powodów. Trzeba pamiętać, że poziom istotności statystyki zależy od natężenia istniejącego związku i wielkości badanej próby. Im mniejsza jest próba, tym silniejszy musi być związek, aby jego istnienie okazało się istotne. Istniej ą różne miary związku między zmiennymi nominalnymi [por. 3, 16]. Pokażemy przykładowe dwie: Na podstawier możnawyliczyć tzw. współczynnik zbieżności, który jest analogiem do współczynnika korelacji r, choć nie uwzględnia znaku związku:

takich problemów

Z tabeli krzyżowej (tabela 9.8) możemy odczytać, że wśród tych, którzy w 2003 nie mieli problemów finansowych % twierdziło, że w 1997 nie miało problemów finansowych, mimo że faktycznie było inaczej. Wśród

tych, którzy w 2003 roku mają problemy finansowe z płaceniem za leczenie .......... % odtwarza prawidłowo brak problemów tego typu w 1997, zaś .........% odtwarza prawidłowo istnienie tego typu problemów w roku 1997. Oznacza to, że liczba błędów zależy od oceny aktualnej i przeszłej 1997 i wynosi: • % dla zaspokojonych teraz i kiedyś; • % dla zaspokojonych teraz i niezaspokojonych kiedyś; • % dla niezaspokojonych teraz i zaspokojonych kiedyś; • % dla niezaspokojonych teraz i niezaspokojonych kiedyś.

Wartość testu.r= 0,702; p = 0,402 liczonego osobno dla zaspokojonych teraz (A = O) pozwala I nie pozwala na odrzucenie hipotezy o niezależności ocen sformułowanych w przeszłości

Współczynnik C

przyjmuje wartość zero, gdy zmienne są niezależne. Jego warmaksymalna zależy jednak od liczby wartości zmiennych (liczby wierszy i kolumn w tabeli krzyżowej). Dla tabeli 2 x 2 maksymalna wartość wynosi 0,707. Przy porównywaniu współczynników warto więc przeprowadzić ich standaryzację, dzieląc przez wartość maksymalną- znacznie ułatwia to interpretację. tość

Dla danych oceniających skuteczność diety (przykład 9.2) w próbie 100-elementowej .r wyniósł więc 12,7.

(P) i tego, co teraz na ten temat sądzą respondenci (R). To, co respondenci sądzą na temat zaspokojenia potrzeb w przeszłości zależy I nie zależy od rzeczywistego stanu w roku 1997.

284

współczynników siły związku

Poziom istotności testu r informuje jedynie o prawdopodobieństwie istnienia związku, a nie o jego natężeniu. Bardzo ważne jest, aby przy stosowaniu testu r pamiętać, że przy niezmiennych proporcjach wartość r jest wprost proporcjonalna do wielkości próby. Wynika to bezpośrednio z wzoru na Z2. Jeżeli zwiększamy liczebność próby dwukrotnie, zachowując proporcje, to dwukrotnie zwiększy się każda z liczebności teoretycznych i oczekiwanych:

R (6 lat temu) NIE

współczynników siły związku

W sytuacji, gdy potrzeby nie są aktualnie zaspokojone: dla tej grupy respondentów (A = 1) można I nie można odrzucić hil?otezy o niezależności ich sądów o przeszłości od tego, co miało miejsce w przeszłości - X' = 12,821; P < 0,001.

c= Wiedząc, że maksymalna zowane równe jest 0,48.

12,7 100 + 12,7

wartość może wynieść

= 0,34 .

0,707, potrafimy

stwierdzić, że

C standary-

285

Rozdział

Wyliczanie

9. Test X2 dla zmiennych nominalnych

Oblicz współczynnik C dla danych z analizowanych Ćwiczenie

N

.i

368

26,03

Ćwiczenie 9.4

363

18,77

Ćwiczenie 9.5

366

28,55

Ćwiczenie 9.6

366

18,58

Przykład

157

14,65

Przykład

9.3

9.4

Policz współczynnik rp dla oceny skuteczności stosowania metody B i C dla cesu egzaminacyjnego. Jakie wnioski możesz sformułować?

przykładów:

zdał

metoda B

Zdał

TAK

NIE

TAK

a

NIE

c

b d a+d

liczymy według

suk-

następującego

TAK

NIE

TAK

10

40

50

NIE

40

40

50

50

50

100

zdał

metoda C

rp=

egzamin

rp=

egzamin

TAK

NIE

TAK

40

10

NIE

40

10

50

80

20

100

50

egzamin

a+c Współczynnik rp

osiągnięcia

C

Dla zmiennych dwuwartościowych możemy policzyć współczynnik rp, ponieważ pozwoli nam on na określenie znaku związku. Przykładowo, jeżeli chcemy policzyć skuteczność nowej metody przygotowania się do egzaminu, w tabeli krzyżowej mamy liczebności par zgodności (stosował metodę i zdał lub nie stosował metody i nie zdał) oznaczone odpowiednio a i d oraz liczebności par niezgodności (stosował metodę i nie zdał lub nie stosował metody i zdał) oznaczone odpowiednio b i c.

metoda A

współczynników siły związku

a+b c+d a+b+c+d

Testowanie związku zmiennych nominalnych ma sens tylko dla dużych prób. Konieczność kontroli dodatkowych zmiennych powoduje, że liczebności teoretyczne mogą być zbyt małe, aby zastosowanie testu.i było uzasadnione. Rozwiązaniem może być w przypadku tabel 2 x 2 zastosowanie testu dokładnego Fishera [por. 10].

wzoru:

axd-bxc

qJ = - - ; = = = = = = = = = J(a + b)(b + c)(c + d)(a + d)

Policzmy wartość rpdla skuteczności zastosowania metody A w przygotowaniu się do egzaminu, jeżeli wiemy, że 40 osób ją stosujących zdało egzamin, a 10 nie, zaś wśród 50 osób jej niestosujących egzamin oblało 40. zdał

, metoda A

286

TAK

NIE

egzamin

qJ=

TAK

NIE

40

10

10

40

50

50

50

100

50

40 x 40 - 10 x 10

=0,6

.JSOxSOXSOXSO

287

Wpisz definicje kluczowych pojęć wprowadzonych w tym rozdziale oraz zapisz nowe symbole

Rozdział 10.

Podsumowanie i wskazówki dotyczące wyboru testu statystycznego

288

W podręczniku przedstawiliśmy pięć etapów podejmowania decyzji we wnioskowaniu statystycznym. Pierwszy krok to przyjęcie założeń, że uzyskane dane są obserwacjami wzięty­ mi z jakiejś populacji, z której dobór próby był losowy, a także sformułowanie (lub nie) założenia na temat skali pomiarowej i kształtu rozkładu zmiennej w populacji. Na tym etapie też formułujemy precyzyjnie określoną hipotezę zerową w opozycji do hipotezy badawczej. Założenia na temat doboru próby oraz hipoteza zerowa pozwalają razem na podjęcie drugiego kroku - wybór testu statystycznego i ustalenie rozkładu odpowiedniej statystyki oraz kroku trzeciego: sprecyzowanie reguły decyzyjnej (odrzucę Ho, jeżeli - w tym miejscu umieszczamy albo wartości krytyczne statystyki, albo wartości prawdopodobieństwa,w zależności od tego, czy sami wykonujemy obliczenia, czy też posługujemy się komputerowym pakietem statystycznym) przy założonympoziomie istotności. Krok czwarty polega na wyliczeniu (lub znalezieniu na wydruku komputerowym) odpowiednich statystyk. W kroku piątym podejmujemy decyzję, porównując wartość otrzymanej statystyki z wartościąkrytycznąlubprawdopodobieństwoz wydruku komputerowego z założonym poziomem istotności. Algorytm jest prosty: badacz formułuje hipotezę badawczą, przeciwstawia jej hipotezę zerową, przeprowadza badanie, liczy właściwe statystyki i prawdopodobień­ stwo otrzymania takich wartości statystyk przy przyjętych założeniach (w tym Ho) i w końcu podejmuje decyzję na temat Ho. Decyzja została przedstawiona jako binarna: Ho jest albo nie jest odrzucana. Odrzucenie hipotezy zerowej określane jest jako otrzymanie wyników istotnych statystycznie. W momencie kiedy rozumie się logikę wnioskowania statystycznego, używanie nowych, nie opisanych w skrypcie testów jest dziecinnie proste. Musimy sprawdzić, czy spełnione są założenia dla danego testu i stosować SCHEMAT WNIOSKOWANIA. Testy hipotez o związku zmiennych, z których co najmniej jedna jest zmienną przedziałową,nazywająsię testami parametrycznymi, ponieważdotycząwnioskowania o parametrach populacji. Pozostałe testy określa się jako nieparametryczne. Zdecydowana większość testów parametrycznych ma swoje nieparametryczne odpo-

Podsumowanie i wskazówki dotyczące wyboru testu statystycznego

wiedniki, ale trzeba pamiętać, że te pierwsze mają większą moc. I chociaż należy wybierać test statystyczny, którego założenia są zgodne z charakterem danych, to jak pisze Blalock (s. 476), "z drugiej jednak strony nie należy nadmiernie dążyć do ścislości i ograniczać stosowania tak mocnych technik, jak analiza kowariancji lub regresji tylko do sytuacji, w której jesteśmy pewni spelnienia założeń tych technik. Szczególnie wtedy, gdy nie dysponujemy odpowiednimi technikami nieparametrycznymi i gdy badania mają charakter wstępny, metody takie mogą dać cenny wgląd w problematykę, chociaż ich wyniki należy interpretować ostrożnie". W zadaniach analizowanych w podręczniku zakładaliśmy, że założenia dotyczą­ ce rozkładu zmiennej są spełnione. Założenia można podzielić na niezbywalne i te, których pogwałcenie nie zmienia istotnie naszych konkluzji. Do tych pierwszych należą wymagania dotyczące liczebności próby. Testowanie wielowymiarowych modeli na małej próbie musi prowadzić do nierzetelnych wniosków. Dlatego nie należy sugerować się faktem, że wszystkie obliczenia w podręczniku ze zrozumiałych względów były prowadzone na bardzo małych próbach. Zaleca się na przykład, aby liczba osób w próbie używanej do analizy czynnikowej była 5 razy (2 razy to minimum) większa niż liczba zmiennych (nie moż­ na więc przeprowadzić analizy czynnikowej kwestionariusza osobowości liczącego 60 pytań, jeżeli dysponujemy próbą 100-osobową). W wielowymiarowej analizie regresji zaleca się, aby liczba osób wynosiła co najmniej 56 + 8k, gdzie k-liczba predyktorów (zmiennych niezależnych) itd. Jeżeli chcemy, aby moc testu statystycznego, czylijego zdolność do odrzucenia fałszywej hipotezy zerowej, wyniosła 0,90, to konieczna liczebnośćpróby zależy od prawdziwej wartości współczynnika korelacji w populacji. Testujemy przecież hipotezę zerową mówiącą, że p= o. Jeżeli p= 0,1, to zakładaną moc testu statystycznego osiągniemy, dysponując próbą N = 1046 osób, gdy P = 0,2 wystarczy 449 osób, gdy P = 0,5 - wystarczy 37 osób (por. [9]). Analogicznie można określić minimalne liczebności dla testu chi-kwadrat, analizy wariancji itd. Założenia dotyczące kształtu rozkładu są mniej groźne. Wykazano na przykład, że test t jest raczej niewrażliwy na odchylenia od normalności rozkładu w małych próbach. W dużych próbach rozkład t Studenta zbiega do rozkładu normalnego i może­ my zastosować Centralne Twierdzenie Graniczne. Informacje o odporności różnych testów znajdzie Czytelnik w bardziej zaawansowanych podręcznikach [5, 9, 10], ale trzeba pamiętać, że nic nas nie zwalnia od obowiązku myślenia - czyli sprawdzania różnych sposobów analiz i porównywania wyników. Tak jak pokazaliśmy,testowanie hipotez odbywa się więc według ściśle określo­ nego algorytmu. Najwięcej problemów sprawia studentom wypisanie zmiennych teoretycznych i ich wskaźników, określenie skal pomiarowych oraz wybór odpowiedniego testu statystycznego. Można tutaj podać dla początkujących badaczy prostą heurystykę, którą przedstawiliśmy na rysunku 10.1. Podstawowe pytanie dotyczy skal pomiarowych.

289

Rozdział

Rozdział

10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego

10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego

• czy przywiązywanie wagi do religii pozwala przewidywać przywiązywa­ nie wagi do pracy?, to możemy policzyć współczynnik korelacji między zmiennymi; • czy Polacy większą wagę przywiązują do religii, czy do pracy - to możemy zastosować test t Studenta dla grup zależnych. Jeżeli chcemy policzyć różnice w przywiązywaniu wagi do pracy w różnych grupach respondentów, np. podzielonych ze względu na wiek, to zastosujemy test t Studenta dla grup niezależnych (gdy wyróżnione są dwie grupy) lub analizę wariancji (gdy wyróżnionych grup jest więcej). ® Jeżeli chcemy podzielić respondentów na tych, dla których praca (i analogicznie religia) jest ważna i nieważna, to związek między takimi wskaźnikami będziemy liczyć za pomocą testu chi-kwadrat.

SKALE POMIAROWE

o

Test t Studenta dla grup niezależnych Rozdział

Dla

więcej niż

3 (lub

więcej)

Test t Studenta dla grup zależnych Rozdział

5

Jednoczynnikowa analiza wariancji Rozdział 6

5

Jednoczynnikowa analiza wariancji z powtarzanymi pomiarami Rozdział

7

dwóch zmiennych zmienne

ilościowe

Wielokrotna analiza regresji Rozdział

2 (lub więcej) zmienne nominalne 1 zmienna ilościowa

8

Dwuczynnikowa analiza wariancji (ogólnie: k-czynnikowa analiza wariancji, gdzie k -liczba zmiennych nominalnych)Rozdział?

Rysunek 10.1. Zestawienie testów omówionych w

podręczniku

Pokażmy

problem wyboru testu statystycznego na przykładzie. Chcemy przea wagą przypisywaną religii na przykładzie ogólnopolskiej próby reprezentatywnej. W badaniu PGSS respondenci oceniali wagę różnych dziedzin na siedmiopunktowej skali, gdzie odpowiedź ,,1" oznaczała "zupełnie nieważne", a ,,1" - "bardzo ważne". Oba pomiary można uznać za zmienne ilościowe. Wybór testu zależy od naszego zaufania do pomiaru i typu pytania badawczego.

Zacznijmy od policzenia współczynnika korelacji między naszymi zmiennymi. Wynosi on r = 0,06. Przy tak dużej próbie (N = 1751) nawet tak mały współczynnik korelacji jest istotnie różny od zera (p < 0,01). Zastanawiamy się, czy uwzględnienie związku ze zmiennymi socjodemograficznymi wpłynie na wielkość współczynnika korelacji. Okazuje się, że samo kontrolowanie wieku powoduje zmianę na r = 0,09, dołączenie zaś do zmiennych kontrolowanych wykształcenia respondenta (w latach nauki) powoduje wzrost współczynnika korelacji r = 0,11, dołączenie płci r = 0,12. Wszystkie te współczynniki korelacji zdają się sugerować dodatni związek mię­ dzy analizowanymi zmiennymi. Im wyższa waga przypisywana religii, tym wyższa waga przypisywana pracy. Moglibyśmy się skłaniać do stwierdzenia istnienia w Polsce protestanckiego etosu pracy. Wnikliwy badacz jednak wie, że respondenci mogą w bardzo różny sposób wykorzystywać zaoferowaną przez badacza skalę odpowiedzi od l ("zupełnie nieważne") do 7 ("bardzo ważne"). Może on nie mieć zaufania do różnicowania przez respondenta różnych dziedzin na 7-punktowej skali i chcieć podzielić respondentów na 4 grupy: • • • •

tych, tych, tych, tych,

dla których ważna jest zarówno praca, jak i religia; dla których ważna jest praca i nieważna religia; dla których nieważna jest praca i ważna religia; dla których nieważna jest zarówno praca, jak i religia.

analizować związek między wagą przypisywaną pracy

Przykładowo:

CD Jeżeli chcemy obie zmienne traktować jako zmienne ilościowe i pragniemy 290

odpowiedzieć na

pytanie:

Jak wyznaczyć te grupy? Dosyć bezrefleksyjnym wyborem jest dokonanie podziału medianowego obu zmiennych (lubimy bowiem mieć grupy równoliczne). Taki podział doprowadzi nas do wyników przedstawionych na rysunku 10.2. Test chi-kwadrat nakaże nam odrzucenie hipotezy o niezależności obu zmiennych. Kategorie zgodne (praca i religia ważne, praca i religia nieważne) są naj liczniej reprezentowane, co potwierdza naszą poprzednią konkluzj ę dotyczącą pozytywnego związku między wagą przypisywaną pracy i religii. Opisany w rozdziale dziewiątym współ­ czynnik korelacji phi jest dodatni rp = 0,126. 291

Rozdział

10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego

Rozdział 10.

600 , - - - - - - - - - - - - - - - ,

Podsumowanie i wskazówki dotyczące wyboru testu statystycznego

uznałoby, że

nie ma większego znaczenia, który ze wskaźników będzie analizowany. korelacji między ipsatywną wagą przypisywaną pracy i religii jest ujemny i wynosi r = -0,26. Kontrolowanie wieku powoduje zmianę r = -0,24, dodanie do wieku kontroli wykształcenia r = -0,22, dołączenie płci r = -0,21. Wszystkie te współczynniki korelacji zdają się sugerować ujemny związek mię­ dzy zmiennymi. lm wyższa waga przypisywana religii, tym niższa waga przypisywana pracy. Współczynniki korelacji między wagą przypisywaną pracy i religii zestawione są w tabeli 10.2. Współczynnik

500

400

religia 'O '(J)

o c .o ]

1IIlII

1

II 2

300

nieważna

ważna

Tabela 10.2. Porównanie korelacji wagi religii i pracy dla wag absolutnych i ipsatywnych

2

praca ważna

praca nieważna

Wagi absolutne

Rysunek 10.2. Liczebności grup osób uznających religię lub pracę za ważną lub nieważną według wag absolutnych

Czy możemy już napisać doniesienie z badań i spać spokojnie? Niezupełnie. Szczególne wykorzystywanie skali odpowiedzi prowadzi niekiedy do innych zniekształceń. Dla niektórych respondentów wszystko może być równie ważne (używają tylko prawego końca skali), inni w nastroju bardziej depresyjnym pesymistycznie oceniają dziedziny życia, wykorzystując tylko lewy kraniec skali (wszystko wydaje im się raczej mało ważne). . Rozważmy sytuację, w której radosny respondent ze średnią wagą przypisywaną różnym dziedzinom równą 6 przypisze religii wagę równą 5, zaś depresyjny respondent ze średnią wagą przypisywaną różnym dziedzinom równą 3 przypisze religii wagę 4. Dla każdego respondenta możemy uwzględnić jego ogólną tendencję, licząc wagę ipsatywną będącą różnicą wagi danej dziedziny (nazywanej wagą absolutną) i średniej wagi obliczonej osobno dla każdego respondenta, takjak przedstawiono w tabeli 10.1.

cała

próba (N= 1751)

przy kontroli wieku przy kontroli wieku i wykształcenia przy kontroli wieku, . * p < 0,01; wszystkie

Respondent radosny

Respondent depresyjny

waga religii (absolutna)

5

4

średnia

6

3

5 - 6 =-1

4-3=1

waga dla 6 dziedzin

waga religii (ipsatywna)

i

płci

pozostałe współczynniki

-0,26

0,09

-0,24

0,11

-0,22

0,12

-0,21

korelacji istotne p < 0,001

Musimy podjąć decyzję, czy wierzyć wagom absolutnym, czy ipsatywnym. Można korelacje wagi pracy z wagą przypisywaną pozostałym dziedzinom, co przedstawia tabela 10.3.

to

zro~ić, analizując pozostałe

Tabela 10.3. Korelacje wagi przypisywanej pracy z wagami przypisywanymi pozostadziedzinom

łym

Wagi

Tabela 10.1. Porównanie wag absolutnych i wag ipsatywnych religii dla dwóch osób badanych

wykształcenia

Wagi ipsatywne

0,06*

Wypoczynek Przyjaciele

wagi absolutne

0,194

wagi ipsatywne

0,009(n)

Krewni

Religia

Polityka

0,139

0,105

0,061

0,175

-0,204

-0,216

-0,263

-0,053*

Sąsiedzi

0,089 -0,347

(n) nieistotny, * p < 0,05; wszystkie pozostałe współczynniki korelacji istotne p < 0,001

Zawierzenie raczej wagom ipsatywnym

niż

absolutnym wydaje

się rozsądnym

rozwiązaniem. Nasze konkluzje dotyczące negatywnego związku między wagą przy-

292

Porównanie wag absolutnych wskazywałoby że respondent radosny wyżej ceni religię niż respondent depresyjny. Porównanie wag ipsatywnych prowadzi do wniosku przeciwnego. Policzyliśmy wagi ipsatywne w badaniu PGSS. Współczynniki korelacji między wagami absolutnymi i ipsatywnymi wyniosły odpowiednio 0,78 dla pracy i 0,85 dla religii. Wielu badaczy widząc tak wysokie współczynniki korelacji,

pisywaną religii a wagą przypisywaną pracy możemy sprawdżić, dokonując tak jak

poprzednio podziału medianowego obu zmiennych. Znów test chi-kwadrat nakazuje nam odrzucenie hipotezy zerowej mówiącej o niezależności obu zmiennych, ale tym razem najliczniejsze są kategorie osób wysoko ceniących pracę i nisko religię lub wysoko ceniących pracę i niżej religię. Możemy to zobaczyć na rysunku 10.3.

293

Rozdział

Rozdział

10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego

600.,..----------,

10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego

Bezrefleksyjnie przeprowadzony podział medianowy wag absolutnych spowodo grupy osób uważających pracę za nieważnązostały zakwalifikowane wszystkie osoby, które oceniły wagę pracy od 1 do 6, a więc także te oceniające pracę jako ważną (np. ocena = 6). Po obejrzeniu rozkładów nie mamy już wątpli­ wości, że wagi ipsatywne dadzą nam więcej interesującychwyników także ze wzglę­ dów statystycznych. Chociaż w tym podręczniku skoncentrowaliśmy się na testowaniu hipotez, czyli ustalaniu czy otrzymane przez nas wyniki są istotne statystycznie, to trzeba pamiętać, że podstawowym celemjest ZROZUMIENIE uzyskanych danych. Testowanie istotności stanowi ostatni etap procesu badawczego. Najpierw trzeba dokładnie obejrzeć dane, czyli wykorzystać procedury wizualizacji opisane w rozdziale 3. Możemy przecież otrzymać wyniki istotne statystycznie, mimo nierozumienia istoty zjawiska. Wiemy, że coś działa, ale nie wiemy jak. Od lat wiadomo było, że aspiryna jest skutecznym lekiem w wielu chorobach, jednak mechanizm jej działania został opisany dopiero w 1982. Wyobraźmy sobie, że należymy do grupy plemiennej, która nie wie, w jaki sposób kobiety zachodzą w ciążę. No cóż, obserwujemy i skrzętnie zapisujemy wyniki. Stawiamy hipotezę, że może to mieć związek z kontaktami z mężczyznami - pytamy kobiety o te kontakty i obserwujemy, czy kobieta jest ciężarna. Zebrane informacje mogłyby wyglądać tak jak przedstawione w tabeli 10.4: dował, że

500

.,.2

.00

NTILES ol NW1_CH

"E

:>

o

(J

300

NTILESoINW1_W

Rysunek 10.3. Liczebności grup osób wag ipsatywnych

uznających religię lub pracę

za ważną lub nie-

ważną według

Związek między obiema zmiennymi jest więc negatywny.

Opisany w rozdziale 9.

współczynnik

phi jest ujemny tp = -0,171. W przedstawionym powyżej przykładzie analiz nie zastosowaliśmy się do podstawowej heurystyki, którą wielokrotnie powtarzaliśmy w podręczniku. Nie sprawdziliśmy rozkładów obu zmiennych, przedstawionych na rysunku 10.4. ROZKŁADY WAG ABSOLUTNYCH

ROZKŁADY WAG

Tabela 10.4. Dane do zbadania hipotezy o seksualnymi

IPSATYWNYCH

KONTAKTY SEKSUALNE TAK NIE

J~WAŻNY ZAWÓD I PRACA

CIĄŻA

~

i ~ "'~.i!i

związku zajścia

TAK NIE

72

Razem

80

8

2 18 20

w

ciążę

z kontaktami

Razem

10 90 100

1(1))

JAK WAŻNY ZAWÓD l PRACA

JAK WAlNA RELIGIA I KOSCIÓŁ

i

!

°J..-"'II>oIIiIfIIIJIIfiI

"""

NW1 CH

-

JAK WfJ.1.NA RELIGIA l KOŚCIÓŁ

294

Rysunek 10.4. i pracy

Rozkłady wag

absolutnych i wag ipsatywnych przypisywanych religii

Wśród

tych kobiet, które odpowiedziały twierdząco na pytanie o kontakty, tylko 8 jest w ciąży. Wśród tych, które nie przyznały się do kontaktów, 2 (taki już los badaczy zadających pytania, którzy niekoniecznie otrzymują prawdziwe odpowiedzi) są w ciąży. Miara współzmienności wyliczona na podstawie takich obserwacji jest nieistotna statystycznie. Czy to oznacza, że nie istnieje związek między zmiennymi? Nie, ponieważ zabrakło nam wiedzy o roli czasu kontaktu. Jest to przykład wskazujący na to, że brak korelacji nie musi świadczyć o braku związku. Przykłady odwrotne (częstsze), gdy otrzymujemy pozorne korelacje, były omawiane w rozdziale 1.. Proces decyzyjny opisany został bez odwoływania się do szczególnych warunków, w których przeprowadza się badanie. W tym sensie procedura rozumiana jest jako uniwersalna dla dowolnych warunków badawczych. Decyzja jest opisana tak jakby była podejmowana bez korzystania z jakichkolwiek innych informacji, ale informacje niestatystyczne wpływają na wnioski na temat badania. Wynik istotny staty-

295

Rozdział

10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego

stycznie może być zupełnie nieważny merytorycznie. Trzeba zawsze pamiętać o róż­ nicy między podejmowaniem decyzji statystycznych a wyjaśnianiem. Trzeba też pamiętać o konieczności oceny rzetelności uzyskanego wyniku i niestatystycznych czynnikach wpływających na moc zastosowanego testu. Chcemy wiedzieć, jak rzetelne są nasze wyniki, czy te same lub podobne wnioski byłyby wyciągnięte, gdyby analiza została powtórzona na innym zbiorze danych. W pewnym sensie wnioskowanie statystyczne zastępuje powtarzanie eksperymentu. Z tego powodu reguły decyzyjne są ustalone tak jak gdyby żadne inne informacje nie były dostępne, jak gdyby hipoteza badawcza nigdy nie była testowana lub jak gdyby badacz dysponował tylko jednym zbiorem danym. W pewnych przypadkach koszty lub okoliczności nie pozwalają na analizę innego zbioru danych. Badanie może być zbyt kosztowne lub wymagać szczególnego rodzaju osób badanych, które niełatwo jest skłonić do udziału lub też trudnych do osiągnięcia czy wręcz ryzykownych warunków. W takich przypadkach decyzja musi zależeć od pojedynczej statystyki. Częściej jednak badacz ma możliwość powtórzenia eksperymentu. Nierzadko hipoteza badawcza była już testowana przez innych. Rzetelność wyniku może być oszacowana przez replikację badania. Nasze konkluzje powinny uwzględniać historię podobnych badań. Na przykład jest dobrze udowodnione, że kobiety uzyskują więcej pomocy niż mężczyźni. Jeżeli w naszych analizach różnica między deklarowanąpomocą dla kobiet i mężczyzn okazałaby się nieistotna statystycznie, to będzie­ my prawdopodobnie powstrzymywać pisanie doniesienia z badań, dopóki analiza nie zostanie powtórzona w taki sposób, że moc testu statystycznego zostanie zwięk­ szona. Jednym ze sposobów zwiększenia mocy testu jest zwiększenie liczebności próby. Możemy zdobyć większą ilość danych. Możemy też poszukać moderatorów związku - zmiennych, które mają wpływ na charakter związku między płcią biorcy a udzielaniem pomocy. Możemy sprawdzić, czy i jaki charakter ma ten związek ze względu na cechy udzielającego pomocy, np. jego wiek lub płeć. Dotychczas traktowaliśmy pojęcie wariancji zmiennej zależnej tak, że mogło­ by się wydawać, iż znajduje się ona poza naszą kontrolą. Trzeba być świadomym, że wariancja może być także do pewnego stopnia kontrolowana przez badacza. Indywidualny wynik X może być przedstawiony jako składający się z dwóch komponentów: prawdziwego wyniku i jakiegoś błędu (prawdziwy wynik to to, czym byłby X, gdyby nie było żadnego błędu). Zatem: X

= prawdziwy wynik + błąd.

Jest to klasyczna definicja pomiaru. Błąd może być rozważany jako zmienna losowa, a estymację prawdziwego wyniku można uzyskać przez ustalenie średniej z dużej liczby oddzielnych pomiarów. Przykładem kontroli wariancji może być postępowanie Ebbinghausa *, który prowadził badania na sobie, ucząc się bezsensownych sylab. Traktował on wynik po-

296

• Por. rnsko Ch.A., Schoeningen D.W. (1977). Introductory statistic for psychology. Boston: Allyn & Bacon,

Rozdział

10. Podsumowanie i wskazówki

dotyczące wyboru

testu statystycznego

wtórnego uczenia się jako miarę siły pamięci. Założył, że pojedynczy wynik powtórnego uczenia się składa się z prawdziwej miary siły pamięci i z pewnego blędu. Jednym ze źródeł błędu może być na przykład chwilowa dekoncentracja lub np. miłe wspomnienie zwiększające motywację, które mogą odpowiednio obniżyć lub podwyższyć wynik odtwarzania. Aby ten "pozytywny" i "negatywny" błąd anulować, Ebbinghaus powtarzał zadanie zapamiętywaniawiele razy i obliczał wynik średni. Przy dużej liczbie pomiarów bląd zmieniał się losowo (faktycznie miał rozkład normalny z fi = O). Innym sposobem "kontro,li" wariancji jest kontrola źró­ deł błędu. Ebbinghaus usiłował kontrolować błąd przez znormalizowanie warunków, w których się uczył. Obserwacje były dokonywane o tej samej porze dnia w cichym pokoju. Materiał do zapamiętania był względnie homogeniczny, a czas jego prezentacji - ściśle kontrolowany i tak dalej. We współczesnych laboratoriach zwierzęta są tresowane w dźwiękoszczelnych pomieszczeniach, które zapewniają pełną kontrolę stymulacji. Wszystkie te starania służą redukcji zewnętrznych wpływów na pomiary i dzięki temu redukują zmienność, która jest przyczynąbłędu. W badaniach nasza możliwość kontroli jest ograniczona istnieniem nieskończenie wielu subtelnych różnic między ludźmi. Próbujemy formułować twierdzenia o tym, jak zachowująsię ludzie, mając na myśli to, jak większość ludzi zachowuje się w więk­ szości przypadków, w określonej klasie sytuacji. Zatem nasze wnioski mogą nie być ścisłe w odniesieniu do wszystkich ludzi w takim stopniu, w jakim na wyniki badania wpływają owe niemierzone różnice indywidualne. Różnice dotyczące postaw, systemu wartości, zdolności, cech osobowości oraz niedawnych doświadczeń mogą wpływać na sposób reagowania ludzi w eksperymencie lub odpowiadanie na pytania kwestionariusza. Nawet wtedy, gdy potrafimy kontrolować samą sytuacj ę eksperymentalną, ta sama sytuacja może nie oddziaływać na każdą osobę w dokładnie taki sam sposób. Jeśli nawet udałoby się nam tak kontrolować sytuację eksperymentalną, aby była ona dokładnie jednakowa dla każdego, to istnieje realne niebezpieczeństwo takiej sterylizacji owej sytuacji, że badany nie będzie skłonny traktować jej poważnie. Słowo "sterylny" ma bowiem co najmniej dwa znaczenia: l) wolny od zarazków oraz 2) jałowy, bezpłodny. Badacz powinien dążyć do tego, by stworzyć sytuację możliwie "wolną od zarazków", nie czyniąc jej zarazemjałową czy "sztuczną" w oczach badanego. Jeśli wydarzenia zachodzące w trakcie badania czy pytania kwestionariusza nie są dla badanego interesujące i nie wciągają go, to prawdopodobnie jego reakcje nie będą naturalne, a zatem nasze rezultaty będą miały niewielkie znaczenie. Tak więc kontrola to nie wszystko, równie ważne jest, aby procedura badawcza oddziaływała na badanych. Powinni oni traktować to, o co są pytani poważnie i przejmować się tym, gdyż w przeciwnym razie ich odpowiedzi będą pozbawione znaczenia. Wiele trudności sprawia badaczom społecznym fakt, że dwa czynniki decydujące o jakości wyników: oddziaływanie i kontrola prowadzą do sprzecznych rekomendacji. Badanie pamięci przez uczenie się w sterylnych warunkach bezsensownych sylab (wysoka kontrola czynników zakłócających proces) może spowodować bardzo niską motywację badanych do zapamiętywania (zbyt słabe oddziaływanie),a przez to prowadzić do uzyskania czystych, ale zupełnie nieistotnych teoretycznie wyników.

297

Rozdział

298

10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego

Otrzymanie wyników istotnych statystycznie to nie wszystko. Wszystkie czasopisma naukowe zalecają podawanie współczynników siły efektu, procentu wyjaśnionej wariancji zmiennej zależnej przez zmienne niezależne. Omówione są one dokładnie w literaturze [4, 5, 6], do której odsyłamy Czytelnika. Niektórzy są bardzo zawiedzeni, widząc jak niewielki procent wariancji jesteśmy w stanie wyjaśnić w badaniach społecznych. Chcielibyśmy bardzo silnych zależności, takich jakich dostarczają nam obiegowe przekonania: "wszyscy jedynacy są egoistami". Tak nigdy nie jest. Dlaczego? Bo większość zmiennych jest uwarunkowana wieloczynnikowo. To, że ktoś wychowywał się w domu bez rodzeństwa, a więc ma dużo doświadczeń w relacjach pionowych np. "rodzic-dziecko", a niewiele w relacjach poziomych "brat-siostra", może TYLKO sprzyjać większej koncentracji na sobie przy założeniu, że wpływ innych czynników jest wyrównany. To ostatnie zdanie jest bardzo ważne. Znaczy ono tyle, że jeżeli mielibyśmy dwie "identyczne" osoby różniące się TYLKO liczbą rodzeństwa, to możemy przewidywać, że jedynacy będą bardziej skoncentrowani na sobie niż osoby wychowywane razem z rodzeństwem. Takich identycznych osób nie ma, a istnieje wiele innych zmiennych, które też wpływają na poziom koncentracji na sobie. Kontrola jest jedną z głównych zalet eksperymentu, jednakże nie można objąć całkowitą kontrolą środowiska, z którego pochodzą badani ludzie. Jednym z powodów, dla których wielu psychologów przeprowadza badania na szczurach zamiast na ludziach jest fakt, że umożliwia to badaczowi kontrolowanie prawie wszystkiego, co dzieje się z jego badanymi od chwili urodzenia aż do czasu zakoń­ czenia eksperymentu: klimatu, diety, ćwiczeń, kontaktów z towarzyszami zabaw, traumatycznych doświadczeń itp. Do badań używa się ostatnio także szczurów o ściśle określonych genach. Psychologowie społeczni nie mają takich możliwości kontroli wpływów genetycznych i środowiskowych, więc procenty wariancji wyjaśnionej przez zmienne niezależne nie będą nigdy imponujące. W badaniach sondażowych możemy minimalizowaćbłąd, poddając analizie złożone wskaźniki zamiast odpowiedzi na pojedyncze pytania (patrz rozdział 3.). Możemy też kontrolować inne ważne zmienne w analizach statystycznych, stosując analizy wielowymiarowe. Nie jest to jednak tak proste jak mogłoby się wydawać. Wprowadzenie dodatkowych predyktorów może zaciemnić obraz relacji między naszymi zmiennymi. Ważny problem stanowi stopień skorelowania predyktorów w równaniu regresji. Zwiększanie liczby zmiennych niezależnych w równaniu regresji daje gorsze wyniki, choć teoretycznie potęgujemy kontrolę potencjalnych zmiennych zakłócających. Często predyktory mogą mieć interakcyjny wpływ na naszą zmienną zależną. Rozważmy ten problem na przykładzie prób reprezentatywnych. Próby reprezentatywne pozwalające na generalizację naszych wyników na całą populację (warunek trafności zewnętrznej) powodują wzrost niekontrolowanej przez badacza wariancji w stopniu często uniemożliwiającym wykrycie związku. W modelach liniowych całkowite zróżnicowanie zmiennej zależnej jest dzielone na zróżnicowanie wyjaśnione zmiennymi niezależnymi i zróżnicowanie niewyjaśnione

Rozdział

10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego

(błąd). Możemy oczekiwać, że

grupy homogeniczne (np. studenci, rolnicy) nadają lepiej do badań społecznych niż grupy heterogeniczne (np. próby reprezentatywne). Te ostatnie są konieczne i doskonałe dla określania rozkładu zmiennej w populacji, np. przewidywania wyników wyborów. Dla określania związków między zmiennymi różnice w wielu zmiennych socjodemograficznych stanowią źródło wariancji niewyjaśnionej i zaciemniają związek między zmiennymi niezależnymi i zależnymi. Z powodów opisanych wyżej uwzględnienie wszystkich zmiennych socjodemograficznych i ich interakcji w analizie regresji może być ze względów statystycznych (skorelowanie predyktorów, liczebność próby) nieefektywne. Zobaczmy, jak zmienia się procent wyjaśnionej wariancji w wadze przypisywanej pracy przez 4 predyktory: waga przypisywana religii, wykształcenie (w latach), wiek, płeć respondenta w różnych podgrupach badanych (badani mieszkaj ący na wsi, w miastach powyżej 100 tysięcy i w miastach powyżej 250 tysięcy mieszkańców). Największy procent wyjaśnionej wariancji uzyskano w najmniejszej podpróbie, ale nie jest to związane z liczebnością, lecz z charakterem wariancji zmiennych. W tabeli 10.5 przedstawiono standaryzowane współczynniki regresji, liczebność próby i procent wyjaśnionej wariancji. się

Tabela 10.5. Analiza regresji zmiennej WAZNOŚĆ PRZYPISYWANA PRACY z czterema predyktorami

N

Procent

Waga religii

Wykształcenie

Wiek

Płeć

wyjaśnionej

wariancji cała

próba

tylko

wieś

1747

11,7%

-0,21

0,09

-0,18

-0,06

655

9%

-0,14

0,07'

-0,19

-0,09

497

12,7%

-0,25

0,07*

-0,19

-0,04

165

25,4%

-0,41

0,14

-0,15

-0,004(n)

miasta powyżej

100 tys.. miasta powyżej

250 tys.

(n) współczynnik nieistotny statystycznie, * tendencja statystyczna p < 0,1; pozostałe standaryzowane współczynniki regresji istotne p < 0,001

W całej analizowanej próbie jest 45,9% mężczyzn, w podpróbie mieszkającej na wsi 49,3%, w mieście 41,4%. Obie podpróby nie różnią się pod względem wieku, ale mają istotnie różne zarówno średnie, jak i wariancje pozostałych zmiennych. Zróżni­ cowanie zmiennychjest większe w mieście niż na wsi. W mieście średnia waga przypisywana religii jest mniej sza, zaś przypisywana pracy większa niż na wsi, co zostało przedstawione na rysunku 10.5. Ludzie mieszkający w mieście są lepiej wykształce­ ni. Wszystkie te różnice mogą odpowiadać za większy procent wariancji wyjaśniony napodpróbie miejskiej niż wiejskiej. 299

Rozdział

10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego 1.2...---------------~

Rozdział

Tabela 10.6. Dobór metod analizy danych do problemów badawczych w od pytania badawczego Chcemy

sprawdzić,

ilościowych

jednego

11l

'2

-.2

-o

.~

-.4

II

waga pracy



waga religii

J-_ _~-------~-----.J 1.0

2.0

wieś

miasto

10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego

Rysunek 10.5. Średnia waga przypisywana pracy i religii przez mieszkańców miast i wsi

czy zestaw zmiennych pozwala na stworzenie z nich

wskaźnika.

zależności

Analiza czynnikowa (analiza składowych głównych). Analiza rzetelności - a Cronbacha [por. 21, 10]. rozdział 3.

Chcemy odtworzyć zależności między obiektami w wielowymiarowej przestrzeni, przedstawiając obiekty jak~ ~un~ty, a ich miary. podobieństwa jako odległoscl między punktamI.

Skalowanie wielowymiarowe [por. 21]

Chcemy stworzyć (odkryć) taksonomię obiektów tak, aby obiekty zaliczone do jednej kategorii były bardziej do siebie podobne niż zaliczone do różnych kategorii.

Analiza

skupień

[por. 4]

Chcemy testować model przyczynowy na podstawie macierzy korelacji między zmiennymi.

Analiza Modele

ścieżek równań

strukturalnych [por. 14]

Chcemy badać łączny wpływ paru czynników (zmienne nominalne) na więcej niż jedną

Wielozmiennowa wieloczynnikowa analiza wariancji [por. 4]

zmienną ilościową.

Powtórzmy: Jakość naszego wniosku statystycznego zależy od mocy testu; moc testu zależy od wariancji. Te rozważania są częścią oceny wyników analizy. Jeżeli Ho nie może być odrzucona, mogą być za to częściowo odpowiedzialne niekontrolowane źródła wariancji. Możemy poszukać innych danych pozwalającychprzetestować naszą hipotezę, dobrać bardziej homogeniczne grupy osób badanych itd. Każdy z tych wysił­ ków byłby nakierowany na redukcjęwariancji i zwiększenie ufności wobec otrzymanej statystyki. Na rysunku 10.1 przedstawiliśmy tylko testy związku między dwiema zmiennymi, ale umiemy już także testować hipotezy dotyczące związku między większą liczbą zmiennych. Gdy mamy dwie zmienne nominalne i jedną przedziałową, zastosujemy dwuczynnikowąanalizę wariancji, gdy mamy więcej zmiennych przedziałowych, zastosujemy regresję wielokrotną (wieloraką) itd. Nie sposób w podstawowym podręcznikuzawrzeć wszystkiego, co jest przydatne w analizach. Przestawiliśmy tylko te testy, które są najczęściej używane w badaniach społecznych. Jeżeli Czytelnik zrozumiał, że wnioskowanie statystyczne jest przeprowadzane ciągle według tego samego schematu, nasz cel został osiągnięty. W tabeli 10.6 zebraliśmy kilka wskazówek dotyczącychskojarzeń (a nie DEFINICJI) wiążących pytanie badawcze z testem, które pozwolą się zorientować, jakiej nieomówionej w tym podręczniku techniki statystycznej potrzebujemy. Wszystkie niezbędne informacje znajdziemy w podanej w rozdziale 1. literaturze.

300

Chcemy zbadać wpływ paru zmiennych nominalnych na zmienną ilościową, kontrolując inne zmienne ilościowe.

Analiza kowariancji [por. 10, 11, 3]

Chcemy zbadać związek między zmiennymi

rs Spearmana

porządkowymi.

r(tau) Kendala [por. 3,10]

Chcemy zbadać związek między zmienną nominalną wyznaczającą podział na k grup niezależnych i zmienną porządkową.

k =2: test Manna-Whitneya k> 2: test Kruskala-Wallisa [por. 10]

Chcemy zbadać związek między zmienną nominalną wyznaczającą podział na k grup zależnych i zmienną porządkową.

k

=2: test znaków, test Wilcoxona dla

par

k> 2: test Friedmana [por. 10]

Kończymy w tym momencie jazdy z instruktorem, co nie oznacza, że zostawiamy Czytelnika samego. Przyszedł czas na lekturę bardziej zaawansowa~ych pra~ metodologicznych [4, 5, 6, 10, 19] i czas na samodzielne eksperymentowame z anahzą danych. Żaden, nawet najlepszy kurs jazdy nie zastąpi własnego doświadczenia. Kwalifikacje kierowcy najlepiej można ocenić, pytając o liczbę godzin spędzonych za kierownicą.Analogicznie nasze kwalifikacje dotyczące analizy danych zależą od liczby analiz, które wykonaliśmy.Oczywiściemoże być to wskaźnik mylący, bo tak jak kierowca może jeździć wyłącznie po wielopasmowej autostradzie, tak my możemy, pracując w mało ambitnej agencji, produkować wyłącznie rozkłady frekwencji ... Życzymy Czytelnikom, aby wyniki ich analiz wzbudzały dreszczyk emOCJI zachęcający do dalszych dociekań. Statystyka jest tylko narzędziem do rozwiązy­ wania problemów badawczych. A tych w naukach społecznych nie brakuje. Prawidłowe wykorzystanie narzędzi zwiększy w znaczący sposób przyrost naszej wiedzy. Niechęć badaczy do zrozumienia istoty wnioskowania statystycznego zbyt często powoduje, że zgromadzone dane zamiast pogłębiać naszą wiedzę lądują w koszu.

301

Rozdział

10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego

Przypominamy, że nie omówiliśmy w podręczni­ ku bardzo wielu ważnych zagadnień metodologicznych, dlatego dalsza lektura jest konieczna [patrz spis literatury w rozdziale 1.]. Mamy nadzieję, że po przełamaniu niechęci będzie ona łatwiejsza. Zapraszamy do zaglądania na naszą stronę internetową www.come.uw.edu.pl/gw i dzielenia się z nami refleksjami.

Tablice

302

Z

P,

P,

Z

P,

P,

Z

P,

P,

Z

P,

P,

Z

P,

P,

Z

P,

P,

Z

P,

P,

0,01 °0,02 0,03 0,04

0,0000 0,0040 0,0080 0,0120 0,0160

0,5000 0,4960 0,4920 0,4880 0,4840

0,5 0,51 0,52 0,53 0,54

0,1915 0,1950 0,1985 0,2019 0,2054

0,3085 0,3050 0,3015 0,2981 0,2946

1 1,01 1,02 1,03 1,04

0,3413 0,3438 0,3461 0,3485 0,3508

0,1587 0,1562 0,1539 0,1515 0,1492

1,5 1,51 1,52 1,53 1,54

0,4332 0,4345 0,4357 0,4370 0,4382

0,0668 0,0655 0,0643 0,0630 0,0618

2 2,01 2,02 2,03 2,04

0,4772 0,4778 0,4783 0,4788 0,4793

0,0228 0,0222 0,0217 0,0212 0,0207

2,5 2,51 2,52 2,53 2,54

0,4938 0,4940 0,4941 0,4943 0,4945

0,0062 0,0060 0,0059 0,0057 0,0055

3 3,01 3,02 3,03 3,04

0,4987 0,4987 0,4987 0,4968 0,4988

0,0013 0,0013 0,0013 0,0012 0,0012

0,05 0,06 0,07 0,08 0,09

0,0199 0,0239 0,0279 0,0319 0,0359

0,4801 0,4761 0,4721 0,4681 0,4641

0,55 0,56 0,57 0,58 0,59

0,2088 0,2123 0,2157 0,2190 0,2224

0,2912 0,2877 0,2843 0,2810 0,2776

1,05 1,06 1,07 1,08 1,09

0,3531 0,3554 0,3577 0,3599 0,3621

0,1469 0,1446 0,1423 0,1401 0,1379

1,55 1,56 1,57 1,58 1,59

0,4394 0,4406 0,4418 0,4429 0,4441

0,0606 0,0594 0,0582 0,0571 0,0559

2,05 2,06 2,07 2,08 2,09

0,4798 0,4803 0,4808 0,4812 0,4817

0,0202 0,0197 0,0192 0,0188 0,0183

2,55 2,56 2,57 2,58 2,59

0,4946 0,4948 0,4949 0,4951 0,4952

0,0054 ,0052 0,0051 0,0049 0,0048

3,05 3,06 3,07 3,08 3,09

0,4989 0,4989 0,4989 0,4990 0,4990

0,0011 0,0011 0,0011 0,0010 0,0010

0,1 0,11 0,12 0,13 0,14

0,0398 0,0438 0,0478 0,0517 0,0557

0,4602 0,4562 0,4522 0,4483 0,4443

0,6 0,61 0,62 0,63 0,64

0,2257 0,2291 0,2324 0,2357 0,2389

0,2743 0,2709 0,2676 0,2643 0,2611

1,1 1,11 1,12 1,13 1,14

0,3643 0,3665 0,3686 0,3708 0,3729

0,1357 0,1335 0,1314 0,1292 0,1271

1,6 1,61 1,62 1,63 1,64

0,4452 0,4463 0,4474 0,4484 0,4495

0,0548 0,0537 0,0526 0,0516 0,0505

2,1 2,11 2,12 2,13 2,14

0,4821 0,4826 0,4830 0,4834 0,4838

0,0179 0,0174 0,0170 0,0166 0,0162

2,6 2,61 2,62 2,63 2,64

0,4953 0,4955 0,4956 0,4957 0,4959

0,0047 0,0045 0,0044 0,0043 0,0041

3,1 3,11 3,12 3,13 3,14

0,4990 0,4991 0,4991 0,4991 0,4992

0,0010 0,0009 0,0009 0,0009 0,0008

0,15 0,16 0,17 0,18 0,19

0,0596 0,0636 0,0675 0,0714 0,0753

0,4404 0,4364 0,4325 0,4286 0,4247

0,65 0,66 0,67 0,68 0,69

0,2422 0,2454 0,2486 0,2517 0,2549

0,2578 0,2546 0,2514 0,2483 0,2451

1,15 1,16 1,17 1,18 1,19

0,3749 0,3770 0,3790 0,3810 0,3830

0,1251 0,1230 0,1210 0,1190 0,1170

1,65 1,66 1,67 1,68 1,69

0,4505 0,4515 0,4525 0,4535 0,4545

0,0495 0,0485 0,0475 0,0465 0,0455

2,15 2,16 2,17 2,18 2,19

0,4842 0,4846 0,4850 0,4854 0,4857

0,0158 0,0154 0,0150 0,0146 0,0143

2,65 2,66 2,67 2,68 2,69

0,4960 0,4961 0,4962 0,4963 0,4964

0,0040 0,0039 0,0038 0,0037 0,0036

3,15 3,16 3,17 3,18 3,19

0,4992 0,4992 0,4992 0,4993 0,4993

0,0008 0,0008 0,0008 0,0007 0,0007

0,2 0,21 0,22 0,23 0,24

0,0793 0,0832 0,0871 0,0910 0,0948

0,4207 0,4168 0,4129 0,4090 0,4052

0,7 0,71 0,72 0,73 0,74

0,2580 0,2611 0,2642 0,2673 0,2704

0,2420 0,2389 0,2358 0,2327 0,2296

1,2 1,21 1,22 1,23 1,24

0,3849 0,3869 0,3888 0,3907 0,3925

0,1151 0,1131 0,1112 0,1093 0,1075

1,7 1,71 1,72 1,73 1,74

0,4554 0,4564 0,4573 0,4582 0,4591

0,0446 0,0436 0,0427 0,0418 0,0409

2,2 2,21 2,22 2,23 2,24

0,4861 0,4864 0,4868 0,4871 0,4875

0,0139 0,0136 0,0132 0,0129 0,0125

2,7 2,71 2,72 2,73 2,74

0,4965 0,4966 0,4967 0,4968 0,4969

0,0035 0,0034 0,0033 0,0032 0,0031

3,2 3,21 3,22 3,23 3,24

0,4993 0,4993 0,4994 0,4994 0,4994

0,0007 0,0007 0,0006 0,0006 0,0006

0,25 0,26 0,27 0,28 0,29

0,0987 0,1026 0,1064 0,1103 0,1141

0,4013 0,3974 0,3936 0,3897 0,3859

0,75 0,76 0,77 0,78 0,79

0,2734 0,2764 0,2794 0,2823 0,2852

0,2266 0,2236 0,2206 0,2177 0,2148

1,25 1,26 1,27 1,28 1,29

0,3944 0,3962 0,3980 0,3997 0,4015

0,1056 0,1038 0,1020 0,1003 0,0985

1,75 1,76 1,77 1,78 1,79

0,4599 0,4608 0,4616 0,4625 0,4633

0,0401 0,0392 0,0384 0,0375 0,0367

2,25 2,26 2,27 2,28 2,29

0,4878 0,4881 0,4884 0,4887 0,4890

0,0122 0,0119 0,0116 0,0113 0,0110

2,75 2,76 2,77 2,78 2,79

0,4970 0,4971 0,4972 0,4973 0,4974

0,0030 0,0029 0,0028 0,0027 0,0026

3,3 3,4 3,5 3,6 3,7

0,4995 0,4997 0,4998 0,4998 0,4999

0,0005 0,0003 0,0002 0,0002 0,0001

0,3 0,31 0,32 0,33 0,34

0,1179 0,1217 0,1255 0,1293 0,1331

0,3821 0,3783 0,3745 0,3707 0,3669

0,8 0,81 0,82 0,83 0,84

0,2881 0,2910 0,2939 0,2967 0,2995

0,2119 0,2090 0,2061 0,2033 0,2005

1,3 1,31 1,32 1,33 1,34

0,4032 0,4049 0,4066 0,4082 0,4099

0,0968 0,0951 0,0934 0,0918 0,0901

1,8 1,81 1,82 1,83 1,84

0,4641 0,4649 0,4656 0,4664 0,4671

0,0359 0,0351 0,0344 0,0336 0,0329

2,3 2,31 2,32 2,33 2,34

0,4893 0,4896 0,4898 0,4901 0,4904

0,0107 0,0104 0,0102 0,0099 0,0096

2,8 2,81 2,82 2,83 2,84

0,4974 0,4975 0,4976 0,4977 0,4977

0,0026 0,0025 0,0024 0,0023 0,0023

0,35 0,36 0,37 0,38 0,39

0,1368 0,1406 0,1443 0,1480 0,1517

0,3632 0,3594 0,3557 0,3520 0,3483

0,85 0,86 0,87 0,88 0,89

0,3023 0,3051 0,3078 0,3106 0,3133

0,1977 0,1949 0,1922 0,1894 0,1867

1,35 1,36 1,37 1,38 1,39

0,4115 0,4131 0,4147 0,4162 0,4177

0,0885 0,0869 0,0853 0,0838 0,0823

1,85 1,86 1,87 1,88 1,89

0,4678 0,4686 0,4693 0,4699 0,4706

0,0322 0,0314 0,0307 0,0301 0,0294

2,35 2,36 2,37 2,38 2,39

0,4906 0,4909 0,4911 0,4913 0,4916

0,0094 0,0091 0,0089 0,0087 0,0084

2,85 2,86 2,87 2,88 2,89

0,4978 0,4979 0,4979 0,4980 0,4981

0,0022 0,0021 0,0021 0,0020 0,0019

0,4 0,41 0,42 0,43 0,44

0,1554 0,1591 0,1628 0,1664 0,1700

0,3446 0,3409 0,3372 0,3336 0,3300

0,9 0,91 0,92 0,93 0,94

0,3159 0,3186 0,3212 0,3238 0,3264

0,1841 0,1814 0,1788 0,1762 0,1736

1,4 1,41 1,42 1,43 1,44

0,4192 0,4207 0,4222 0,4236 0,4251

0,0808 0,0793 0,0778 0,0764 0,0749

1,9 1,91 1,92 1,93 1,94

0,4713 0,4719 0,4726 0,4732 0,4738

0,0287 0,0281 0,0274 0,0268 0,0262

2,4 2,41 2,42 2,43 2,44

0,4918 0,4920 0,4922 0,4925 0,4927

0,0082 0,0080 0,0078 0,0075 0,0073

2,9 2,91 2,92 2,93 2,94

0,4981 0,4982 0,4982 0,4983 0,4984

0,0019 0,0018 0,0018 0,0017 0,0016

0,45 0,46 0,47 0,48 0,49

0,1736 0,1772 0,1808 0,1844 0,1879

0,3264 0,3228 0,3192 0,3156 0,3121

0,95 0,96 0,97 0,98 0,99

0,3289 0,3315 0,3340 0,3365 0,3389

0,1711 0,1685 0,1660 0,1635 0,1611

1,45 1,46 1,47 1,48 1,49

0,4265 0,4279 0,4292 0,4306 0,4319

0,0735 0,0721 0,0708 0,0694 0,0681

1,95 1,96 1,97 1,98 1,99

0,4744 0,4750 0,4756 0,4761 0,4767

0,0256 0,0250 0,0244 0,0239 0,0233

2,45 2,46 2,47 2,48 2,49

0,4929 0,4931 0,4932 0,4934 0,4936

0,0071 0,0069 0,0068 0,0066 0,0064

2,95 2,96 2,97 2,98 2,99

0,4984 0,4985 0,4985 0,4986 0,4986

0,0016 0,0015 0,0015 0,0014 0,0014

....

I\) I\)

I\)

....

I\)

O

.... .... ......... .... .... .... ....W .... ........ O.... ,. 01 (j) CO ,. o.j>,. '"o ...... N W .j>,. (j) ..... O...... N (j) .j>,. 01 01 (j) (j) (j) ..... CO CO ,. ..... 01 ..... ...... (j)

N

~

(j)

I\)

N ...... .!'WV ' ...... 00 ,. N

~

W

W ~

.j>,.

CO N

.j>,.

01

.j>,.

..... ......

O

-.j>,.

W O W

.j>,.

...... .!'V

..... O

(j)

W

(j) ...... co ,.

.j>,.

-.j>,.

01

01

-.j>,.

W

O

......

CO

W

...... ...... S>' N

_W _W

-.j>,. -.j>,. ...... N W ...,., o o..... .j>,. ...... N ...... W

W ,.

,.

......

CO

...... W ...... .!'V (j)

(j) '"(j) co ......