146 47 62MB
Norwegian Pages 181 Year 1997
Tor Grenness
Innføring i vitenskapsteori og metode
NASJOn.V.r—< i r..'.::. } FCZ14- 2. ww
Tano Aschehoug
t^lQ
Det må ikke kopieres fra denne boken i strid med åndsverkloven eller avtaler om ko piering inngått med KOPINOR, Interesseorgan for rettighetshavere til åndsverk. Kopiering i strid med lov eller avtale kan medføre erstatningsansvar og inndragning, og kan straffes med bøter eller fengsel.
© Tor Grenness og Tano Aschehoug 1997 Omslag: Inger Lise Engebretsen Sats: Tano Aschehoug Trykk og innbinding: AiT Enger AS, Otta
ISBN 82-518-3619-0
Innhold Forord................................................................................................................ 9 1 Perspektiver og målsetting.................................................................. 11 2 Hva er vitenskapsteori og metodelære?.......................................... 13
Om bokas oppbygging......................................................................... 16 Stikkord til kapittel 2........................................................................... 18 Øvingsoppgave til kapittel 2............................................................... 18 Litteratur å gå videre med.................................................................. 18 Del I: Vitenskapsteori
3 Hva er vitenskap?..................................................................................... 21
Stikkord til kapittel 3............................................................................ 25 Øvingsoppgave til kapittel 3................................................................ 25 Litteratur å gå videre med................................................................... 25 4 Logisk positivisme og kritisk rasjonalisme....................................... 26
Kritisk rasjonalisme............................................................................... 30 Stikkord til kapittel 4............................................................................ 33 Øvingsoppgave til kapittel 4................................................................ 33 Litteratur å gå videre med................................................................... 33 5 Om hermeneutikk og paradigmer....................................................... 34
Om paradigmer og paradigmeskifte.................................................... 38 Thomas Kuhns oppstilling over fasene i et paradigmeskifte ........ 38 Stikkord til kapittel 5............................................................................ 43 Øvingsoppgaver til kapittel 5............................................................... 43 Litteratur å gå videre med................................................................... 43 6 Kritisk teori................................................................................................ 44
Om å tenke og handle kritisk............................................................... 44 Marx' kritikk av den politiske økonomien.......................................... 45 Aksjonsforskningen.............................................................................. 48 Stikkord til kapittel 6............................................................................ 52 a
Øvingsoppgave til kapittel 6................................................................ 52 Litteratur å gå videre med................................................................... 52 7 Noen avsluttende kommentarer om vitenskapsteori..................... 53
Stikkord til kapittel 7............................................................................ 59 Øvingsoppgave til kapittel 7................................................................ 59 Litteratur å gå videre med................................................................... 59 Del II: Forskningsmetode 8 Fra teori til empiri.................................................................................... 63
Hvorfor drive forskning?..................................................................... 63 Så hva betyr det egentlig å forske?...................................................... 64 Men hva er egentlig en teori?..........................................................66 Hvorfor teori?.................................................................................. 67 Teori og modell................................................................................... 68 Stikkord til kapittel 8............................................................................ 71 Øvingsoppgave til kapittel 8................................................................ 72 Litteratur å gå videre med................................................................... 72 9 Strategi, design og metodevalg: tre stadier i forskningsprosessen......................................................73
Forskningsstrategien............................................................................. 73 Forskningsdesignet - fra strategiske overveielser til taktiske løsninger...............................75 Det norske arbeidslivseksperimentet...............................................78 Det eksplorative design................................................................... 79 Det deskriptive design..................................................................... 79 Stikkord til kapittel 9............................................................................ 82 Øvingsoppgaver til kapittel 9............................................................... 82 Litteratur å gå videre med................................................................... 82 10 Forskningsprosessen............................................................................... 83
To eksempler......................................................................................... 83 En sikker vei til kunnskap - finnes den?..............................................84 Idealet?................................................................................................. 85 Case: Hansa Pils i Klasse 1................................................................... 89 Tok markedsforskerne feil?.................................................................. 90 Stikkord til kapittel 10......................................................................... 91 Øvingsoppgave til kapittel 10.............................................................. 91 Litteratur å gå videre med................................................................... 92 6
11 Om å undersøke virkeligheten - noen overgripende problemer 93
Om å måle virkeligheten.......................................................................94 Målebegrepet........................................................................................ 96 Stikkord til kapittel 11.......................................................................... 99 Øvingsoppgaver til kapittel 11............................................................. 99 Litteratur å gå videre med................................................................ 100 12 Om måleskalaer og skalakonstruksjon........................................... 101
Forholdstallsnivå............................................................................... 102 Intervallnivå...................................................................................... 103 Ordinalnivå........................................................................................ 106 Nominalnivå..................................................................................... 107 Stikkord til kapittel 12...................................................................... 109 Øvingsoppgaver til kapittel 12......................................................... 109 Litteratur å gå videre med................................................................. 109 13 Validitet og reliabilitet........................................................................ 110
Nærmere om validitet....................................................................... 111 Reliabilitet........................................................................................... 113 Stikkord til kapittel 13........................................................................ 114 Øvingsoppgaver til kapittel 13........................................................... 114 Litteratur å gå videre med..................................................................115 14 Gangen i en undersøkelse.................................................................... 116
Utforming av undersøkelsesproblemet............................................. 116 Markeds- og organisasjonsundersøkelsen.......................................... 116 Sentrale utfordringer.......................................................................... 117 Stikkord til kapittel 14........................................................................ 121 Øvingsoppgave til kapittel 14............................................................ 122 Litteratur å gå videre med................................................................. 122 15 Innsamling av sekundærdata.............................................................. 123
Stikkord til kapittel 15........................................................................ 127 Øvingsoppgave til kapittel 15............................................................ 128 Litteratur å gå videre med................................................................. 128 16 Om utvalg og utvalgstrekking............................................................ 129
Gangen i utvalgsprosedyren............................................................... 131 Hvordan bestemmer vi universet?......................................................132 Valg av utvalgsramme......................................................................... 132 Valg mellom sannsynlighets- og ikke-sannsynlighetsutvelgelse...... 133 7
Bestemmelse av utvalgsmetode.......................................................... 134 Stratifierte utvalg............................................................................ 135 Stikkord til kapittel 16........................................................................ 138 Øvingsoppgaver til kapittel 16........................................................... 138 Litteratur å gå videre med................................................................. 139 17 Innsamling av primærdata................................................................... 140
Surveymetoden................................................................................... 143 Feilkilder......................................................................................... 147 Stikkord til kapittel 17........................................................................ 152 Øvingsoppgave til kapittel 17............................................................ 152 Litteratur å gå videre med................................................................. 152 18 Kvalitative metoder................................................................................ 153
Stikkord til kapittel 18........................................................................ 157 Øvingsoppgave til kapittel 18............................................................ 157 Litteratur å gå videre med................................................................. 157 19 Dataanalyse............................................................................................... 158
Kvantitativ dataanalyse....................................................................... 159 Men er sammenhengen reell?........................................................161 Sammenheng og årsakssammenheng................................................ 162 Styrken av sammenhenger................................................................. 163 Kvalitativ analyse.................................................................................165 Strategi for egen forskning................................................................ 167 Stikkord til kapittel 19........................................................................ 168 Øvingsoppgave til kapittel 19............................................................ 168 Litteratur å gå videre med................................................................. 168 20 Sluttord om vitenskapsteori og forskningsmetode....................... 169
Vedlegg: Eksempel på spørreskjema........................................................ 171 Ordforklaringer.............................................................................................. 176
Litteratur......................................................................................................... 181
Forord
Utgangspunktet for denne boka er forfatterens egne forelesninger i samfunnsivtenskapelig metode og markedsanalyse ved ulike læresteder, først og fremst ved BI og Norges Markedshøyskole. Erfaringer herfra har etter hvert lært meg at det er enkelte sider ved metodefaget det synes vanskeligere for studenter å få skikkelig grep på, og at for å oppnå dette grepet hadde det vært en fordel at studentene hadde en viss vitenskapesteoretisk innsikt. Samtidig har det vært et problem at innføringsbøker i vitenskapsteori, iallfall med en viss vinkling mot økonomisk-administrative fagområder, har vært vanskelig å oppdrive, samtidig som metodebøkene enten har vært ren dyrkede samfunnsvitenskapelige metodebøker (og dem finnes det faktisk mange av) eller rendyrkede lærebøker i markedsanalyse. Hva jeg savnet, var en innføringsbok som forsøkte å kombinere elemen ter av ovennevnte: en del vitenskapsteori, en del grunnleggende metode problematikk og en del markedsanalyse. Tanken om å forsøke å skrive noe slikt selv vokste seg stadig sterkere, og til slutt bestemte jeg meg for å prøve. I den forbindelse er det viktig å understreke et par ting: Denne boka gjør ikke krav på å gi noen fullstendig dekning av det omfattende området «vi tenskapsteori». Jeg har forsøkt å plukke ut en del sentrale deler, blant annet ut fra i hvilken grad disse kan sies å være relevante og interessante å drøfte i forhold til problemstillinger hentet fra ulike økonomisk-administrative fag, eksempelvis forbrukeratferd eller organisasjon og ledelse. Mange sider ved vitenskapsteorien er således utelatt. For den som ønsker en noe mer omfattende innføring, kan for eksempel Føllesdal og Walløes Argumentasjonsteori og vitenskapsfilosofi eller Odd Wormnæs' Vitenskapsfi losofi være velegnet. Noe av det samme kan anføres når det gjelder bokas metodedel. Heller ikke den dekker hele metodeområdet. Jeg har flere ganger underveis un derstreket dette, og begrunnelsen min er delvis at dette rett og slett ville ha blitt for omfattende, men kanskje først og fremst at det allerede finnes flere svært gode, norske metodebøker. Ottar Helleviks Forskningsmetode i sosiolo gi og statsvitenskap er en slik, Holme og Solvangs Metodevalg og metodebruk er en annen. Og det finnes flere. Selv om denne boka verken dekker hele vitenskapsteorifeltet eller kan 9
kalles en metodebok i tradisjonell forstand, kan den muligens likevel bidra til at studenter får et enda bedre «grep» om tingene gjennom at den - forsøker å gi en forholdsvis lettfattelig innføring i vitenskapsteori - fokuserer på de deler av metodefaget som studenter erfaringsmessig har vansker med å forstå ordentlig - forsøker å bygge bro mellom vitenskapsteori og forskningsmetode gjen nom henvisninger og eksempler
I tilknytning til hvert kapittel finnes det videre et utvalg sentrale stikkord, minst én øvingsoppgave samt forslag til litteratur å gå videre med. Ikke minst gjennom å arbeide med øvingsoppgavene, gjerne i form av gruppear beid i tilknytning til undervisningen, vil det være gode muligheter til å få bekreftet for seg selv at stoffet «sitter». Selv om bokas målgruppe kanskje særlig befinner seg på de økonomiskadministrative studier, vil studenter også ved andre studieretninger formo dentlig ha utbytte av fremstillingen. De fleste øvingsoppgavene er for ek sempel ikke mer spesielle enn at de er meningsfulle for studenter flest. Boka forusetter ingen forkunnskaper. Utstyrt med en viss intellektuell nysgjerrighet og med ønske om å bli bedre kjent med hva fremtredende fi losofer og vitenskapsfolk har ment og mener om vår evige søken etter (sik ker) kunnskap, skulle alle forutsetninger være til stede for å ha utbytte av innholdet. Oslo, mai 1997 Tor Grenness
Kapittel 1
Perspektiver og målsetting En innføring i vitenskapsteori og forskningsmetode kan naturligvis gjøres på flere måter. I dette tilfelle er det, gjennom eksempler og referanser, for søkt å knytte innholdet mest mulig opp mot fag en gjerne forbinder med økonomisk-administrativ utdanning, først og fremst organisasjons- og markedsføringsfag. Når dette likevel ikke er en lærebok i markeds- eller organisasjonsforskning, skyldes det nokså avgjørende forskjeller mellom så vel perspektiv som målsetting for denne boka og de fleste bøker av ovennevnte type. Markeds- og organisasjonsforskningslitteraturen, slik vi kjenner den fra både Norge og utlandet, fremstår gjerne som overveiende «verktøybasert». Med det menes at disse bøkene først og fremst er skrevet med tanke på å gi gode «oppskrifter» på hvordan vellykkede undersøkelser skal gjennomføres. Denne boka har et noe videre perspektiv. Selvsagt skal den ha en nytteverdi. Også den som leser Innføring i vitenskapsteori og metode bør ende opp med å beherske det verktøyet vi har til rådighet for gjennomføring av markeds-, samfunns- eller organisasjonsundersøkelser. Imidlertid vil både bokas inn hold og måten stoffet er vektet på, vise at den også har et noe annet per spektiv. For det første har boka en innledende del om vitenskapsteori. Det er en type stoff vi vanligvis ikke finner i metodelitteraturen. Vitenskapsteori drei er seg vel så mye om en forståelse av hvorfor noe kalles god eller dårlig forskning, som selve metodekunnskapene. Dette vil forhåpentligvis også bli klarere etter hvert. Eller sagt på en annen måte: Det er vårt kjennskap til vitenskapsteoretiske spørsmål og problemstillinger som kanskje mer enn noe annet gjør oss i stand til å reflektere over de metodiske valg vi gjør under gjennomføringen av en konkret undersøkelse. For det andre er vektingen av selve metodedelen antakelig også noe an nerledes enn hva som er vanlig i metodelitteraturen. Slik vi ser det, kan en forskningsprosess i alminnelighet deles inn i to ho vedfaser:
11
1 en teorifase, det vil si de arbeids- og tankeoperasjoner som finner sted før selve innsamlingen av data (informasjon) tar til. Enkelte kaller denne fasen for «designfasen»
2 en empirifase, det vil si den fysiske innsamlingen, bearbeidingen og ana lysen av de innsamlede data (Mange vil kanskje mene at enda en fase kommer til, nemlig den vi kan kal le «rapporteringsfasen». Denne vil imidlertid ikke bli berørt her.)
I boka vil det bli lagt størst vekt på det vi ovenfor har kalt teorifasen. Dette er et resultat av et helt bevisst valg og begrunnes med at denne fasen for det første er helt avgjørende for kvaliteten av undersøkelsen (dårlig arbeid inn ledningsvis kan altså ikke kompenseres gjennom for eksempel avansert sta tistisk analyse senere). For det andre fordi mye av kvaliteten på arbeidet i empirifasen ofte avhenger mer av kvaliteten på de statistiske programmer en har til rådighet enn av forskningsmessig innsikt og kompetanse. Forutsetningene for å kunne drive forskning om samfunn, marked eller organisasjoner er at våre handlinger følger nokså entydige mønstre, at våre hensikter er forståelige fordi de er gjenkjennelige, og at enhver gruppe, li ten eller stor, oppviser en tydelig struktur. Overalt i den sosiale virkelighet støter vi på regelmessigheter, og det er disse som gir oss grunnlaget for å drive formålstjenlig forskning. Samfunns-, markeds- og organisasjonsforskningens mål blir derfor - så presist som mulig - å beskrive ulike grupper (forbrukere, velgere, kunder, ansatte), deres handlinger (valgatferd, fritid saktiviteter, beslutningsatferd) og holdninger eller hensikter, for dermed å gi best mulig innsikt, forståelse eller grunnlag for å ta fornuftige og riktige beslutninger. Det er denne forfatters overbevisning at dette best kan oppnås nettopp gjennom å anlegge et perspektiv på undersøkelsesprosessen som setter de innledende faser i fokus, ganske enkelt fordi dette tvinger oss til å tenke grundig igjennom hva vi skal gjøre, hvorfor vi skal gjøre det, og hvordan vi skal gjøre det - før vi løper ut i virkelighetens verden med spørreskjemaene våre. Det kan spare oss for mange skuffelser og ergrelser, og - kanskje viktigst - det gir en langt bedre kvalitetssikring av forskningsprosessen.
12
Kapittel 2
Hva er vitenskapsteori opf metodelære ? I denne boka vil det bli presentert noen sentrale teorier om hva vitenskap er. Deretter vil vi gjennomgå noen sentrale metoder vi kan anvende for å frem bringe ny viten. Begrunnelsene for å knytte noen grunnleggende teorier om hva viten skapelig virksomhet er, opp mot mer praktisk rettede metodiske problem stillinger, er flere. Betydningen av vitenskap og forskning for den alminnelige samfunnsut vikling tilsier at disse områdene ikke er noe som utelukkende er av interesse for forskere og vitenskapsfolk. Vitenskap og forskning representerer i dag en betydelig innsats- og konkurransefaktor, noe som ikke minst fremgår av regjeringens siste langtidsprogram (St.meld. nr. 4 (1996-97)), reorganise ringen av Norges Forskningsråd og den økende aktiviteten ved ulike statli ge, halvstatlige og private forskningsinsitutter. Parallelt med økende betyd ning og stigende oppmerksomhet rundt vitenskapelige og forskningsmessi ge problemstillinger og resultater har man også kunnet registrere økt inter esse for vitenskapens grunnleggende problemer. Hva kjennetegner egentlig vitenskapelig virksomhet? Hvilke forskjeller er det mellom slik virksomhet og andre former for intellektuelle aktiviteter? Hvordan skal man kunne vur dere om noe er god eller dårlig forskning? Finnes det en bestemt vitenska pelig metode som er felles for alle vitenskaper, eller finnes det flere? Er forskningens resultater alltid objektive og nøytrale, eller kan de uttrykke be stemte ideologier og særinteresser? Ikke minst har denne siste problemstil lingen vært særlig tydelig i den norske debatten, der enkelte synes å mene at det stadig oftere forekommer litt for tette bindinger mellom oppdragsgiver og forskere. Spissformuleringer som «kjøp en forsker» har for eksempel vært benyttet i denne sammenhengen. Dette er eksempler på spørsmål som har trengt seg på i takt med viten skapens økende samfunnsmessige betydning. Imidlertid innebærer dette ikke at det er tale om helt nye spørsmål - tvert om er dette spørsmål som vi tenskapsfolk og filosofer har beskjeftiget seg med i århundrer. Det nye er at spørsmålene har fatt betydning for flere, og at de spørsmål som vedrører vi13
tenskapenes samfunnsmessige rolle, har fått større betydning - ikke minst samfunnsøkonomisk. Den fagdisiplin som i nyere tid først og fremst har vært opptatt av spørs mål som har å gjøre med vitenskapenes grunnlag og egenart, kalles for vi tenskapsteori eller vitenskapsfilosofi. Vitenskapsteori handler i bunn og grunn om å stille opp teorier for hva vitenskap egentlig er. Det andre temaet i boka, forskningsmetode, dreier seg om hvilke frem gangsmåter man kan og bør anvende i jakten på ny kunnskap. Det er en sammenheng mellom vitenskapsteori og forskningsmetode, idet teorier om hva vitenskap er kan begrunne hvilke fremgangsmåter det er fornuftig og tilrådelig å bruke for å fremskaffe ny viten. «Vitenskap inneholder et bredt spekter av forskjellige metoder som må til passes hvert enkelt problem som skal undersøkes. Det er kanskje det mest kritiske ledd i forskningsprosessen, og det forutsetter at forskeren har den nødvendige vitenskapsteoretiske skolering» (Aftenposten 5. januar 1997, kronikk av Tor Waaler, «Jagland og homøopatiens plass i Helse-Norge).
Sett i et historisk perspektiv er vitenskapsteori som selvstendig disiplin av forholdsvis ny dato som eget fag ved universiteter og høgskoler. I Norge ble vitenskapsteoretiske spørsmål for alvor brakt på banen gjennom den såkalte «positivismestriden», som på mange måter falt sammen med studentopprø ret på slutten av 60-årene og begynnelsen av 70-årene. Det ene var på mange måter en forutsetning for det andre. Gjennom å sette fokus på vi tenskapens teoretiske grunnlag - altså de rådende vitenskapsidealer som do minerte forskning og undervisning ved universitetene og som fastholdt vi tenskapens verdinøytralitet (det weberske skillet mellom vitenskap og poli tikk), ble grunnen lagt for en diskusjon omkring vitenskap og verdifrihet som, nærmest som politisk konsekvens, langt på vei fratok vitenskapen dens tradisjonelle posisjon som objektiv og nøytral. Eller for å si det med en av debattantene fra den gang: «Ideen om den verdifrie vitenskap fungerte progressivt i kampen mot middelalderkirkens og fascismens åpne antivitenskapelighet. I dag legitimerer den en prosess som bryter ned den debatten som den tidligere bidro til å skape. Har vi forstått dette, har vi forstått positivistisk vitenskapsfilosofis re lative historiske betydning, en historisk refleksjon som har frigjort oss fra positivismens tankefengsel» (Christiansen og Vold, 1969:30).
I dag er vitenskapsteoretiske problemstillinger ikke lenger forbeholdt stu denter på doktorgradsnivå. Stadig sterkere har mange sett nødvendigheten
14
av ikke bare å konfrontere studenter med rådende kunnskap og forskningsmetodiske regler og teknikker, men også hva vitenskapelig basert kunnskap er og hvilken rolle den spiller i den samfunnsmessige praksis. A betrakte for eksempel bedriftsøkonomien, markedsføringsfaget eller pedagogikkfaget i et vitenskapsteoretisk perspektiv innebærer - for å si det litt enkelt - at vi anlegger et fugleperspektiv på faget. Da vil vi antakelig oppdage at et fellestrekk for de fleste fag og disipliner er at vår «viten» in nenfor et fagområde stammer fra forskjellige kilder, noen «teoretiske» frem brakt for eksempel gjennom forskning, og noen «praktiske» frembrakt som resultat av egen eller andres erfaring. Vitenskapsteoriens oppgave blir dermed på en meningsfull måte å sam menfatte denne type kunnskap til en helhet. Vitenskapsteorien blir på den måten en teori om andre teorier, på samme måte som disse andre teorier er teorier om en del av virkeligheten (figur 1). Vitenskapsteoretisk nivå: antakelser om hva kunnskap er, hvordan den frembringes og spiller sammen med praksis
Det fagvitenskapelige nivå: teorier, modeller og empirisk kunnskap i de forskjellige fag.
Anvendelsessektor
Utdannelses- og forskningsinstitusjoner
ihold mnskapsprosesser
Virkelighetsnivå: de deler av virkeligheten og praksisfelter som faget handlerom, f.eks. virksomheter, forbrukere osv.
Figur 1 Kilde: Andersen, 1990.
I vitenskapsteorien er vi altså opptatt av ulike egenskaper ved viten(skap). Men dette kan selvfølgelig ikke bli meningsfullt uten å ta hensyn til hva denne viten handler om (lære barn å lese, forstå forbrukets atferd osv.). Derfor er også virkelighetsnivået med praksisfelter tatt med i figur 1. Vide re inneholder figuren også teorier, modeller og empiriske erfaringer som inngår i et bedriftsøkonomisk eller pedagogisk kunnskapssystem, og som
15
utvikles og formidles både på praksissiden og i utdannings- og forskningsin stitusjonene. Ser man på den kunnskap som i dag formidles studenter for eksempel på siviløkonomstudiet, vil man se at den delvis kan tilbakeføres til praktiske erfaringer - ofte systematisert (av akademikere) og samlet i mo deller og teorier, og delvis til resultater fremkommet gjennom streng empi risk forskning. I mange tilfeller kan det være vanskelig å avgjøre hvor kunn skapen egentlig stammer fra - forskning eller praksis. Spesielt gjelder dette kunnskap som formidles på handelshøyskoler eller andre økonomiske høy skoler, fordi næringslivet tradisjonelt har hatt betydelig innflytelse på inn holdet i forskningen ved denne typen utdanningsinstitusjoner. Dermed skiller det bedriftsøkonomiske kunnskapssystem - fordi det altså springer ut delvis fra forskning og delvis fra praksis - seg fra en del andre områder hvor nær sagt all kunnskap har sitt utspring i forskning. Et annet trekk ved økonomisk-administrative fagområder er fragmente ringen i mange og sterkt ulike kunnskapsområder som alle inneholder en mengde ulike og til dels motstridende modeller og teorier. Det er i denne forbindelse nok å peke på faget forbrukeratferd, hvor man på den ene side kan betrakte forbrukeren som den rasjonelle, fullt informerte og nytteoptimerende aktør, mens man på den annen side (samtidig) kan betrakte for brukeren som styrt av følelser, sosialisering og reklame. Men fordi slike ulike teorier gjerne formidles ved ulike anledninger, av ulike forelesere og knyttes opp mot ulike deler av studiet, vil den enkelte student ofte ha vanskelig for å oppdage inkonsistensen - med mindre det altså bygges inn muligheter til å reflektere vitenskapsteoretisk over fagenes forutsetninger.
Om bokas oppbygging Innledningsvis, og som forsøk på å besvare spørsmålet om hva vitenskap er, presenteres noen sentrale hovedretninger innenfor vitenskapsteorien som har hatt vesentlig betydning for så vel samfunnsvitenskapenes som de øko nomiske vitenskapenes utvikling. Det dreier seg om den såkalte empiriskanalytiske retning (logisk positivisme), kritisk rasjonalisme, fortolkningsvitenskap (hermeneutikk) og såkalt kritisk teori. Videre vil også det såkalte paradigmebegrepet vies spesiell oppmerksomhet, fordi det står sentralt i dis kusjonen om hva som til syvende og sist bestemmer valg av problemer vi ønsker å undersøke, samt hvordan vi vil gå fram i selve undersøkelses- eller forskningsprosessen. Dernest, i den delen av boka som omhandler forskningsmetodiske pro blemstillinger, vil konkrete undersøkelsesmetoder og deres anvendelsesom-
16
råder bli gjennomgått. Som «pedagogisk metode» vil den typiske undersøkelsesprosessen med sine krav til empiriske data, pålitelighet, gyldighet, representativitet, anvendelse av kvalitative eller kvantitative metoder, teoribruk osv. bli brukt. Det er videre en ambisjon at boka skal fokusere på forholdet mellom te ori og praksis. «Det er ikke noe som er mer praktisk enn en god teori», er et utsagn som nettopp peker på at teori og praksis ikke er motsetninger, men snarere to sider av samme sak. Denne boka starter altså med å ta opp noen vitenskapsteoretiske pro blemstillinger. Målet med dette er å forsøke å trenge bak den vitenskapelige produksjon og prøve å forstå vitenskapens nokså særegne karakter. Kunnskap om vitenskapsteoretiske spørsmål vil dermed kunne gi den refleksjon som er nødvendig når valg av metode i en bestemt problemstilling og en gitt situa sjon skal foretas. Uten denne refleksjon reduseres metodefaget til teknikk, det vil si et sett av oppskrifter på hvordan «god» forskning skal utføres. Men samtidig er det selvsagt også et håp at boka — for eksempel for stu denter som skal skrive semester- eller hovedoppgaver - har en mer umiddelbar nytteverdi. Dermed blir det nødvendig også å trekke «praksis» inn i fremstillingen, det vil si gjennom eksempler vise hvordan for eksempel et spørreskjema faktisk kan utvikles. La meg i denne omgang avslutningsvis oppsummere hva som er viktig når det gjelder kunnskaper i vitenskapsteori og forskningsmetode: 1
Et studium som foregår på et høyere nivå, må nødvendigvis kunne for utsette kjennskap til forskningsmetoder og de underliggende vitenskaps teoretiske forutsetninger.
2 Det er viktig, som student, å kunne ta selvstendig stilling til resultatene av undersøkelser, det vil si at man skal kunne forholde seg kritisk til an dres undersøkelser på samme måte som man skal være kritisk til egne undersøkelsesopplegg. 3 Det er viktig, som student, å bli kvalifisert til å arbeide på et tverrfaglig grunnlag, det vil si å kunne overskride og gå på tvers av etablerte fag- og disiplin grenser.
4 Det er viktig at man får kjennskap til hvilke metoder det er å velge mel lom, så man kan satse på den mest hensiktsmessige når man står overfor et problem. Velger man undersøkelsesmetode i blinde, blir resultatene også deretter. 17
5 Det stilles større og større krav til for eksempel siviløkonomers metodemessige kvalifikasjoner. Dette henger sammen med voksende behov for å kunne undersøke og håndtere komplekse problemstillinger, så vel i of fentlig som privat virksomhet. Vitenskapsteoretisk og metodemessig kunnskap blir derfor en av forutsetningene for et sikrere og kvalitativt bedre beslutningsgrunnlag.
Stikkord til kapittel 2 vitenskap vitenskapsideal positivismekritikk
Øvingsoppgave til kapittel 2 Mange samfunnsmessige problemstillinger (f.eks. debatten om bruk av piggdekk) preges av at aktørene tar vitenskapelige eller forskningsmessige resultater til inntekt for sine synspunkter. Prøv å finne ytterligere eksempler og drøft denne bruken av forskning som en slags «sannhetsgarantist».
Litteratur å gå videre med Slagstad, R.: Positivisme, dialektikk, materialisme, Universitetsforlaget, 1976.
Del I
Vitenskapsteori
Kapittel 3
Hva er vitenskap 1 De fleste av oss har antakelig en slags oppfatning av hva vitenskap og viten skapelig virksomhet er - eller iallfall hva det ikke er. Assosiasjonene går kan skje i retning av laboratorier, hvite frakker, spennende eksperimenter og vi tenskapsmenn av typen Albert Einstein. Men utover slike intuitive assosia sjoner har vel de færreste noen begrunnede oppfatninger av hva som sær merker vitenskapelig virksomhet i forhold til annen, såkalt ikke-vitenskapelig virksomhet. Finnes det for eksempel regler og retningslinjer, etiske krav eller noen form for laugs- eller yrkeskodeks for vitenskapsfolk? Kan vi kjen ne igjen vitenskapelig arbeid når vi ser det? Finnes det noen form for felles tester eller eksamener en må bestå før en kan kalle seg vitenskapsmann (el ler -kvinne)? Er vitenskapelig arbeid det samme som forskning? Spørsmålene er mange - og entydige svar finnes ikke. For, som vi skal se, selv blant dem som til daglig sysler med forskning er det på ingen måte enighet om hvilke svar som er de riktige på disse spørsmålene. Eksempelvis skriver professor, dr. med. Stein Knardahl i et innlegg i Dagens Næringsliv (i en løpende debatt om norsk forskning) at Norges forskningsråd og forsker ne selv har forsømt å forklare hva forskning er. La oss likevel se nærmere på saken. Den norske filosofen Anfinn Stigen har for eksempel definert vitenskap på denne måten: «Et fagområde som er gjenstand for forskning som går metodisk og kritisk til verks og stiller krav om fyldestgjørende bevisføring for eller begrunnelse av de påstander som fremsettes. Resultatene skal kunne bekreftes av andre forskere ved at de kan repetere de samme undersøkelsene med de samme metodene.»
En annen toneangivende norsk forsker, Jon Elster, sier det på denne måten: «Jeg skal ikke forsøke å definere vitenskap, ... men nøye meg med å foreslå en nødvendig betingelse; En vitenskapelig undersøkelse tilstreber å gi san ne, intersubjektivt prøvbare utsagn om en gjenstand» (Elster, 1989:145).
21
Til tross for Stigens og Elsters forsøk på å komme fram til entydige og all menne definisjoner, er det tydeligvis likevel nok å diskutere til at det har ut viklet seg en helt egen vitenskapsgren der man nettopp søker svar på spørs mål av typen «Hva er vitenskap?». Vitenskapsteoretikere eller vitenskapsfilosofer kalles de som, for å bruke Zaltmans ord, har viet seg til «the science of science or the investigation of investigation» (Zaltman 1973). Ut av denne virksomheten har det kommet fa egentlige svar, men mange innspill som samlet gir oss innsikt i regler og retningslinjer som iallfall må følges dersom det en arbeider med skal fa status som «vitenskapelig» (jf. Sti gens definisjon ovenfor). Som vi imidlertid snart skal se, varierer betydningen av de enkelte regler både som resultat av historiske forhold, av hva slags problemer en velger å gi seg i kast med, og mer grunnleggende holdninger til rådende vitenskaps idealer. Vi kan derfor si at det over tid har utviklet seg ulike «skoler» innen for vitenskapsteorien, og for å fa svar på spørsmålet som utgjør kapittelover skriften, vil det følgelig være naturlig å se nærmere på hva slags svar repre sentanter for ulike skoler eller retninger gir. La oss imidlertid, før vi går nærmere inn på noen slike retninger innen vi tenskapsteorien, dvele litt ved behovet for kunnskap om og kjennskap til vi tenskapelige forklaringsmodeller og vitenskapelig arbeidsmåte innenfor økonomisk-administrativ forskning og undervisning. (Fordi forfatteren har sitt virke innenfor disse fagområdene, er det naturligvis lettest å ty til ek sempler herfra. Det bør imidlertid ikke by på store vanskeligheter å erstatte disse med eksempler fra andre fag, for eksempel pedagogikk.) For noen år siden hevdet den danske økonomen Sten Hildebrand: «Den stigende interessen for vitenskapsteoretiske spørsmål merkes tydelig innenfor bedriftsøkonomien, hvor det gjennom de seneste år har vært en forøket diskusjon og interesse. Det er en positiv utvikling, fordi meget ty der på at det er behov for kritisk analyse og omvurderinger innenfor det bedriftsøkonomiske området» (Hildebrand, 1983:23).
Hva kunne Hildebrand mene med dette? Formodentlig at mye av det som opp til da ble formidlet av kunnskap om organisasjoner og økonomiske spørsmål, ikke var godt nok fundert og følgelig sto i fare for å være lite an net enn løsaktige påstander og subjektive eller ensidige vurderinger. Kravet til vitenskapelighet - og nå foregriper vi diskusjonen om hva vitenskap egentlig er - med dens prinsipielle forpliktelse på sannhet blir i seg selv grunn god nok til at også spesialister innen for eksempel økonomi eller markedsføring søker en vitenskapelig begrunnelse for sine påstander og an befalinger. 22
Det finnes nemlig nok av påstander som langt på vei har fatt status som «sannheter» uten at det egentlig har vært gjort særlig mye for å fa dem vi tenskapelig «bevist». Innenfor markedsføringsfaget finner vi for eksempel følgende påstand som særlig reklamebyråene har vært flittige brukere av, nemlig den at «det lønner seg å annonsere i nedgangstider». Begrunnelsen er like enkel som den er besnærende. Når ingen andre enn du våger å bruke midler på reklame, vil du - den dagen oppgangen kommer og kjøpekraften øker - ha opparbeidet deg et forsprang på konkurrentene som vil gi seg utslag i salget. Umiddelbart høres dette ganske tillitvekkende ut, men dersom vi går påstanden nærmere etter i sømmene, blir det hele raskt vesentlig mindre overbevisende. Innledningsvis kan vi fastslå at dette er en svært generell påstand eller te ori. Vi vil i et senere kapittel drøfte egenskaper ved teorier nærmere, men vi kan vel allerede nå røpe at svært generelle påstander (som denne) nok er at skillig mindre egnet som grunnlag for beslutninger enn slike hvor innholdet er konkretisert. Kritiske spørsmål til nettopp denne påstanden fra en annon sør kunne for eksempel være: Gjelder påstanden alle bransjer og alle pro dukter? Vil for eksempel jeg som ferdighusprodusent skaffe meg et for sprang den dagen etterspørselen igjen tar seg opp? Og hva menes egentlig med nedgangstid? Hvor lenge skal en spesiell tilstand vare før vi kan si at vi er inne i en nedgangstid? Er det slik at alle nedgangstider har samme kjen netegn? Er høy arbeidsløshet synonymt med nedgangstid, eller kan vi i en tid med høy arbeidsløshet samtidig ha sterk økonomisk vekst, og er vi i så fall inne i en nedgangs- eller oppgangstid? Osv., osv. Og til slutt kunne vi altså stille spørsmålet hvorvidt denne påstanden hadde vitenskapelig belegg. Hvis vi tenker etter, klarer vi sikkert å komme på flere slike «sannheter» som ved nærmere vurdering kanskje ikke er så sanne likevel. Er det for ek sempel sikkert og sant at økt beskatning (økt skattetrykk) øker statens inn tekter i den forstand at jo høyere marginalskatt, jo høyere skatteinntekter? Ia, vil mange mene. Nei, svarte den amerikanske økonomen Arthur Laffer, som gjennom sin teori, illustrert ved den såkalte Laffer-kurven, mente å kunne påvise at over et visst nivå ville økte skattesatser tvert imot medføre reduserte skatteinntekter (figur 2). Tiltroen til vitenskapens posisjon som en slags garantist for sannhet («forskning viser») er av forholdsvis ny dato. Vi skal ikke veldig langt tilba ke i historien for å konstatere at vitenskapelige forklaringer som sto i strid med for eksempel etablerte religiøse dogmer lett medførte døden på bålet for den som hevdet slike. Jf. diskusjonen rundt det heliosentriske (Solen er sentrum i universet) versus det geosentriske (Jorden er sentrum) verdens bilde. Enda nærmere vår egen tid var det den formale logikk som var sann-
23
Skatteinntekter
Figur 2 Laffer-kurven
hetskriteriet, og som for eksempel tillot Erasmus Montanus å «bevise» at Mor Lille var en stein. Det var først og fremst den industrielle revolusjon med den vekst, virk somhet og økende rikdom som denne førte med seg som for alvor ga gode muligheter også for vitenskapelige aktiviteter. «Vitenskap» ble et honnørbegrep, og det er typisk at det første systematiske forsøket på å utvikle en teo ri om ledelse, endte opp med å kalle den for «Vitenskapelig ledelse» (Scien tific Management). Etter hvert som vitenskapen utviklet seg, ble også den i stadig større grad gjort til gjenstand for forskning. Det utviklet seg et eget forskningområde, vitenskapsteori, der man altså søker å få klarhet i hva som kjennetegner vi tenskapelig tenking og vitenskapelige metoder, samt finne fram til mest mu lig universelle kriterier for vitenskapelighet. Hva er det så som særpreger vitenskapelig virksomhet? Hva er så overbe visende med nettopp denne form for frembringelse av kunnskap? For det synes jo rimelig å anta at det «finnes noe som er felles for all vitenskapelig virksomhet, og som gjør det mulig å si at vitenskap skiller seg fra kunst på den ene siden og teknologi på den andre» (Elster 1979:10). Utgangspunktet var at så godt som alle var blendet av de resultater fysik ken hadde oppnådd, og den ble naturlig nok idealet for all vitenskap. Andre fag ble dermed betraktet som vitenskapelige i den grad de kom tålelig godt fra en sammenlikning med fysikken. Fordi fysikken, ja, alle de såkalte natur vitenskapene ble betraktet som «empiriske» vitenskaper, det vil si «erfaringsvitenskaper», ble konsekvensen for vurderingen av et fags vitenskape lighet at bare den kunnskap som er basert på sansedata (erfaringer) kunne
24
aksepteres som vitenskapelig. Dermed var det teoretiske utgangspunktet gitt for den vitenskapstradisjonen som er blitt kjent som «positivismen» (av det positivt erfarte). Som et - dessverre litt omstendelig - svar på spørsmålet om hva viten skap er, må vi derfor i det følgende se litt nærmere på hvilke krav noen sen trale vitenskapsteoretiske retninger eller skoler, nemlig (logisk) positivisme, kritisk rasjonalisme, hermeneutikk og såkalt kritisk teori stiller til vitenska pelig virksomhet. Til en viss grad bygger retningene på hverandre, og til en viss grad repre senterer de helt forskjellige innfallsvinkler - til dels i sterk innbyrdes strid. Ingen av dem kan hevde å forvalte hele sannheten. Noe enkelt «fasitsvar» finnes da heller ikke. Det burde likevel være mulig, etter å ha blitt konfron tert med disse ulike «skoleretningenes» forsøksvise svar på spørsmålet vårt, å danne seg en personlig oppfatning av hva en selv velger å legge vekt på i sin vurdering av nødvendige kjennetegn ved vitenskapelig virksomhet.
Stikkord til kapittel 3 vitenskapelig virksomhet vitenskapelige sannheter vitenskapelige skoler/retninger
Øvingsoppgave til kapittel 3 Med bakgrunn i kapitlets diskusjon om hva vitenskap er, kan du for eksem pel ta for deg en av de andre lærebøkene du arbeider med og forsøke å dis kutere det vitenskapelige eller forskningsmessige belegg for noen sentrale påstander eller teorier du finner der.
Litteratur å gå videre med Elster, J.: Vitenskap og politikk, Universitetsforlaget, 1989. Slagstad, R.: Positivisme, dialektikk, materialisme, Universitetsforlaget, 1976.
25
Kapittel 4
Logisk positivisme og kritisk rasjonalisme Utgangspunktet for de såkalte empiristene (Hume, 1711-76) og senere positivistene var at bare den kunnskap som kan utledes av sansedata (erfa ringer) kan aksepteres som vitenskapelige. I tillegg mente Hume at «sikker viten» også kunne være resultatet av anvendelse av matematikkens formelle regler, men vi velger å holde denne delen av Humes resonnement utenfor i denne fremstillingen. I tråd med den sterke vektleggingen av empirisk basert kunnskap, hevdet Hume videre at induksjon er den eneste måte å komme fram til «absolutt kunnskap» på. Det finnes to ulike måter å trekke slutninger på: induksjon og deduksjon. Induksjon bygger altså på empiri, mens deduksjon bygger på logikk. En kombinasjon av disse kalles gjerne den «hypotetisk-deduktive metoden», og denne er på mange måter moderne positivisters foretrukne metode. Se figur 3 og 4. Persepsjon
I I i I I I
Uordnede data
Klassifisering, definering og måling
Ordnede data
Induktiv generalisering Lover og teorikonstruksjon Forklaring
Figur 3 Bucons modell for induktiv forskning
26
Teori |
Deduksjon
Hypotese
I I 1
Datainnsamling Dataanalyse
— Resultat
Piguv 4 Hypotetisk-deduktiv metode
Francis Bacon (1561-1626) var den første som eksplisitt beskrev den in duktive forskningsprosessen: «The method of basing general statements of accumulated observations of specific instances is known as induction, and is seen as the hallmark of science», skrev Bacon. Induksjon innebærer altså at man trekker allmenne, generelle konklusjoner ut fra empiriske fakta gjen nom bruk av resonnementer som består av premisser, det vil si de påstander som hevdes, samt konklusjon. For eksempel slik:
Premiss: Alle mennesker vi kan lese om i verdenshistorien er døde. Konklusjon: Altså er alle mennesker, inklusive meg selv, dødelige. Det er imidlertid viktig å slå fast at vi aldri kan være 100 % sikre på en in duktiv konklusjon, fordi den bygger på empirisk materiale som sjelden ut gjør en komplett opptelling av alle mulige tilfeller. Selv induktive konklu sjoner som bygger på enormt omfattende materiale kan vise seg å være gale, ganske enkelt fordi det prinsipielt alltid vil finnes uendelig mange tilfeller vi ikke har anledning til å observere. Bacon fremhevet videre at sanseerfaringer og induktiv forskningsmetode var nødvendige ingredienser i alt vitenskapelig arbeid. Det er også verd å merke seg at en av grunnsetningene innenfor den em pirisk baserte vitenskapsteoretiske tradisjonen har vært noe vi kan kalle en metodisk monisme (enhetslære), det vil si at all vitenskapelig virksomhet skal baseres på ett og samme prinsipp - som nettopp er den induktive metoden. En annen viktig forutsetning er at det er de eksakte naturvitenskapene (især fysikken) som skal tjene som ideal og forbilde for alle de andre vitenskapsgrenene, også de humanistiske og samfunnsvitenskapelige. Av dette følger at årsaksforklaringer, som på mange måter er fysikkens grunnsten, skal stå sentralt innenfor alt vitenskapelig arbeid. 27
Et sentralt kjennetegn ved årsaksforklaringer (kausale forklaringer) er at de impliserer en tidsfaktor, ettersom virkningen nødvendigvis alltid må inn treffe etter årsaken - og dermed blir vitenskapens viktigste oppgave nettopp å finne fram til de årsakene som utløser ulike hendelser. Innenfor for eksempel markedsføringsfaget har denne tilnærmingen ført til at kunnskap om marked og forbruk i stor grad er basert på empiriske stu dier der målet nettopp har vært å utvikle modeller som viser årsak/virknings-sammenhenger mellom for eksempel pris-distribusjon-reklame på den ene siden, og omsetning-overskudd-markedsandeler på den andre si den, og der normative spørsmål og etiske problemstillinger som ligger utenfor den observerbare delen av virkeligheten ofte blir holdt utenfor. Et problem forbundet med kausale forklaringer, nemlig at kausalitet sjel den kan observeres direkte i den empiriske virkelighet, forsøkte Hume å løse gjennom å stille opp tre kriterier som måtte tilfredsstilles dersom en ob servert sammenheng mellom fenomener skulle kunne godtas som kausale, nemlig: «suksesjon», «kontakt» og «nødvendighet». Eller uttrykt på en annen måte: 1 Virkningen må følge etter årsaken i tid. 2 Det skal være tidsmessig nær sammenheng mellom årsak og virkning. 3 Andre mulige årsaker til virkningen kan utelukkes.
Særlig det siste kravet er problematisk for forskning som foregår utenfor la boratoriets kontrollerte betingelser. For selv der en undersøkelse viser at for eksempel en salgsøkning kommer etter at tilbudsannonsene ble rykket inn i mediene, og at økningen faktisk kom nokså umiddelbart etter annonsekam panjen, kan det likevel være problematisk å påstå at salgsøkningen skyldes annonsekampanjen, og bure den\ Disse empiriske vitenskapsidealene, som opprinnelig var utviklet med na turvitenskapene i tankene, fikk i løpet av 1880-årene også økt gjennom slagskraft innenfor de humanistiske fagene. Det var først og fremst fransk mannen Auguste Comte (1798-1897), og engelskmannen John Stuart Mill (1800-1873) som sto sentralt i utformingen av det teoretiske vitenskapsgrunnlaget for de humanistiske fagene - det som senere er blitt kjent som «positivismen». Positivistene så det som sin hovedoppgave å renske bort alle tendenser til metafysiske spekulasjoner innenfor vitenskapelig arbeid. Vi kan si at det var positivistene som igangsatte en «renselsesprosess» overfor ulike vitenskaper, og de aksepterte heller ikke at det for eksempel skulle trekkes noe skille mel lom naturvitenskapelige og humanistiske eller samfunnsvitenskapelige me toder for vitenskapelig arbeid.
28
Positivismens løsning på sannhetsproblemet (sann kunnskap) ble i kort het dette: Hvis man fjerner alt man mener å vite, men som man egentlig ikke vet, da sitter man igjen med en kjerne av sikker kunnskap, såkalte «har de fakta». På denne sikre grunnen kan man gradvis bygge opp vitenskapen. All «kunnskap» som kan tilegnes gjennom hellige skrifter, religiøse åpenba ringer, intuisjon eller teoretisk spekulasjon, anser positivistene for å være verdiløs. For nok en gang å gå tilbake til vårt opprinnelige spørsmål, nemlig hva vitenskap egentlig er, så er positivistenes svar omtrent dette: Fordi det er viktig å holde vitenskapen ren for metafysiske spekulasjoner og alminnelig nonsens, blir det maktpåliggende å stille opp kriterier for hva det er meningsfullt og fornuftig for vitenskapen å beskjeftige seg med. For dette formål stiller så positivistene opp et såkalt «verifikasjonskriterium» ifølge hvilket kun de utsagn er meningsfulle for hvilke man presist kan opp stille betingelsene for at de kan bevises! (Dette høres umiddelbart ganske tilforlatelig ut, men det er verd å merke seg at dette kun oppfattes som et prinsipielt krav; det forlanges altså ikke at man i praksis må være i stand til å gjennomføre de operasjoner som kreves for å bekrefte utsagnet, hvilket nokså klart viser at positivistene når det kom til stykket nok var mer interes sert i kunnskapens logiske form enn i metoder for å utvikle ny sann kunn skap.) Ifølge positivistene har vi mennesker bare to kilder til kunnskap: det vi kan iaktta med våre sanser, og det vi kan komme fram til med hjelp av vår logikk. Utgangspunktet blir altså at bare fakta vi kan fastslå med all rimelig sann synlighet kan kalles faktisk kunnskap. Disse fakta kan vi senere analysere lo gisk for å kunne dra slutninger av dem. Og ettersom vi også regner mate matikken som tilhørende logikken, bør vi i stor grad kvantifisere våre fakta (data), behandle dem statistisk og derigjennom trekke generelle slutninger. Det er i første rekke denne anvisningen som gir såkalte kvantitative under søkelser stempelet «positivistiske» (ofte i nedsettende betydning) blant til hengere av andre vitenskapsteoretiske retninger. Det må imidlertid ikke for lede oss til å mene at alle undersøkelser der det tas sikte på å uttrykke et saksforhold ved hjelp av tall er positivistiske. Det er av og til nødvendig selv for erklærte anti-positivister - å underlegge seg noen alminnelige forsk ningsmessige krav (jf. Elsters og særlig Stigens definisjoner over) som lettes gjennom bruk av statistiske prosedyrer. Avslutningsvis er det nødvendig å presisere at skillet mellom induktiv og deduktiv metode i dag stort sett bare er av teoretisk interesse. For den in duktive metodes vedkommende er det neppe mange vitenskapsteoretikere - og knapt noen forskere - som vil mene at det er mulig å innsamle eller 29
ordne data uten en teori som styrer undersøkelsen. For eksempel er bare det å avlese et termometer en handling som forutsetter ganske mye teori for å kunne gi en brukbar tolkning av den observasjon vi gjør. Den deduktive metode er om mulig enda mindre godtakbar i sin rendyr kede form. Svært få, om noen, tror i dag at det er mulig med utgangspunkt i den rene tanke å kunne utsi noe om virkeligheten. Som nevnt kan den såkalte hypotetisk-deduktive metode i en viss for stand sies å forene elementer fra begge metoder. Men det er viktig å under streke at dette bare er tilfelle i en viss forstand.
Kritisk rasjonalisme Positivistenes verifikasjonskriterium ble etter hvert angrepet av mange, men det er kanskje først og fremst den østerrisk-engelske filosofen Karl Popper som har levert den mest grunnleggende kritikken av dette positivistenes vitenskapskrav. Noe forenklet kan vi si at mens positivistene krevde at et utsagn måtte kunne bekreftes (verifiseres) dersom det skulle kunne kalles for vitenskape lig, hevdet Popper at et utsagn ikke kan kalles vitenskapelig hvis det ikke kan avkreftes (falsifiseres). La oss se nærmere på hva dette innebærer. Poppers grensedragning mellom vitenskapelige og ikke-vitenskapelige utsagn (hans såkalte demarkasjonskriterium) går altså på at bare de utsagn som er falsifiserbare kan kalles vitenskapelige. Så kunne man naturligvis spørre om det i det hele tatt finnes utsagn hvor det ikke engang er en teoretisk mulighet for å få utsagnet avkreftet. De fin nes. Såkalte «tautologiske utsagn» er ett eksempel, det vil si utsagn som på grunn av sin logiske struktur alltid vil være sanne. Paradeeksemplet fra logikkbøkene er utsagnet «alle ungkarer er ugifte», men utsagn av typen «alle fisker har gjeller», «alle elever går på skole» eller «det finnes ikke folk i en folketom by» er også eksempler på utsagn som nødvendigvis er sanne, og som prinsipielt ikke kan falsifiseres. Ikke alle tautologier er like åpenbare som disse. Mer interessante er ut sagn som er så vage at det i og for seg finnes mange tenkbare muligheter for bekreftelse, men hvor kravet om falsifiserbarhet ofte ikke lar seg innfri. Spe sielt vil dette noen ganger være tilfelle når vi beveger oss fra naturvitenska pene og over i for eksempel samfunnsvitenskapene. Noe av problemet med å falsifisere utsagn som har med samfunnsmessige eller atferdsmessige for hold å gjøre, bunner i at det saksforhold vi undersøker ikke uten videre fo-
30
religger på samme måte for alle - slik for eksempel en blomst i botanisk for stand gjør det. Med grunnlag i et sett av bestemte botaniske kjennetegn er det åpenbart lettere å avkrefte at en undersøkt blomst tilhører valmuefamilien, enn om vi på bakgrunn av en undersøkelse blant ansatte i en bedrift mener å kunne avkrefte et utsagn om for eksempel mistrivsel blant de ansat te. Det er for eksempel slett ikke sikkert at alle vil være enige i vår måte å identifisere eller definere begrepet «trivsel» på, eller hvordan vi har valgt å «måle» grad av trivsel. (Vi lar det bli med dette, men vi kommer senere til bake med en grundigere drøfting omkring det vi kan kalle «måleproble mer» i samfunnsvitenskapelig forskning.) La oss imidlertid, før vi helt forlater kravet til falsifiserbarhet, kort se på i hvilken grad dette kan sies å være et realistisk krav. I den forbindelse har det vært hevdet - av blant andre den innflytelsesrike vitenskapsteoretikeren Thomas Kuhn - at falsifiseringsforsøk i heller liten grad preger vitenskapelig aktivitet. Det er jo i bunn og grunn noe menneskelig i det å unngå å søke etter argumenter som kan kullkaste det kjente og trygge eller så tvil om egne funn og egen dømmekraft. Fra sosialpsykologien kjenner vi Festingers teori om kognitiv dissonans som tvert om tilsier at vitenskapsmannen, gjen nom de valg han gjør og de ressurser og prestisje han investerer i egen forskning, heller vil prøve å rettferdiggjøre disse valgene ex post enn å stille seg kritisk til dem. Frykten for at man kanskje tok feil bidrar nok til en viss motvilje mot å søke etter informasjon som kan rokke ved de konklusjoner man har trukket. Enkelte kaller dette for «advokatmetoden», fordi den minner om det en skrankeadvokat gjør når han skal forsvare sin klient. En advokat forsøker all tid å fremstille saken i best mulig lys for sin klient, i motsetning til forske ren, som (ideelt sett) skal spille djevelens advokat og gjøre det så vanskelig som mulig for sin teori. Selv om det altså i praksis kan vise seg vanskelig å etterleve kravet om fal sifiserbarhet, stiller Poppers kriterium likevel et sett av krav som muliggjør objektiv vurdering av et teoribidrag (sett av påstander). Blant de spørsmål vi kan stille er for eksempel: -
Er teoriens utsagn tautologiske? Er de falsifiserbare eller bare bekreftbare? Er de «selvfølgelige»? Er de så generelle og abstrakte at etterprøving ikke er mulig? Er de fremsatt som følge av kritisk gjennomgang av eksisterende viten på området der argumenter pro et contra tillegges rimelig vekt?
Sånn sett vil Poppers falsifiseringskrav, selv om det altså ikke er helt enkelt å 31
etterleve i praktisk forskningsvirksomhet, likevel - som et slags normativt ideal - ha positive føringer for de kvalitetskrav vi bør stille til vitenskapelige påstander. Det vitenskapssynet som er blitt utviklet med grunnlag i Poppers kritikk av den logiske positivismen har fått betegnelsen «kritisk rasjonalisme». Popper hevdet, i likhet med empiristene og positivistene, at sanseerfaringer representerer vitenskapens fundamentale byggesteiner, men han brøt med empiristene idet han videre hevdet at sanseerfåring ikke kunne betrak tes som «ufeilbarlig», fordi han forutsatte at sikre, objektive registreringer av virkeligheten ikke var mulig. Alle observasjoner vil i større eller mindre grad preges av tidligere kunnskap. Observasjoner vil alltid være selektive de krever et valgt objekt, en gitt oppgave, en interesse, et synspunkt, et pro blem. Av dette følger videre - ifølge Popper - at vi aldri kan slutte oss til lovmessigheter ut fra rene iakttakelser, fordi det altså ikke er mulig å foreta objektive observasjoner. Dermed er falsifikasjonsprinsippet den eneste form for empirisk etterprøving som er logisk holdbar. Som erstatning for den (uholdbare) induktive metode lanserte derfor Popper en alternativ metode. I stedet for å ta utgangspunkt i observasjoner slik empiristene gjorde, hevdet Popper at den vitenskapelige forskningsprosessen starter med problemstillinger som det søkes løsninger på. Gjennom prøving og feiling utvikler forskeren teorier og hypoteser som enten kan være begrunnet i etablert teori, eller som er basert på ren spekulasjon. Det stilles imidlertid, slik vi har vært inne på, krav om at de teoriene som det skal arbeides videre med er (prinsipielt) falsifiserbare, hvilket - stadig ifølge Pop per - krever av denne type teorier at de er «dristige», det vil si at de har mest mulig innhold og utsier noe om virkeligheten. Sannsynligheten for at et ut sagn ikke kan falsifiseres blir altså større jo mindre empirisk innhold utsag net har. Det er større mulighet for å falsifisere et utsagn som utsier noe pre sist om virkeligheten, for eksempel at: «Dersom reklameinnsatsen øker med 10 %, vil salget øke med 5 %», enn utsagn av typen: «Det lønner seg å re klamere» (eventuelt i nedgangstider). For de kritiske rasjonalistene går altså vitenskapens utvikling fra teorier via falsifikasjon til nye teorier, ny falsifikasjon osv. Hver gang en teori for kastes er vi kommet litt nærmere sannheten, fordi ytterligere en feiltakelse er eliminert. Det sier seg selv at jo dristigere og innholdsrikere slike teorier er, jo lageligere ligger de til for hugg, det vil si jo lettere er det å finne belegg for å av krefte dem. Men samtidig er det nettopp de dristige teorier - selv om de av kreftes hundre ganger - som bringer vitenskapen fremover. En påstand eller en teori er - for å oppsummere Popper - altså bare vi tenskapelig dersom den kan bli falsifisert. 32
Når du fremsetter en teori og utgir den som vitenskapelig, så må du sam tidig angi hva som skal til for at du vil gi den opp. Hvis du tviholder på te orien uansett hvor mange ganger det legges fram resultater som ikke stem mer med teorien, er du i beste fall en stabukk, kanskje en politiker, men du er i hvert fall ikke en seriøs forsker.
Stikkord til kapittel 4 induksjon deduksjon hypotetisk-deduktiv metode verifikasjonskriterium falsifikasjon
Øvingsoppgaver til kapittel 4 Diskuter hvorfor det er avgjørende forskjell på det å kunne bekrefte (verifi sere) en påstand eller teori og det å kunne avkrefte (falsifisere) den.
Finn fram til noen påstander eller teorier fra ulike lærebøker eller fagområ der og drøft hvorvidt disse er falsifiserbare.
Litteratur å gå videre med Wormnæs, O.: Vitenskapsfilosofi, Gyldendal, 1987.
Kapittel 5
Om hermeneutikk og paradigmer Slik vi nå har fatt kjennskap til positivismen og den kritiske rasjonalisme, kan vi kanskje lure på hvorfor ikke alle innser det fornuftige i å rette seg etter de prinsipper som her hevdes som grunnlag for kunnskap. Har vi overhodet andre kilder til kunnskap enn våre fem sanser koblet med vår logiske intelli gens? Vi har faktisk det, og en vesentlig del av kritikken som rettes mot «empi ristene» går nettopp ut på at disse forsømmer en kunnskapskilde som kom mer i tillegg til det våre sanser kan observere og den logiske analysen. La oss se litt nærmere på hva dette kan innebære. Utgangspunktet for det som kalles den hermeneutiske (fortolkende) vi tenskapstradisjonen er erkjennelsen om at det går et grunnleggende skille mellom «natur og kultur». Mens vitenskapsteoretikere innenfor den empiristiske og positivistiske vitenskapstradisjonen i stor grad har vært opptatt av naturvitenskapelige problemstillinger, er den hermeneutiske vitenskapstra disjonen utviklet på grunnlag av problemstillinger hentet fra de humanistis ke vitenskapene. Hermeneutikken er ikke noe fasttømret «program» for hvordan viten skapelig virksomhet skal drives. Mens både positivisme og kritisk rasjonalis me har sterke normative preg, er hermeneutikken snarere en en slags felles betegnelse på en rekke fremgangsmåter eller oppfatninger som har å gjøre med det å forstå eller fortolke en hendelse. Hermeneutikken forsøker å gjøre rede for hva som skjer når en person arbeider med en tekst eller en ytring. I den forbindelse anvendes ofte be grepet «den hermeneutiske sirkel». Dette henspiller på det faktum at helhet og del henger sammen på en slik måte at den enkelte del bare kan forstås i lys av helheten, samtidig som helheten bare kan forstås ut fra de enkelte de lene. Hertil kommer at en annen sirkelprosess også gjør seg gjeldende i fortolkningsarbeidet, nemlig den forforståelse av saken en alltid bringer med seg, og de nye forståelser man erverver seg under prosessen. Ut fra sin beskrivelse av forståelsesprosessen forsøker altså hermeneutik ken å få klarhet i hva det egentlig innebærer å forstå. Hva er det som skjer 34
når man plutselig eller på en ny måte forstår en tekst, et annet menneske el ler en komplisert problemstilling? Det som skjer kan - ifølge hermeneutik ken - beskrives som et møte mellom en forståelsessøkende person og et saksforhold. Ved dette møtet vil det som skal forstås noen ganger fremstå for oss som uforståelig. Det skyldes at vi møter dette saksforholdet med en rekke forutbestemte holdninger og innstillinger. Et banalt eksempel kan for eksempel være at vi ikke ler av en vits vi leser i et ukeblad fordi innholdet i vitsen ikke er overensstemmende med våre forutbestemte oppfatninger av hva som er morsomt. Men så kan det skje som i hermeneutikken anses som ønskelig, nemlig at leserens forforståelse (forståelseshorisont) og den mening som ligger i tek sten (tekstens horisont) bringes sammen i en såkalt «horisontsammensmelting». Dermed er leserens forståelse av noe som i utgangspunktet virket fremmedartet blitt utvidet, og hans eller hennes spesielle forforståelse (som for eksempel kan gi grunnlag for fordommer) er, om ikke helt forsvunnet, så iallfall blitt modifisert. La oss prøve å illustrere denne prosessen med et eksempel hentet fra en annen arena: La oss si at du er i ferd med å gjennomføre et forskningsprosjekt der du ønsker å se på faktorer som kan tenkes å fremkalle konflikter i organisasjo ner. Utgangspunktet vil være at du som forsker har en bestemt forforståelse av det emne som skal studeres. I vårt tilfelle består denne forforståelsen av det totalbilde av organisasjonsprosesser, byråkratiproblemer, makt- og in teressemotsetninger osv. som du, både fordi du er organisasjonsforsker og er teoretisk skolert i faget, og fordi du simpelthen er et menneske som an takelig selv er ansatt i en organisasjon, sitter inne med. Ut fra denne forforståelsen dannes en rekke forventninger om hva som kjennetegner nettopp den organisasjonen du er i ferd med å undersøke. Konkret betyr dette at du for eksempel har ganske klare oppfatninger om hva som vil prege de ansattes virkelighetsbilde. På denne bakgrunn innleder du så en dialog med de ansatte, der målet er å identifisere forhold eller innstillinger blant de ansatte som kan indikere konflikt. Ut fra din forforståelse forventer du kanskje at konfliktaspektet vil være relativt fremtredende i de ansattes bevisshet. Den innledende dialogen viser imidlertid at det er noe galt med denne forforståelsen, fordi de ansatte gjennomgående avviser at det forekommer konflikter i deres organisasjon. En mulighet ville naturligvis være at du tar dette til etterretning og rett og slett forkaster din egen forforståelse. Når du likevel ikke gjør dette, er det fordi du tross alt registrerte enkelte uttalelser fra noen av de ansatte som ga deg en fornemmelse av at det faktisk forekom handlingsforløp av den type som du ville assosiere med begrepet konflikt. 35
Et mulig problem kunne være at du og de ansatte hadde forskjellige opp fatninger av betydningen av ordet konflikt. Dermed blir det åpenbart viktig å gå inn i en dialog omkring selve be tydningen av ordet konflikt. Ved å gjøre det oppdager du kanskje at mens noen av de ansatte først er villig til å vedgå at det finnes konflikter når disse har slått ut i åpne motsetninger og kamp, kan andre snakke om konflikter selv på et nivå der de ennå er latente og slett ikke oppdages av alle. Det dette eksemplet skal vise, er at for å fa de riktige fortolkninger fram, er det nødvendig å ha en felles forståelse av det språk som anvendes, og det krever igjen at forskeren setter seg inn i den normtradisjon og erfaringsver den som finnes hos dem han vil studere. De språk- og fortolkningsproblemer som forekommer når vi undersøker et sosialt fenomen, vil selvfølgelig være begrenset sammenliknet med for ek sempel hva historikeren eller antropologen må forholde seg til i sine studier av gamle eller fremmede kulturer. Men selv om vi snakker samme språk og bruker de samme ordene for å karakterisere et fenomen eller en situasjon, kan innholdet, slik eksemplet ovenfor viste, ofte oppfattes forskjellig, og det å avdekke slike forskjeller blir følgelig nokså avgjørende for kvaliteten på forskningen. Et hovedpoeng for hermeneutikerne er altså at forskerens subjektive re feranseramme (hans forforståelse) medfører at han aldri kan opptre forutsetningsløst, hvilket igjen fører til at det i hermeneutikernes verden ikke fin nes objektive forskningsmetoder. Fra et hermeneutisk synspunkt er det altså meningsløst å tale om o «absolutt kunnskap» - spesielt omkring samfunnsmessige fenomener. A studere menneskelige handlinger er kompliserte saker, og ofte kan ulike innfalls vinkler, ulike perspektiver og ulike tolkningsmodeller snarere komplettere enn utelukke hverandre. Hermeneutikken, med sin betoning av innlevelse og forståelse, åpner altså for en mulighet til kunnskap som synes utilgjenge lig for positivistens distanserte og objektivistiske vitenskapsideal. Det er likevel klart at mange innbarkede positivister har lite til overs for hermeneutikkens måte å drive vitenskapelige undersøkelser på. Rett nok finnes det, som vi har sett, grunn til å være skeptisk også til positivistenes vi sjon om å kunne komme fram til gyldige og absolutte sannheter. Det må li kevel innrømmes at hermeneutiske tolkninger kan fremstå som enda mer usikre. Hva gjør for eksempel én tolkning av et dikt eller en hendelse mer plausibel enn en annen? Finnes det i det hele tatt muligheter for å vurdere om en tolkning er riktigere enn en annen? I noen sammenhenger er dette faktisk ikke påtrengende. Tolkningen av for eksempel et kunstnerisk pro dukt vil neppe ha som mål å komme fram til en form for sannhet, ganske enkelt fordi det ikke finnes noen sannhet eller «fasit» for kunst. Flertydig36
het, som altså gir rom for ulike tolkninger, er nettopp kjennetegnet på god kunst. I andre sammenhenger, derimot, er det klart at ikke alle tolkninger av en hendelse kan sies å være like gode eller riktige. I konflikteksemplet ovenfor vil den tolkning av situasjonen som best bidrar til å løse konfliktene i orga nisasjonen oppfattes som bedre enn en som ikke bidrar eller kanskje tvert om fører til at konfliktene øker. Men hvor stiller dette oss i en vitenskapsteoretisk sammenheng? Vi har jo allerede fastslått at ett sentralt krav til vitenskapelighet er at de resultater vi kommer fram til skal kunne etterprøves av andre. Men dette er neppe mulig dersom resultatene av en undersøkelse er fremkommet gjennom at forske ren lever seg inn i en situasjon på en subjektiv og nærmest ukommuniserbar måte. Enkelte har derfor tatt til orde for at dersom den hermeneutiske me tode skal gjøre krav på å være en vitenskapelig metode, kan den ikke stå i motsetning til den hypotetisk-deduktive metode. A forstå en handling betyr å sette opp en hypotese om den intensjon som har ligget til grunn for hand lingen, og deretter, på bakgrunn av for eksempel observasjon av hva den handlende faktisk gjør i en bestemt situasjon, trekke de nødvendige slut ninger. Men hvor blir det så av særpreget ved hermeneutikken - tolkningen, inn levelsen? Jo, de er stadig til stede. For eksempel vil hypotesedannelsen i her meneutisk forskning trekke store veksler på vår egen erfaring med situasjo ner av den type handlingen opptrer i. Når det gjelder tolkningen av det ob serverte, er det også i hermeneutikken vesentlig at tolkningen finner støtte i teori. Fullstendig subjektive oppfatninger av et saksforhold kan vanskelig tillegges vekt i vitenskapelig sammenheng. På den annen side kan det klart diskuteres - og det gjøres - om tolkning er en kunst, eller om det er viten skap. Ikke minst innenfor kunst har tolkningsproblematikk naturlig nok hatt en bred plass. Uansett så har hermeneutikerne ett viktig og sentralt poeng som vi skal forfølge litt nærmere: nemlig at såkalte «rene fakta» eller «harddata» - altså kunnskap som er absolutt upåvirket av kjennetegn ved forskeren selv - når det kommer til stykket kanskje ikke er så rene eller harde likevel. Tanken om det vi kan kalle forskerens subjektive referanserammer som en uunngåelig forutsetning for våre forskningsmessige valg, finner vi også igjen - om enn i en litt annen form - i Thomas Kuhns såkalte «paradigmeteori».
37
Om paradigmer og paradigmeskifte I boka «The Structure of Scientific Revolutions», som utkom i 1962, lanserte vitenskapsteoretikeren Thomas Kuhn en teori om hvordan vitenskapelig kunnskapsutvikling finner sted. Her understreker han, i motsetning til for eksempel Popper, som mente at forskeren kunne stille seg utenfor teoriene og studere dem «objektivt», at all forskning er underlagt de normer og grunnleggende antakelser som eksisterer innenfor en vitenskapsgren til en hver tid. Kuhn kaller dette felles verdigrunnlaget og den aksepterte forståelsesrammen for «paradigme». På makronivå omfatter paradigme normer, prinsipper og oppfatninger på det vitenskapsteoretiske plan. På mikronivå bruker Kuhn begrepet for å betegne de rammene som pålegges den enkelte forsker gjennom lærebøker og spesifikke metoderegler. Et paradigmeskifte, altså at et nytt paradigme avløser det eksisterende, er ifølge Kuhn det som driver vitenskapen fremover. Det er imidlertid et viktig poeng hos Kuhn at slike paradigmeskifter ikke følger et rasjonelt og forutsigbart mønster, men oftere skjer som resultat av «tilfeldigheter» eller at noen kommer «utenfra» inn i et etablert fagområde og derfor ikke føler seg forpliktet av rådende normer og tradisjoner. Kuhn opererer med to grunnleggende forskjellige typer vitenskap, nor mal og revolusjonær, som avløser hverandre etter et fast mønster. Normalvitenskapen er den som «alle» i en periode anser som innlysende riktig og som det ikke stilles nærgående spørsmål ved. Men så, etter hvert, begynner likevel noen å stille spørsmål - som regel som resultat av at nye observasjo ner ikke passer inn i de etablerte mønstere - og det blir kanskje litt etter litt sådd så meget tvil om de dominerende paradigmene at de til slutt vakler og faller under presset. Etter en stund blir så de gamle sannheter erstattet av nye - som nå anses som like innlysende riktige. Den normalvitenskapelige perioden avløses altså av en krise, hvor en re volusjonær vitenskap river ned det bestående før den selv befester seg som den «absolutte» sannhet og blir normalvitenskap. Ringen er sluttet, og sannheten er med ett slag blitt et relativt begrep!
Thomas Kuhns oppstilling over fasene i et paradigmeskifte
- Førparadigmatisk stadium Her foregår kunnskapssøkningen tilfeldig og ut fra varierende oppfat ninger av hva som er utforskningens identitet og grenser. - Flerparadigmatisk stadium Ulike «skoler» begynner å ta form på en mer systematisk måte.
38
- Paradigmatisk stadium Et bestemt sett av forutsetninger vinner dominans og tenderer mot å monopolisere kunnskapen innenfor et avgrenset og beskyttet fagområde. - Anomali Nye observasjoner passer ikke inn i det etablerte mønstret og truer de dominerende forutsetningene. - Krise De dominerende forutsetningene vakler under presset fra alternative perspektiver og forutsetninger. - Revolusjon De gamle lærebygningene faller og nye etableres. - Nytt paradigmatisk stadium En ny kunnskapsstruktur dominerer. Osv. (Oppstillingen er i sin helhet gjengitt etter Rossvær 1987.)
Et av de mest åpenbare paradigmeskiftene vi kjenner til i nyere tid er utvil somt at Einsteins relativitetsteori «med ett slag» avløste Newtons «mekanikk-paradigme». I andre fag, for eksempel sosialøkonomien, kan vi faktisk peke på en rek ke paradigmer som forholdsvis klart har avløst hverandre gjennom en rekke «vitenskapelige revolusjoner» innenfor en slags felles overordnet tradisjon, nemlig den klassiske økonomi (Smith, Ricardo), den neo-klassiske (Jevons, Marshall), keynesianismen og nå kanskje også monetarismen (Friedman). Noen vil muligens føle at vi misbruker og utvannet Kuhns paradigmebegrep dersom vi likestiller hele den klassiske fysikken - en 300-årig tradisjon - og hver enkelt lille «skole» innenfor sosialøkonomien og kaller begge for paradigme. Men i vitenskapsteorien har vi bruk for et begrep hvorved vi kan fange inn det særpreg ved vitenskapelig virksomhet at den alltid foregår in nenfor en gitt ramme - eller på grunnlag av noen forusetninger som ikke selv gjøres til gjenstand for noen undersøkelse, men som i høy grad vil pre ge den pågående forskning og dens resultater. Og til det bruk er Kuhns paradigmebegrep velegnet. Likevel kan vi påpeke en vesentlig forskjell mellom disse to eksemplene. Mens paradigmene innen naturvitenskapene stort sett avløser hverandre på en definitiv måte (den dagen det ble aksept for det heliosentriske verdens bilde, var det mer eller mindre over og ut for oppfatningen om Jorden som universets sentrum), finner vi innenfor humaniora og samfunnsvitenskapene at ulike paradigmer lever side ved side, i tiår etter tiår, i beste velgående. Her polemiserer marxister mot ikke-marxister, behaviorister mot kognitivister, positivister mot hermeneutikere - uten at noen tilsynelatende har til hensikt
39
å gi seg. Det kan (nok en gang) tyde på at vi neppe noen gang kan regne med å komme til enighet om hva som er riktig eller galt, sant eller falskt. To svenske økonomer og forskere, Arbnor og Bjerke (1977), bruker paradigmebegrepet i to ulike sammenhenger (tilsvarende Kuhns makro- og mikronivå) og kaller dette henholdsvis for «paradigme» og «arbeidsparadigme». Mens paradigme brukes i betydningen «virkelighetsoppfatning», hen spiller et arbeidsparadigme mer på det metodevalg forskeren gjør i forhold til det som skal undersøkes. Poenget er imidlertid at ifølge Arbnor og Bjerke henger disse to begrepene sammen: valg av arbeidsparadigme forut setter et bestemt paradigme. Dette innebærer at arbeidsparadigmet - forskningsdesignet, metodevalg m.v. - ikke på et meningsfullt sett kan beskrives og begrunnes uten at det gjøres klart hvordan dette er relatert til mer overgripende antakelser om hvordan den sosiale virkelighet vi ønsker å undersø ke ser ut, samt i hvilken grad og hvordan kunnskap om denne sosiale virke lighet overhodet kan innhentes. Paradigmebegrepet blir dermed (også) et redskap for å beskrive forhol det mellom filosofiske antakelser (om verden) og valg av forskningsmetode i en konkret situasjon. Som Arbnor og Bjerke uttrykker det, blir paradig mebegrepet broen mellom filosofiske betraktninger og metodevalg, slik det forsøkes illustrert i figur 5. Filosofiske antakelser
Paradigme
Metodevalg
Figur 5
Mens arbeidsparadigmet tilsvarende blir broen mellom metodevalg og ak tuelt undersøkelsesområde, slik det illustreres i figur 6.
Figur 6 40
Sammenfatningsvis kan det derfor sies at forskningsprosessen styres av forskerens overgripende antakelser, slik at metodevalget som innebærer ar beidsoperasjoner som problemformulering, datainnsamling, dataanalyse m.m. ikke skjer forutsetningsløst og objektivt, men tvert om vil være farget av så vel den enkelte forskers «verdensbilde» som av hva som er «comme il faut» innenfor det fagområde der han eller hun arbeider. Vi forstår av dette at radikale forandringer i forskerens «verdensbilde» ikke skjer så ofte. Man stiller ikke gjerne spørsmål verken om verdensbilde eller egen vitenskapsoppfatning hver gang man går løs på et forskningspro sjekt. Paradigmeskifter er derfor ingen hyppig foreteelse i vitenskapen. Et arbeidsparadigme, derimot, forandres ganske ofte. Spesielt gjelder dette for vitenskaper som har en sosialt konstruert virkelighet som undersøkelsesobjekt. Det er naturlig, ja, faktisk helt nødvendig å kunne tilpasse me toden til det område som skal undersøkes - og når undersøkelsesområdet endrer seg, slik den sosiale virkelighet hele tiden gjør, må vi også endre det redskap vi benytter for å fange inn virkeligheten, det vil si vårt arbeidspara digme. Den amerikanske sosiologen Gareth Morgan (se Burrell og Morgan 1979) bruker et liknende resonnement. Ifølge Morgan er de endelige forsk ningsresultater langt på vei konsekvens av koblingen mellom forskerens grunnleggende «verdensanskuelse» (world views), og de strategiske og me todiske valg han foretar. Også Morgan tar Kuhns paradigmebegrep som ut gangspunkt, selv om han konstaterer at dette ikke er uproblematisk. Først og fremst skyldes problemene, slik Morgan ser det, at paradigmebegrepet er blitt - om ikke direkte misbrukt - så iallfall brukt til dels temmelig ukri tisk i mange sammenhenger. For øvrig ikke helt overraskende, tatt i be traktning at Kuhn selv brukte paradigmebegrepet på hele 21 forskjellige måter. Det er likevel mulig å identifisere tre distinkte bruksområder for Kuhns paradigmebegrep: 1 som en måte å betrakte virkeligheten på (overordnet nivå) 2 som relatert til ulike «skoler» eller oppfatninger om forskning (mellom liggende nivå) 3 relatert til valget mellom ulike metoder (verktøy) for innhenting av data (informasjon)
Figurlig kan denne tredelingen fremstilles som i figur 7 (neste side).
41
Eks: verden er objektivt registrerbar (positivisme)
Eks: hvordan kan vi (i det hele tatt) måle ulike fenomener
Eks: valg av verktøy i over ensstemmelse med våre stand punkt på I og II
Figur 7
42
Stikkord til kapittel 5 forståelse forforståelse den hermeneutiske sirkel paradigme arbeidsparadigme
Øvingsoppgaver til kapittel 5 Gjør rede for hva som menes med et paradigme. Gi eksempler på noen eta blerte paradigmer innenfor markedsføringsfagene eller organisasjonsfagene.
Forsøk videre å gi eksempler på paradigmeskifter som har skjedd eller er i ferd med å skje innenfor fagområder du arbeider med. Prøv å være så kon kret som mulig i beskrivelsen av prosessen fram mot et paradigmeskifte.
Litteratur å gå videre med Wormnæs, O.: Vitenskapsfilosofi, Gyldendal, 1987.
Kapittel 6
Kritisk teori Om å tenke og handle kritisk Som innledning til den vitenskapsetoretiske retningen som gjerne omtales som «kritisk teori», kan det være nyttig å bruke noen linjer til å reflektere litt nærmere over ordet «kritikk» og det å være «kritisk». Vi har tidligere behandlet den såkalte «kritiske rasjonalismen» og konstaterte i den sam menheng at denne retningens bærende prinsipp var kravet om at viten skapelige påstander må være etterprøvbare, det vil si falsifiserbare, hvilket i siste instans innebærer at en må kunne tenke seg empiriske saksforhold som kan komme i strid med de påstander som settes fram. Det kritiske prin sipp er altså at det skal være mulig å forkaste tenkning og påstander som gir seg ut for å være vitenskapelige, men som ikke tilfredsstiller falsifikasjonskravet. Men det er naturligvis ikke bare «kritiske rasjonalister» som skal hevde det kritiske prinsipp innenfor vitenskapen. I vitenskap (og filosofi) er kritikk og kritisk innstilling tvert imot nærmest selvsagt, for her er vi nettopp ute etter å skille mellom oppfatninger som kan grunngis og oppfatninger som ikke kan det. A stille vitenskapelige og filosofiske oppfatninger på prøve er nettopp å undersøke om de kan stå for kritikk! Popper, med sin kritiske rasjonalisme, er én representant for slik kritisk innstilling. Det er kanskje likevel andre som aller tydeligst har stilt opp «det kritiske» som det avgjørende kriterium for å kunne skille mellom sant og falskt, mellom det gyldige og det ugyldige. Her skal vi kort ta for oss Kants kritiske filosofi og Marx' kritikk av den politiske økonomien, før vi vier noe mer plass til den retning som er blitt kjent under betegnelsen «kritisk teori». Kants kritiske filosofi dreier seg i vid forstand om å gjøre greie for vår så kalte «fornuftsevne», hva vi kan klare ved hjelp av fornuften og hva vi ikke kan klare. I sitt kjente verk Kritikk uv den rene fornuft ønsker han mer kon kret - gjennom kritikk av den rasjonelle metafysikken - å påvise hvilke typer av spørsmål som det er teoretisk mulig å avgjøre og hvilke som det ikke er mulig å avgjøre. Her kommer han blant annet fram til at spørsmål av typen «Har mennesket en udødelig sjel?» og «Eksisterer det en Gud?» ikke kan
44
besvares ved hjelp av den teoretiske fornuft. De kan - kort sagt - verken be vises eller motbevises. Kant mener derfor at denne type spørsmål faller inn under våre moralske og ikke-fornuftsmessige overveiinger. Det er ingen grunn til å forfølge Kants resonnementer videre i vår sam menheng, vi nøyer oss med å holde fast ved at gjennom sin kritikk av den menneskelige erkjennelses muligheter (eller grenser) fastla Kant et skille mellom på den ene side: Hva kan jeg (noenlunde sikkert) vite, og på den annen side: Hva skal jeg gjøre, det vil si hvordan bør jeg leve?
Marx' kritikk av den politiske økonomien Etter å ha kritisert både religionen, filosofien og «den tyske ideologien», utvikler Marx, gjennom sitt hovedverk Kapitalen, sin grunnleggende kri tikk av den politiske økonomien. Denne kritikken rammer den klassiske na sjonaløkonomien slik den var utviklet av Adam Smith og Ricardo, men i ho vedsak er den en kritikk av det kapitalistiske system som den klassiske nasjo naløkonomien førte til. Med sin filosofiske bakgrunn vever Marx sin kapita lismekritikk sammen med sin ideologi- og filosofikritikk, og utvikler fra det te en historiefilosofisk basert økonomisk teori som viser muligheten av en fullstendig forvandling av samfunnet (fra kapitalisme til sosialisme) gjen nom såkalt revolusjonær praksis. Slik Marx ser det, er kritikken en nødvendig forutsetning for en slik prak sis. Samtidig gjør Marx krav på at hans økonomiske teori skal ha status av vitenskap - en vitenskap som Marx selv, og ikke minst senere marxister, iro nisk nok har ønsket å skjerme mot den samme type kritikk Marx rettet mot datidens økonomiske vitenskap.
Før det er mulig å gå inn på hva begrepet (eller retningen) «kritisk teori» in nenfor organisasjons- og markedsundersøkelser egentlig innebærer, er vi nødt til å avlegge et etter hvert gammelt, men likevel aktuelt og grunnleg gende forskningsmessig stridsspørsmål en nødvendig visitt: nemlig spørs målet om forskningens objektivitet, det vil si i hvilken grad det er mulig å komme fram til resultater som er objektive i den forstand at de må aksepte res av alle som har forutsetninger for å bedømme de problemer og metoder det gjelder. I prinsippet skal det - vil mange hevde - være mulig gjennom forskningsaktiviteter, dersom bare analysen kunne føres eksakt nok og dypt nok, å komme fram til noe objektivt sant eller riktig som måtte erkjennes av alle. Den som først påpekte dette, men som samtidig innså det problematis ke i et slikt forskningsmessig krav, var den tyske sosiologen Max Weber, som i sin avhandling Die Objektivitåt sozialwissenschaftlicher und sozialpolitischer 45
Erkenntnis fra 1904 påpekte nødvendigheten av en sondring mellom hva han kaller «vurdering» som forskeren bygger på, og den rent tekniske be handling av det stoff som foreligger. Det skulle imidlertid vise seg at vanskeligheten med å holde klare linjer i dette spørsmålet er høyst forskjellig i de forskjellige vitenskaper. Matematik ken danner den ene ytterlighet. Her er det helt tydelig hva som er forutset ninger, og hva den vitenskapelige objektivitet ligger i. Herfra går det en lin je gjennom naturvitenskapene fram til samfunnsvitenskapene, hvor vanske lighetene blir større og større fordi hele idékomplekset som utgjør vitenska pens forutsetninger, etter hvert blir mer og mer broket. Allerede når det gjelder beskrivelsen av de fenomener samfunnsvitenskapene beskjeftiger seg med, kommer det vurderingsmessige element inn. Den fulle og hele sosiale virkelighet kan neppe noen gang fanges inn av en vitenskapelig fremstilling. Det må med andre ord foretas et utvalg. Også når det gjelder de fortolk ninger en kan gjøre av det materiale en har innsamlet og analysert, må en antakelig gå ut fra et bestemt fortolkningsgrunnlag. Utvelging (av problem stillinger) og fortolkningsgrunnlag vil ikke bare avhenge av hva som i en viss objektiv forstand er «riktig», men vil i en meget vesentlig grad også avhenge av hva resultatene kan tenkes å bli brukt til - altså noe vurderingsmessig. Den norske filosofen Hans Skjervheim har i flere sammenhenger kritisert «objektivisme-idealet». For eksempel skriver han i Sosiologien som vitskap: positiv eller kritisk disiplin-. «Samfunnsvitskapsmannen lever ikkje i eit metasamfimn utafor samfunnet, han står i eit kommunikasjonsforhold til dei an dre medlemmene i samfunnet, han er også i eigenskap av vitskapsmann en del av samfunnet, ein deltakar i samfunnslivet» (Skjervheim, 1976). Dette står i skarp kontrast til en annen norsk filosof, nemlig Arne Næss, som opprinnelig søkte å vise muligheten av å observere og beskrive strengt objektivt. Næss kaller dette en «objektiv-psykologisk beskrivelse», og po enget er at vitenskapelig virksomhet - eksempelvis fysikken - kan beskrives fyldestgjørende ved å beskrive fysikerens atferd som fysiker ut fra en nøytral observasjonsposisjon. Den som observerer og beskriver, forholder seg til sitt objekt som «en fremmed» - som en som kommer fra en annen planet. Men vitenskapsfolk kommer sjelden fra andre planeter. Oftest er de, slik Skjervheim påpeker, medlemmer av det samme samfunn de har satt seg fore å undersøke. Dermed vil kravet om forskerens objektivitet eller nøytralitet i forhold til de forskningsmessige problemstillinger han velger (hvorfor vel ges f.eks. noe fremfor noe annet?) eller blir forelagt (f.eks. spørsmålet om vi har for mange og for små kommuner i Norge), bli svært vanskelig å over holde. I det siste eksemplet kan det for eksempel lett tenkes at dersom den forskeren som ble valgt til å utrede kommunestrukturen i Norge selv kom mer fra en liten utkantkommune, så ville muligens opplegg og gjennomfø
46
ring se annerledes ut enn om han hørte hjemme i en sentralt beliggende by kommune. Kravet om at en forskningsmessig forutsetning for vitenskapelig objekti vitet er at forskningsprosessen frigjøres helt fra alle samfunnsmessige inter esser, blir åpenbart vanskelig å leve opp til i samfunnsvitenskapene. En av dem som klarest har innsett dette, og som på mange måter har utviklet et alternativt forskningsmessig verdisystem, er den tyske sosiologen Jiirgen Habermas. Habermas argumenterer tvert om for at det er en indre forbin delse mellom vitenskapelig forskning og samfunnsmessige interesser. Han påviser vitenskapens iboende politiske karakter. I sin kjente artikkel «Erkenntnis und Interesse» fra 1972 argumenterer han relativt utførlig og kortfattet for dette. Uten at vi her skal gå detaljert inn i Habermas' argumentasjon, skal vi likevel kort redegjøre for det saks forhold han setter fokus på. Habermas' overgripende ærend er å påvise sam menhengen melllom forskning - enten det er tale om naturvitenskapelig el ler samfunnsvitenskapelig forskning - og spesielle interesser ulike typer av forskning gjennom sin praksis faktisk ivaretar. Habermas' påstand er for ek sempel at naturvitenskapelig forskning har en iboende teknisk interesse. Med det mener han at naturvitenskapene til syvende og sist er ute etter å frembringe teknisk brukbar kunnskap, det vil si kunnskap som kan brukes til å kontrollere (naturjomgivelsene. Tradisjonell positivistisk vitenskapsteo ri er at forskningsprosessen frigjøres helt fra samfunnsmessige interesser. Man må skille strengt mellom sak og vurdering, mellom forskeren som for sker og forskeren som samfunnsborger. Vi har tidligere argumentert for at dette kanskje er mulig i naturvitenskapene. Med andre ord at den naturvi tenskapelige «teknisk frembrakte kunnskap» i og for seg er nøytral, mens det først er bruken av kunnskapen som gjør den til redskap for bestemte in teresser. Habermas mener imidlertid at slik er det ikke. Fra hans synsvinkel kan vitenskapelig objektivitet bare oppnås ved en bevisst identifisering med fundamentale, allmenne interesser. Dermed blir ikke interesser å betrakte som en (nesten) uunngåelig og beklagelig feilkilde, men som en forutset ning for objektivitet. Det er fundamentale menneskelige og samfunnsmessi ge interesser som må være motiv for forskning, og det er også disse interes ser som legger grunnlaget for vitenskapelig objektivitet. Enda tydeligere blir dette når det gjelder samfunnsvitenskapene. Også disse har - på samme måte som naturvitenskapene - som mål å frembringe lovmessig viten. Men i motsetning til naturvitenskapene, som ifølge Haber mas har en innebygget teknisk interesse, har samfunnsvitenskapene en ibo ende frigjørende interesse. Dette innebærer at samfunnsvitenskapene ikke bare må søke å avdekke sosiale lovmessigheter og forstå dem, de må - der som denne forståelsen skal være gyldig - i tillegg ta stilling til om lovmes47
sighetene er uttrykk for illegitim maktutfoldelse, maktutfoldelse som bør oppheves. Dette betyr at en må skille mellom naturlovmessigheter og samfunns messige lovmessigheter. De første er «gitt», og det blir meningsløst å spør re om legitimiteten av for eksempel den såkalte fall-loven. Derimot er det muligens både riktig og legitimt å stille spørsmål ved det bilde forskningen har skapt av for eksempel kvinnelige arbeidstakere som arbeidstakere som «vil ha deltidsarbeid, enkelt arbeid, arbeid der vi ikke behøver å ta initiativ, der det ikke kreves for mye av oss, osv.» (Sørensen, 1995, s. 35), og som faktisk også lett far status av lovmessighet, fordi denne type forskning blir hva Bjørg Aase Sørensen (ibid.) kaller «realitetsbindende»: Det som er, blir årsak til det som skal bli. Dermed blir det lett slik at når mange beskrivende undersøkelser av kvinners atferd viser at de ikke deltar (f.eks. i saker som vedrører egen arbeidssituasjon) og heller ikke øver noen innflytelse, så blir virkningen den at kjennetegn ved kvinners situasjon blir omgjort til noe som kjennetegner kvinner, og i neste instans til kjønnsbestemte egenskaper. På kvinner blir ofte virkningen av slike rapporter («forskningen viser») at disse bidrar til å bekrefte deres tradisjonsbestemte selvoppfatning («sånn er vi»), og forskningen og den måten den rapporteres på, binder dermed kvin nene - den frigjør dem ikke. Sørensen (1995) kaller dette for paradigmefeil i forskning om kvinner. Liknende paradigmefeil kan vi antakelig finne på flere områder, eksempelvis forskning om ungdom, innvandrere, u-hjelp. Når forskeren derimot nærmer seg området kvinnelige arbeidstakere ut fra det grunnleggende syn at menn og kvinner i utgangspunktet er likestilt, har sammenliknende undersøkelser i praksis fungert avdekkende, det vil si frigjørende. Egenskaper som tradisjo nelt beskrives som kvinnetypiske, viser seg for eksempel slett ikke å være det. Derimot kan de fremstå som typiske i forhold til bestemte arbeidsoppgaver uavhengig av om de utføres av kvinner eller menn. Den amerikanske organisasjonsforskeren Rosabeth Moss Kanter lanserer for eksempel et slikt per spektiv i artikkelen «Why bosses turn bitchy» (1976), der hun konkluderer med at de kjønnsforskjeller hun i utgangspunktet ønsket å fokusere på, ikke var der. Tvert om fant hun at det ikke var noe å si om kvinner som ikke i like høy grad kunne sies om menn - i bestemte situasjoner. Hennes konklusjon ble derfor at det er jobben som skaper mannen - og kvannen.
Aksjonsforskningen Kravet om at samfunnsforskningen skal virke frigjørende, avføder i sin tur ytterligere et dilemma eller en utfordring, nemlig spørsmålet om på hvilken
48
måte det faktisk er mulig å drive med frigjørende forskning uten å redusere det en driver med til «politisk utredningsarbeid». Den såkalte «aksjons forskningen» har av flere blitt lansert som et mulig svar på denne utfor dringen. Selve begrepet «aksjonsforskning» ble lansert av Kurt Lewin i 1940-årene og utgjorde på mange måter en utfordring eller et alternativ til den eta blerte, sterkt positivistisk influerte forskningstradisjonen, idet aksjonsforsk ningen skulle kjennetegnes av handling gjennom at - forskeren deltar i løsningene av praktiske problemer i samarbeid med an dre (gjerne dem problemene angår) - denne deltakelsen i praktisk arbeid også fungerer som en læringssitua sjon for forskeren
Det kan dermed hevdes at aksjonsforskningen åpent og bevisst bryter ned det skillet mellom vitenskap og sosialt liv som positivismen har forutsatt som fundamentalt. Mens den tradisjonelle forskningens referanseramme er teori-empiri-teori (jf. beskrivelsen av den vitenskapelige undersøkelsesprosessen under bokas metodedel), er aksjonsforskningens referanseramme aksjon-teori-aksjon. «Hvis det virkelig er så at samfunnsforskningen skal ha frigjørende virkning, er det egentlig ikke så lett å tenke seg at man ikke før eller siden må komme i den situasjon at handling er nødvendig» (Gustavsen og Sørensen, 1995, s. 56). Men så kan man naturligvis spørre om aksjonsforskning egentlig er forsk ning. Praksisen med å oppheve det tradisjonelle skillet mellom forskning og politikk, eller sak og vurdering slik aksjonsforskerne gjør, har av mange blitt oppfattet som temmelig problematisk. Enkelte kritikere hevder for eksem pel at aksjonsforskere er gode til alt mulig nnnet enn forskning. De er - hev des det videre - gode til å drive organisasjonsutvikling, men utvikling og forskning er ikke det samme. (Mer om dette nedenfor.) Men hvis aksjons forskning ikke er forskning, hva er det egentlig? Den «normale» empiriske samfunnsforskningen skal bidra til grunnleggende «erkjennelsesutvideise», mens aksjonsforskning i beste fall er av anvendt karakter, og kan følgelig ikke gi slike grunnleggende bidrag til vår kunnskapsutvidelse. På den annen side: Fordi all samfunnsforskning innebærer en påvirkning av det som undersøkes, og siden all kunnskap som hentes ut av forsknings prosjektene er «respons» på denne påvirkningen, kan for så vidt all (samfunnsjforskning sies å være aksjonsforskning. Det som likevel på en avgjø rende måte skiller aksjonsforskningen fra «tradisjonell» forskning, er at må let med aksjonsforskningen først og fremst er - gjennom forskningsmessig praksis - å realisere bestemte politiske eller praktiske verdier. Hva slags ver-
49
dier aksjonsforskeren ønsker å realisere, må forskeren selv avgjøre. Aksjons forskning er dermed ikke uten videre moralsk god eller riktig. Selv om vi iallfall i Norge - har en slags tradisjon for at aksjonsforskere har arbeidet med prosjekter og problemstillinger som de fleste vil kunne være enige om er politisk eller etisk «korrekte», er det prinsipielt intet i veien for at denne type forskning også kan anvendes på rent kommersielle problemstillinger, eksempelvis reklameforskning. Oppsummeringsvis kan vi derfor slå fast følgende: Den problemstilling vi innledningsvis tok opp i dette kapitlet, nemlig spørsmålet om forskningens objektivitet, har ingen enkle løsninger. Aksjonsforskingen - som av enkelte har blitt lansert som en mulig løsning på dette problemet - reiser en rekke nye problemstillinger. Debatten rundt spørsmålet om hva vitenskapelig virksomhet er, og hva forskning egentlig betyr, vil gå videre. Vår oppgave har vært å gi en innføring i noen av de pro blemstillinger som denne diskusjonen har reist og fortsatt reiser. La oss imidlertid - før vi erklærer oss ferdig med bokas mer «filosofiske» del - også avlegge diskusjonen omkring forskjeller og likheter mellom forsknings- og utredningsarbeid en kort visitt. Undersøkelser betegnes noen ganger som forskning, andre ganger som utredning. Men, kan vi spørre, er det i det hele tatt noen grunn til å skille mellom disse begrepene? Enkelte hevder i den forbindelse at forskjellen ligger i at mens forskning har som mål å generere ny kunnskap, nøyer utredningen seg med å sam menfatte allerede kjent kunnskap. Men er dette riktig? Det er uansett mye som tyder på at arbeidsmetodene i utredning og forskning nærmer seg hverandre mer og mer. Naturligvis finnes det enkle utredninger som gjen nomføres med beskjeden intellektuell innsats og med klare tids- og ressursbegrensninger. Neppe noen ville kalle slikt arbeid for forskning. Men vi har også utredninger (eksempelvis enkelte NOU-er) som ofte er omfattende ar beider som nokså nært tilfredsstiller de krav vi gjerne setter til vitenskapelig arbeid. Tendensen til å viske ut grensene mellom forsknings- og utred ningsvirksomhet forsterkes videre gjennom at man på universiteter og høy skoler i større og større grad orienterer seg mot samfunnet rundt og dets behov, blant annet gjennom å utføre forsknings- og utredningsarbeid for eksterne oppdragsgivere. I tillegg ser vi at selvstendige institutter i skjæ ringspunktet mellom forskning og arbeidsliv far stadig større betydning som kunnskapsformidlere og premissleverandører til den aktuelle sam funnsdebatt. Eksempelvis definerer FAFO (Fagbevegelsens forskningsorga nisasjon) seg som et forskningsinstitutt, men med en profil «som betinger tett samarbeid med brukerne, fra formuleringen av problemstillingen til sluttføringen av oppdragene» (FAFOs Årsrapport, 1994:8).
50
FAFOs mål er altså «å skape og formidle forskningsbasert kunnskap til nyt te for sentrale beslutningstakere» (FAFOs Prosjektoversikt, 1995). Likevel blir det kanskje vel lettvint å trekke den slutning at forskning og utredning egentlig er to sider av samme sak. Kanskje kan vi i stedet si at forskning alltid innebærer utredning, men at utredning ikke alltid er forsk ning. Forskningens oppgave anses vanligvis å være å beskrive, forklare, ska pe forståelse eller forutsi, mens utredningen primært skal skape underlag for - eller også noen ganger legitimere - beslutninger. Utredninger er med an dre ord i sitt vesen problem- og løsningsorienterte. For å gi en oversikt over forholdet mellom utredning og forskning, kan følgende skjema, hentet fra Wiedersheim-Paul og Eriksson (1991) kanskje være til nytte: Utredning
Forskning
Mål
Løse bestemte problem eller forandre en viss situasjon - «få noe ti lå hende»
Fremkomme med generaliserbar kunnskap
Problemorientering
Oppgaven er oftest gitt av Utførlig problemutvikling og gjennomgang av andre tidligere forsknings resultater
Tid
Oftest kort, med klar «deadline»
Ganske lang, og ikke alltid bestemt på forhånd
Gjennomføring
Ofte sammen med dem som skal bruke resultatene
Forskeren alene-eller sammen med kolleger
Rolle
Utrederen fungerer som forandringsagent
Forskeren spiller «forskerrollen», det vil si styrt av vitenskapelige krav
Formidling
Kan skje på flere måter, gjennom rapport, i kon feranse- eller seminarform, på styremøte o.l.
1 form av vitenskapelig artikkel eller avhandling. Høye krav til teoriog metodereferanser
All utredningsvirksomhet kan ikke og skal heller ikke være «vitenskapelig». Når det likevel har noe for seg å stille opp et sett av «vitenskapelige krav» også til utrednings- og prosjektarbeid (eksempelvis studentprosjekter), er dette ikke først og fremst fordi man er så forferdelig opptatt av vitenskapeligheten i det man gjør, men fordi de krav som normalt stilles til vitenska pelige undersøkelser også kan betraktes som en form for kvalitetssikringskriterier (mer om dette i metodedelen).
51
Ett kjennetegn ved utredninger er at de primært utføres med tanke på å bidra til løsning av et bestemt problem. I den sammenheng kan det være nyttig å minne om en «sannhet» fra dataverdenen som ikke blir mindre sann i vår sammenheng, og som slagordmessig uttrykkes ved «garbage in garbage out». Kvaliteten på den informasjon eller kunnskap som utrederen frem bringer, bestemmer i neste omgang langt på vei kvaliteten på de beslut ninger oppdragsgiver tar. Dårlige utredninger er ingen tjent med. Da er det faktisk bedre å la være. Eller for å si det med en amerikansk næringslivsleder: «Bad judgment is better than bad data - it's faster, and it's cheaper!» For øvrig er det i den løpende debatten om forskningens vilkår i Norge også pekt på nødvendigheten av å avgrense forskning mot utrednings- og konsulentarbeid. Mens det er åpenbart at konsulent- og vanlig utrednings arbeid krever styring, er det - mener mange - en misforståelse å tro at også forskning kan styres fram mot gode resultater. I motsetning til utredninger er forskningens resultater nettopp ikke forutsigbare, og man kan følgelig ikke mene noe om nytte eller utbytte før etter at forskningen faktisk er av sluttet. En forsker fra NTNU har uttrykt det slik: Hvis vi hadde hatt bru kerstyring av forskning i steinalderen, ville pil og bue aldri blitt funnet opp. Ingen bruker eller oppdragsgiver vil bestille noe han aldri har hørt om.
Stikkord til kapittel 6 forskningens objektivitet aksjonsforskning forskning og utredning
Øvingsoppgave til kapittel 6 Drøft likheter og forskjeller mellom det vi vanligvis kaller utredninger og/eller konsulentrapporter og forskning. Prøv å finne eksempler på ulike typer av rapporter.
Litteratur å gå videre med Wiedersheim-Paul, F. og L.T. Eriksson: Att utveda, forsket och raøportera. Liber, 1991. Eikeland, O. og Dons Finsrud: Forskning og handling, Søkelys pd aksjons forskningen, Arbeidsforskningsinstituttet, 1995.
52
Kapittel 7
Noen avsluttende kommentarer om vitenskapsteori Til tross for at det påviselig har vært og er økende interesse for vitenskaps teoretiske spørsmål også blant økonomer og organisasjonsteoretikere - er nok den dominerende holdning fremdeles at vitenskapsteori forbindes med «grunnlagsproblemer» av liten betydning for ens daglige virke, enten det nå er som høyskolelektor eller næringslivsleder. Vi ser iallfall to grunner til at dette kanskje ikke er så sikkert. Den ene har vi alt vært inne på under vår diskusjon om «paradigmebegre pet», der vi blant annet forsøkte å vise koplingen mellom vitenskapsteori og forskningsopplegg. Et forskningsopplegg (engelsk: research design) er en slags plan for hvor dan en undersøkelse skal gjennomføres, fra de første vage tanker til det fer dige produkt. Vi kommer i bokas andre del til å bruke noen sider på akku rat dette, men vi kan allerede nå fastslå at det viktigste enkeltelement i et forskningsopplegg antakelig er «spørsmålet», i og med at det er dette som fastsetter den generelle utviklingsorientering for et forskningsprosjekt. For ytterligere å understreke spørsmålets betydning, vil vi videre hevde at uav hengig av fagområde kan det alltid stilles to fellesvitenskapelige krav til en hvilken som helst vitenskapelig undersøkelse: For det første må man så klart som mulig formulere og begrunne de spørsmålene som stilles. Ikke minst her er det nødvendig med en viss vitenskapsteoretisk skolering. For det andre må man søke å besvare disse spørsmålene på en mest mu lig klar måte, slik at svarenes (resultatenes) holdbarhet kan prøves. Vektleggingen av spørsmålet i forskningssammenheng - spissformulert som «I begynnelsen er spørsmålet» (Kalleberg, 1992) bringer oss igjen inn i hermeneutiske tankebaner. Det kanskje tydeligste uttrykket for dette finner vi i den tyske hermeneutikeren Hans Georg Gadamers bok «Walorheit und Methode». Her insisterer Gadamer på betydningen av spørsmål/svar-logikken, og han uttaler da også at «the path of all knowledge leads through the question». Ifølge denne betraktningsmåte er altså forskning underlagt en spørs-
53
mål/svar-logikk som sammenfattet i én setning betyr at forskningens gene relle formål er å gi (gode) svar på (gode) spørsmål. Vi nevnte ovenfor at det kunne anføres to grunner til at vitenskapsteore tisk refleksjon kanskje ikke bare angår vitenskapsteoretikere. La oss derfor se litt nærmere på betydningen av vitenskapsteoretisk bevissthet og refleksjon i en annen sammenheng enn forskerens. For kort tid siden utkom en bok av de to strategiforskerne og organisasjonskonsulentene Georg von Krogh og Johan Roos med tittel Organizational Epistemolqgy. Vi har tidligere så vidt vært inne på epistemologiske pro blemstillinger. Enkelt forklart dreier dette seg om å tenke igjennom hvor dan vi i det hele tatt er i stand til å ta til oss kunnskap, altså lare. Boka til von Krogh og Roos dreier seg om «organisasjonslæring», men er langt på vei et bidrag i retning av å problematisere begrepet «kunnskap» gjennom å lanse re ikke bare ulike definisjoner, men også ulike måter å erverve samt applise re kunnskap på. Innledningsvis stiller forfatterne en rekke spørsmål om kunnskap og kunnskapstilegnelse, spørsmål som vi i det daglige kanskje vier altfor liten oppmerksomhet fordi vi har en tendens til å ta altfor mye «for gitt». For ek sempel synes de fleste av oss å ta for gitt at «kunnskap» er noe objektivt noe som finnes «der ute», og som kan erverves dersom vi bare benytter de rikti ge metodene for kunnskapstilegnelse. I lys av hva vi har diskutert til nå, vil det kanskje være riktig å si at dette er en positivistisk måte å betrakte kunn skap og kunnskapstilegnelse på. Dette er jo nettopp den tradisjonelle måten å betrakte «verden» på. Harde fakta (slik som kunnskap) eksisterer uav hengig av oss selv, og det gjelder, som nevnt, å utvikle gode metoder for å gripe dem. (Studenter blir for eksempel overøst med tilbud innen studie teknikk, superlæring, eller hva det nå kalles, som nesten uten unntak baserer seg på et epistemologisk grunnsyn med sterke positivistiske trekk.) Uten at vi her og nå skal kaste oss inn i debatten om den norske skolen og norske elevers kunnskapsnivå (som fra tid til annen «måles» og sammen liknes med andre lands elevers, til stor medieoppmerksomhet), kan vi - ved å anlegge et vitenskapsteoretisk utgangspunkt - fastslå at det nok er til hengerne av en positivistisk influert grunnholdning som har fatt dominere denne debatten. Ifølge von Roos og Krogh kan det derfor av og til være fornuftig å stop pe opp litt og stille noen grunnleggende spørsmål av typen: 54
Hva vet vi egentlig (med sikkerhet)? Hvordan vet vi (at vi vet)? Er det bare jeg som vet dette? Har jeg lest dette et eller annet sted?
-
Har jeg opplevet det selv? Har jeg sett det - følt det? Kan jeg noen gang være sikker på det jeg vet? Osv.
Roos og von Krogh anbefaler ikke minst ledere, eller mer presist beslut ningstakere, å stille slike spørsmål. Med et slikt utgangspunkt blir boka på mange måter et forsøk på å un dersøke hvordan læring, og spesielt organisasjonslæring, skjer på en måte som gdr utover det konvensjonelle perspektivet vi vanligvis finner i bøker som (også) søker sitt publikum blant praktikere. Grunnen til at det faktisk er viktig å fokusere på epistemologiske pro blemstillinger knyttet opp mot organisasjonslæring, er ifølge forfatterne at dette kan hjelpe til med å bøte på to forhold: Det ene er at man innen om rådet «organisasjon og ledelse» tradisjonelt ikke har vært opptatt av slike problemstillinger; læringsmetoder (både individuelle og på organisasjons plan) har på mange måter vært «tatt for gitt» (jf. diskusjonen over). Det andre er at ved å bevisstgjøre seg på hvordan en selv som individ og ens organisasjon lærer, vil ledere på alle nivåer være bedre i stand til å møte dagens og morgendagens utfordringer. I en foranderlig verden der selv den minste organisasjon møter en kompleks og skiftende virkelighet er det ifølge von Krogh og Roos - behov for en ny ledelsesmodell hvis fremste kjennetegn er at den ikke tar for gitt den virkelighetsoppfatning de etabler te organisasjons- og ledelsesteorier gjerne står for, men som tvert imot stil ler opp kritiske og alternative modeller. I tråd med hva vi tidligere har diskutert, kan vi gjerne si at forfatterne tar til orde for et paradigmeskifte. Mens det virker som om det er opplest og vedtatt at dagens virkelighet krever nye organisasjonsmodeller (enten vi nå snakker om skolen eller in dustribedriften), henger vi fremdeles igjen i tradisjonelle oppfatninger av en del sentrale forhold av betydning for menneskene innenfor modellene. Koplingen mellom kunnskapstilegnelse på den ene side og individuell eller organisatorisk vekst og utvikling på den andre side er ett slikt område, iføl ge von Roos og Krogh. Utstyrt med en viss vitenskapsteoretisk skolering kan vi altså være i stand til å gjennomskue etablert praksis, samt å gi argumenter for en alternativ til nærming til disse utfordringene. Ytterligere noen kommentarer kreves før vi forlater vitenskapsteorien helt. Ifølge Tornbom, en svensk vitenskapsteoretiker, vil enhver vitenskapelig virksomhet kunne vurderes opp mot tre forhold: 55
1
vitenskapsideal, det vil si normer for hva som er (god) vitenskap
2 virkelighetsbilde, det vil si grunnleggende forestillinger om den virkelig het vitenskapen skal beskjeftige seg med
3 forskningsetikk, det vil si etiske regler for hvordan forskning som sosial aktivitet bør utføres
La oss se litt nærmere på hva dette innebærer. Vitenskapsidealet innenfor et fagområde utgjøres altså av de normer og forestillinger vi har om hvilke egenskaper som skal være til stede for at noe kan sies å være god vitenskap. Egenskaper som begrepsmessig klarhet, lo gisk sammenheng og konsistens er eksempler på dette. Egenskaper som kvantifiserbarhet, enkelhet og formulerbarhet i matematiske modeller er an dre eksempler. På noen områder holdes generaliserbarhet opp som ideal, på andre fremheves idealet om individualiserende og dyptgående fortolkning er. Noen betoner, slik vi har sett, vitenskapens uavhengighet av verdiforestillinger og politiske holdninger, mens andre fremhever politisk stillingtaken og moralsk engasjement som en nødvendig forutsetning for erkjennel se av sosiale fenomener. Det er således langt fra ett enkelt vitenskapsideal som er enerådende. Virkelighetsbildet omfatter de grunnforestillinger som er fremherskende innenfor de ulike fagområder (paradigmer). Innen økonomifaget finner vi for eksempel den klassiske, økonomiske antakelse om foretaket som rasjo nelt styrt i henhold til en klar målsetting (overskuddsmaksimering) der man på basis av perfekt informasjon tar optimale beslutninger. Dette i klar kon trast til for eksempel sosiologenes og psykologenes organisasjonsbilde som slett ikke fremstår som noe rasjonelt, men der målkonflikter, interessemot setninger og maktkamper skaper en organisasjonsvirkelighet som klart bry ter med økonomenes idealbilde. På samme måte kan det virkelighetsbilde som tegnes av samfunnet også være forskjellig; mens noen sverger til et samfunnsbilde preget av harmoni og konsensus, vil andre holde fast ved at det er konflikter og motsetninger som utgjør «normaltilstanden». Den forskningsetiske komponenten dreier seg egentlig om to forhold. Det ene har å gjøre med etablerte og jevnt over aksepterte normer for hvor dan det sosiale samspillet mellom forskere innbyrdes bør foregå, og fokuse rer på forhold som åpenhet, lydhørhet for kritikk, «fair play» osv. Det andre dreier seg om forholdet mellom forskningen og samfunnet, og her er nok enigheten atskillig mindre. Mens noen hårdnakket hevder forskningens autonomi, mener andre at forskningen tvert imot skal være et redskap for samfunnsmessige (og dermed ofte politisk definerte) interesser. 56
Forholdet mellom grunnforskning og anvendt forskning illustrerer dette på en god måte. Jf. diskusjonen over om forholdet mellom forskning og ut redning. Det dette skal understreke, er at verken når det gjelder vitenskapsideal, virkelighetsbilde eller forskningens etiske sider, er det enighet blant forsker ne om hva som er «best» eller «riktig». Samtidig viser formodentlig eksem plene vi brukte at det nødvendigvis må bli en nokså nær sammenheng mel lom de oppfatninger den enkelte forsker har rundt slike forhold og de valg som gjøres under gjennomføringen av en konkret undersøkelse. Men likevel: Det følger ikke at resultatene av en undersøkelse utelukken de er bestemt av bakenforliggende forhold av ovennevnte typer. Dessuten, kan man spørre seg, hvorfor har egentlig forskjellige viten skapsfolk forskjellige oppfatninger av slike nokså grunnleggende forhold som har å gjøre med deres egen virksomhet? Er dette noe man velger fritt, eller er det noe man sosialiseres inn i på samme måte som man bringes inn i en bestemt kultur eller en religiøs tro? Det har, blant vitenskapsteoretikere, vært ført langvarige debatter rundt slike problemstillinger. Noe entydig svar finnes ikke, og vi vil her nøye oss med å understreke at det under alle omstendigheter er fremmende for ens egen utviklings- og erkjennelsesprosess at vi forsøker å bevisstgjøre oss på å avdekke bakenforliggende forhold som virker styrende, og i noen tilfeller begrensende, på den virksomhet vi ønsker å utøve. Helt til slutt i denne delen: Utgangspunktet for bokas vitenskapsteoretis ke del var spørsmålet «Hva er vitenskap»? Det har vi forsøkt å besvare ved å vise til ulike vitenskapsteoretiske retninger som alle angir ulike kriterier eller betingelser for at noe skal kalles vitenskapelig. Så kan en gjerne spørre: Er det overhodet ikke noe en kan være enig om, på tvers av vitenskapsteoretisk ståsted, og på tvers av fagområder, når det gjelder hva som skal kjennetegne vitenskapelig virksomhet? Det er det nok. Antakelig vil alle - uansett hvor de anser seg å høre hjemme på den viten skapsteoretiske arena - være enige om at utgangspunktet for all vitenskape lig virksomhet er en stadig søken etter ny og sann kunnskap. Derigjennom kan vitenskapen være med på å flytte kunnskapens grenser på iallfall tre måter:
1
Ved at kunnskap erstatter feiltakelsen Troen på at Jorden var universets sentrum, det såkalte geosentriske ver densbilde, viste seg å være feil når vitenskapsmenn etter hvert, ved hjelp av bedre og bedre utstyr kunne dokumentere at Jorden bare var en av mange planeter som beveget seg i bane rundt Solen. Likeledes viste det seg at troen på mennesket som et produksjons57
middel på linje med maskiner, slik de klassiske organisasjonsteoriene ut trykte den, var feil når det etter hvert gjennom den såkalte Human Relation-forskningen ble dokumentert hvor viktig sosial behovstilfredsstil lelse var i arbeidssammenheng. 2
Ved cit kunnskap erstatter uvitenhet I forrige århundre var det et stort problem at mange kvanner som fødte på sykehus døde av såkalt barselfeber. Oppfatningene blant legene om årsakene til dette varierte fra «feilaktig forløsningsstilling» til at de ble skremt (til døde) når presten kom for å gi andre døende kvinner den sis te olje. I virkeligheten var man helt uvitende om hva årsaken til barsel dødeligheten kunne skyldes. En lege ved navn Ignaz Semmelweiss, som arbeidet på fødeavdeling en på et stort sykehus i Wien, bestemte seg imidlertid for å undersøke dette nærmere. Gjennom å sette opp en rekke antakelser, som han der etter undersøkte og falsifiserte, sto han til slutt igjen med én, nemlig at årsaken måtte være overføring av smittestoffer. Ved å fa legene som tok seg av de fødende kvinnene til alltid å vaske hendene sine først, regis trerte han at dødeligheten sank dramatisk. Uvitenhet rundt smitteoverføring var dermed erstattet av kunnskap om viktigheten av renslighet og hygiene i omgangen med pasienter.
3
Ved at kunnskap utvides i dybden Vitenskapelig virksomhet dreier seg på mange måter om to aktiviteter: å beskrive og å forstå. Å utvide kunnskap i dybden betyr at vi er i stand til å utvikle teorier som evner å binde sammen og gi en forståelse av hvor for det vi observerer og beskriver ser ut eller oppfører seg slik det gjør. Et berømt eksempel på en samfunnsvitenskapelig teori som nettopp gir slik forståelse er den franske sosiologen Emile Durkheims teori om årsaker til forskjellen i antallet selvmord i henholdsvis Nord- og SydTyskland. Han observerte at grensen mellom høy og lav selvmordsrate falt sammen med grensen mellom protestantiske og katolske delstater mange flere protestanter enn katolikker begikk selvmord. Dette koblet han opp mot antakelsen om at det sosiale nettverket var tettere blant ka tolikkene, og teorien var dermed i stand til å knytte sammen observerte data om forskjellige fenomener på en slik måte at det førte til dypere for ståelse om et fenomen.
Som avslutning på denne delen av boka og som overgang til metodedelen, kan vi formodentlig fastslå følgende: Metodedelen oppfattes av mange som håndverket. Den skal fortelle oss 58
om hvilke fremgangsmåter eller regler vi skal følge når vi vil gjennomføre (vitenskapelige) undersøkelser. Det er likevel ikke til å komme fra at det også når vi forholder oss til metodespørsmål - vil dukke opp problemer av mer «overordnet» art, problemer som minner om dem vitenskapsteorien er opptatt av. Vi vil derfor fortsette med å være litt «filosofiske» gjennom å stil le enkelte grunnleggende spørsmål omkring kunnskapstilegnelse også i den mer «praktiske» metodedelen. Vi vil likevel bestrebe oss på å gjøre fremstillingen såpass praktisk at for eksempel studenter i ferd med å skrive semesteroppgaver kan plukke opp noen tips. Det er vårt håp at disse to ambisjonene lar seg forene.
Stikkord til kapittel 7 epistemologi kunnskapstilegning vitenskapsideal
Øvingsoppgave til kapittel 7 De fleste av oss har lett for å ta ting «for gitt». Det kan derfor være en nyt tig øvelse å finne fram til en «etablert sannhet» (gjerne hentet fra hverdags livet av typen: Jenter skjønner ikke matematikk) og diskutere forutsetning er og implikasjoner, gjerne (også) i et vitenskapsteoretisk perspektiv.
Litteratur å gå videre med Elster, J.: Vitenskap og politikk, Universitetsforlaget, 1989. Slagstad, R.: Positivisme, dialektikk, materialisme, Universitetsforlaget, 1976.
Del II
Forskningsmetode
Kapittel 8
Fra teori til empiri Som vi har påpekt i del I, så henger vitenskapsteori og forskningsmetode sammen på flere måter. Vitenskapsteorien er viktig som grunnlag for disku sjonen om valg av metoder i samfunnsforskningen. Som vi har sett, kan vårt vitenskapsteoretiske utgangspunkt (oppfatter jeg meg som positivist eller hermeneutiker?) langt på vei bestemme hvordan jeg forskningsmessig vil gå til verks (søke etter harde fakta eller etter innsikt og forståelse?). Den generelle drøftingen av hvordan kunnskap kan nås og hvordan vi tenskapelige fremskritt skjer ledet oss videre over i noen av de spesielle pro blemer vi møter i samfunnsforskningen. Vi har for eksempel sett at objektivitetskravet skaper spesielle problem for samfunnsforskeren. Positivismedebatten har også vært omfattende i samfunnsfagene, og har i særlig grad be rørt de fag som først og fremst arbeider med «mykdata», eksempelvis der det dreier seg om å registrere holdninger eller innstillinger blant folk.
Hvorfor drive forskning? Så kan man jo spørre seg: Positivist eller ikke, hva er det egentlig som er be grunnelsen for i det hele tatt å forske? La oss starte denne delen av boka med å slå fast en ting: Årsaken til at det bedrives forskning er i bunn og grunn enkel, og bunner i at vi ønsker å lære mer om den verden vi alle er en del av. I vår sammenheng har vi videre inn skrenket perspektivet til å gjelde forskning på samfunnsmessige eller sosiale forhold. Vi holder altså naturen og dens mysterier utenfor. Vårt formål er å fokusere på forhold der mennesker inngår som aktive aktører. Men selv en slik innsnevring av fokus gir rom for en nær sagt uendelig rekke av pro blemstillinger: eksempelvis hvorfor det er så fa kvinnelige ledere, hvorfor noen stemmer Fremskrittspartiet og andre Rød Valgallianse, mens atter an dre ikke stemmer i det hele tatt. Eller hvorfor noen gifter seg, noen skilles og noen velger å leve alene, eller hvorfor noen velger å studere økonomi mens andre ønsker å bli førskolelærere. For å fa mer kunnskap om slike forhold kreves det i mange tilfeller forsk ning. 63
Nå kan det sikkert innvendes at vi kan fa kunnskap om mange av de pro blemstillingene som er nevnt ovenfor uten nødvendigvis å forske på dem. Og det er selvfølgelig riktig. Men andre ganger stiller vi såpass strenge krav til den kunnskap vi skal bruke, eksempelvis med tanke på sikkerhet og nøy aktighet, at det kanskje ikke er tilstrekkelig å basere seg på egen erfaring el ler diskusjoner i vennekretsen.
Så hva betyr det egentlig å forske? Et vanlig svar på hva forskning innebærer er at det i hovedsak dreier seg om å se nærmere på forholdet mellom to eller flere variabler. La oss forsøke å klargjøre hva dette egentlig innebærer. Med en variabel forstår vi en egenskap eller et karakteristikum ved en ting (oftest et individ) som varierer. Eller noe mer presist: som kan anta to eller flere verdier. For eksempel kan vi si at variabelen (en persons) «posisjon på arbeidsmarkedet» kan anta to ulike verdier, nemlig 1) i arbeid, eller 2) arbeidsløs. Variabelen «utdanning» kan derimot anta iallfall tre verdier, nemlig 1) grunnskole, 2) videregående skole, og 3) universitet/høgskole. Det å se nærmere på forholdet mellom variablene «utdanning» og «posi sjon på arbeidsmarkedet» gir oss en god illustrasjon på hva forskning kan være. Ofte snakker vi om empiriske undersøkelser eller forskning. Det innebæ rer gjerne ytterligere et element, nemlig at vi også er i stand til å male de va riablene vi ønsker å se nærmere på. Vi skal se nærmere på noen av de utfor dringer vi møter når vi ønsker å måle variabler i et senere kapittel. La oss i denne omgang nøye oss med å fastslå at de kan være betydelige, iallfall der som vi med måling mener å anføre tallstørrelser til de variabler vi ønsker å måle. For hvordan tallfeste størrelsen på eller mengden av noe som i utgangs punktet synes å unndra seg alle forsøk på tallfesting? Kan vi for eksempel tenke oss at fenomener som «angst» eller «fremmedgjøring» kan måles i den forstand at vi kan sette tall på mengden av angst eller fremmedgjøring et menneske bærer på? Mange mener ja, og det metodiske kunstgrepet vi benytter oss av i slike tilfeller kalles «operasjonalisering». Kort forklart (vi kommer tilbake til operasjonaliseringsproblematikken senere) dreier dette seg om å skille mellom to typer av definisjoner på begreper eller variabler, nemlig det vi kaller for den teoretiske definisjonen av et begrep (leksikondefinisjonen), og den operasjo nelle definisjonen av det samme, som egentlig ikke er noe annet enn en an visning på hvordan vi skal gå fram for å måle vår teoretisk definerte variabel. 64
La oss prøve å illustrere prosessen gjennom å ta for oss variabelen «intel ligens». Mens den teoretiske definisjonen av intelligens er det vi i alminne lighet mener med intelligens, er den operasjonelle definisjonen anvisningen på hvordan vi skal gå fram for å måle en persons intelligens, eksempelvis ved å bruke en Stanford-Binet test. Testresultatet blir dermed et mål på ved kommendes intelligens.
Med referanse til mange av de synspunkter vi har gjengitt under vår innle dende vitenskapsteoretiske diskusjon er det neppe overraskende at ikke alle slutter seg til ovenstående. Tvert om er det mange som i sterkt kritiske or delag omtaler dette som «Operasjonaliseringens Tyranni» og påpeker faren for innsnevring av både perspektiv og muligheter gjennom å underlegge seg denne type krav. Ikke alle de fenomener vi ønsker å undersøke kan måles. Det blir fortsatt påstått at noen av de mest sentrale variabler vi har innenfor sosialvitenskapene, som for eksempel «kultur», «kjærlighet», «hat» eller «sosial, struktur» aldri har blitt (meningsfullt) operasjonalisert. Men de er likevel særdeles interessante å undersøke. Spørsmålet blir da: Kan undersøkelser omkring variabler som ikke operasjonaliseres og måles (kvantitativt) likevel kalles forskning? Det er langt på vei et vitenskapsteoretisk spørsmål, hvor svaret er temmelig avhengig av hvem det stilles til. Vi kommer iallfall tilbake til denne og liknende pro blemstillinger under vår diskusjon rundt kvantitative og kvalitative metoder i kapittel 17. La oss imidlertid her og nå - uavhengig av vitenskapsteoretisk stand punkt - likevel sluttføre resonnementet om forskning og variabler. Vi har altså påstått at forskning i mange tilfeller dreier seg om å undersø ke forhold mellom to eller flere variabler, og vi brukte forholdet mellom ut danning og posisjon på arbeidsmarkedet som illustrasjon. Det vi imidlertid ikke sa noe om, var hva som karakteriserte dette be stemte forholdet. Noen ganger kan vi - før vi faktisk har undersøkt det driste oss til å si noe om hvordan vi tror et bestemt forhold er. Vi sier da at vi har en hypotese om hvordan variablene i dette bestemte tilfelle forholder seg til hverandre. I vårt eksempel vil det ikke være urimelig å tro at det er en sammenheng mellom utdanning og posisjon på arbeidsmarkedet på den be stemte måten at færre med universitets- eller høgskoleutdanning er arbeids løse enn dem med bare grunnskole. Dette ville altså være vår hypotese. Sli ke hypoteser kommer ikke bare «drivende på en fjøl», men er resultat av at vi allerede har en del kunnskaper om dette som resultat av tidligere forsk ning, avisreportasjer osv. Det er også viktig å merke seg at vi i hypotesen vår ikke sier noe om årsak og virkning. Selv om de fleste av oss er vant til å ten-
65
ke i årsak/virkning-sammenhenger, betyr ikke dette at vi som samfunnsfor skere automatisk kan trekke konklusjoner om årsak/virkning hver gang vi har fatt bekreftet en hypotese om en bestemt sammenheng mellom varia bler. Også dette vil vi komme tilbake til. Et siste punkt når vi først er inne på forholdet mellom variabler er å trek ke inn betegnelsene uavhengig og avhengig variabel. Som forklaring på dis se betegnelsene kan vi si at dersom vi kommer fram til at det er et årsak/virkning-forhold mellom to variabeler, så er det den uavhengige vari abelen som er årsaksvariabelen. For nok en gang å bruke eksemplet med ut danning og posisjon på arbeidsmarkedet: Dersom vi tror at posisjon på ar beidsmarkedet er resultat av utdanning (og ikke omvendt), blir utdanning i dette tilfellet uavhengig variabel og posisjon på arbeidsmarkedet avhengig. Det er imidlertid viktig å understreke at vår vurdering innskrenker seg til dette eksemplet. I en annen sammenheng kan utdanning gjerne være av hengig variabel. Så langt i denne innledningen har vi forsøkt å se nærmere på hva som kjennetegner det vi vanligvis kaller forskning, og vi har introdusert en del begreper og problemstillinger som blir gjenstand for nærmere drøfting ut over i boka. Og for nok en gang å understreke poenget: Ikke alle vil være enige i at forskning nødvendigvis må beskrives slik vi har gjort det her. Vi avsluttet vitenskapsteoridelen med blant annet å understreke viktighe ten av å utvikle teorier som kan hjelpe med å gi oss en dypere forståelse av det vi observerer eller registrerer. Det er ikke til å komme fra at sentralt i et hvert forskningsarbeid står nettopp ønsket om ikke bare å samle inn data, men også å utvikle en stadig bedre forståelse av de fenomener vi arbeider med. For å klare dette er vi avhengig av teorier.
Men hva er egentlig en teori?
Form og innhold i en teori kan variere mye. Det er for eksempel ikke uvan lig, selv blant forskere, å bruke begrepet «teori» omtrent på samme måte som i dagligtalens betydning av ordet, altså noe i likhet av «formening», «idé» eller liknende. Stiller vi imidlertid strengere krav til definisjonen, kan vi si at en teori be står av et sett av hypoteser som henger sammen i et deduktivt system. Det vil si at hypotesene er ordnet på en slik måte at fra noen hypoteser som tjener som premisser kan alle de andre hypotesene avledes logisk. Hypotesene i en teori danner følgelig et hierarkisk system der hypotesene på det høyeste nivå et er de som tjener som premisser i det teoretiske systemet, mens de på det la veste nivået fremstår som logiske konklusjoner. Det er videre slik at hypote sene på de høyere nivåene (Hl, H2) er nokså generelle i formen, mens de på
66
de lavere nivåene (H3, H4 osv.) er langt mer konkrete og oftest med et be grenset gyldighetsområde både i tid og rom. Et klassisk eksempel (som vi så vidt berørte tinder våre avslutningskommentarer i del I) er den teori Emile Durkheim fremsatte for å forklare selvmord ut fra et individs sosiale situasjon. La oss prøve å illustrere hva vi mener med en teori i klassisk durkheimsk forstand gjennom å benytte et sentralt organisasjonspsykologisk begrep, nemlig, jobbtilfredsstillelse, som eksempel. Vi begynner med en nokså ge nerell hypotese og prøver etter hvert å bli mer og mer konkrete, samtidig som vi passer på at hypotesene på lavere nivåer hele tiden er logisk avledet fra de på høyere nivåer. Hl: Mangel på ansvar for egen jobbsituasjon minsker sjansen for at en ar beidstaker vil være tilfreds i jobben.
H2: Ønsket om ansvar er større blant dem med høy enn blant dem med lav utdanning.
H3: Utilfredsheten over manglende ansvar vil dermed være større i en høyteknologibedrift enn i en tradisjonell industribedrift. H4: I bedriften Microsensor har mer enn 80 % av de ansatte utdanning på universitets- eller høgskolenivå, mens den tilsvarende andelen i Østlands-Is er under 30 %. H5: Derfor er utilfredsheten større i Microsensor enn i Østlands-Is. Denne teorien tilfredsstiller ikke bare kravene til et deduktivt system fordi H3 avledes av Hl og H2, mens H5 igjen avledes av H3 og H4, men vi ser også at de tre første hypotesene er generelle i formen, mens de to siste har et klart avgrenset gyldighetsområde.
Hvorfor teori?
Bortsett fra hva vi har anført ovenfor finnes det mange synspunkter på hvor for teori er viktig. I denne sammenheng vil vi betone teoriens viktighet som forskningsinstrument, og i den sammenheng kan vi - litt forenklet - si at en teori tjener iallfall to forskningsmessige formål:
1 Teori danner utgangspunkt for problemstilling og forskningsopplegg. 2 Teori utgjør referansen for tolkningen av de resultater undersøkelsen gir.
67
La oss tenke at vi ønsker å gjennomføre en undersøkelse om atferd blant norske ledere. Det foreligger en teori om skandinavisk lederatferd som sier at skandinaviske ledere er konsensusorienterte - at de altså gjerne ser at det er bred enighet om for eksempel beslutninger som skal fattes. Med ut gangspunkt i denne teorien velger vi så å undersøke i hvilken grad norske ledere forholder seg til konflikter i organisasjonen. Med utgangspunkt i te orien vil vår hypotese være at norske ledere prøver å unngå konfliktfylte si tuasjoner. For å undersøke om dette er tilfelle, kan vi enten spørre et utvalg ledere, eller vi kan observere dem i arbeid. Dersom det nå viser seg at et flertall av de lederne vi undersøker svarer eller viser at de forsøker å unngå å skape konflikter som resultat av beslutninger som de er satt til å ta, vil vi altså med referanse til teorien om konsensusatferd - kunne tolke dette som et «særtilfelle» av konsensusorientert atferd. Med andre ord har teorien både gitt oss anvisning om et område som det kan være interessant å undersøke nærmere, og den har gitt oss en referanse for hvordan vi skal forstå og for klare de resultatene vi fant. I en gitt undersøkelsessituasjon vil vi som oftest kunne ta utgangspunkt i et allerede utviklet teoretisk materiale. (Unntak finnes riktignok. Noen ganger står vi overfor forskningsoppgaver der det hersker utpreget «teorifattigdom». Andre ganger - ofte der vi nærmer oss det vi tidligere har defi nert som «utredning» - vil vi tjene på å være mer pragmatiske eller praktis ke i vår søken etter forklaringer.) Ofte vil det nok være slik at det kan være nødvendig å sammenstille ulike teorier eller teoretiske perspektivet, men ut fra dette kan vi utvikle de mo deller eller hypoteser som vi så ønsker å prøve ut i undersøkelsen. Den teo retiske forståelsen vi på denne måten kommer fram til virker styrende på hele den resterende delen av undersøkelsesarbeidet, og det empiriske mate rialet (resultatene) kan i siste instans avkrefte, modifisere eller styrke tiltroen til den teori som var utgangspunktet.
Teori og modell Det kan ofte være vanskelig å skille mellom teorier og modeller. Mens man i noen metodebøker, for eksempel Ilstad (1981) betrakter modeller som hjelpemidler for teoribygging, ser andre, for eksempel Holme og Solvang (1995), modellene som presiseringer av teorienes innhold, mens atter andre synes å bruke begrepene teori og modell som analoge. Eksempelvis kaller Hernes (1980) Durkheims teori - som vi har beskrevet ovenfor - for en «verbal modell».
68
Hvorvidt det er fruktbart å skille mellom teorier og modeller får bli opp til den enkelte å vurdere. Sikkert er det iallfall at de har mange likhetstrekk: - De er begge abstraksjoner av virkeligheten.
- De er begge forenklinger av virkeligheten. - De tjener begge - i forskningssammenheng - tilnærmet samme formål.
Sammenfatningsvis kan vi si at både teorier og modeller utgjør verktøy som innenfor samfunnsvitenskapene hjelper oss med å løse (praktiske) proble mer. Evensmo (1991) gir for eksempel følgende definisjon av en modell: En modell innenfor de økonomisk-administrative fagområder er en «formålsrettet virkelighetsabstraksjon» for å løse økonomisk-administrative proble mer. Modellen konstrueres ut fra de deler av den praktiske virkelighet som modellkonstruktøren mener er av betydning for det problem som skal lø ses. Alt uvesentlig skrelles bort. Modellen anvendes deretter til å skaffe inn sikt og beslutningsgrunnlag for praktisk handling. Den samme virkelighet kan gi grunnlag for utvikling av forskjellige mo deller, først og fremst avhengig av om formålet med modellen er å: - beskrive virkeligheten - forklare virkeligheten - forutsi hendelser i virkeligheten - foreta beslutninger som endrer virkeligheten.
Enhver modell må videre være et kompromiss mellom realisme og håndterbarhet. Den må være enkel og oversiktlig uten å bli virkelighetsfjern. Figur lig kan dette poenget illustreres som i figur 8. Hva figur 8 forteller oss, er nettopp at den «optimale» modellstrukturen verken er for enkel eller for raffinert. «Idealet» er den modellen som til en beskjeden kostnad har stor nytteverdi. Et forsøk på å knytte teorier og modeller an til selve forskningsprosessen kan gjøres slik Riley (1963) viser i figur 9. Som vi ser, tar forskningsprosessen sitt utgangspunkt i teorier og model ler av virkeligheten (Boks A). Her kan det være snakk om alt fra relativt vage 69
modell
Figur 8
antakelser til teorier formulert i et deduktivt system å la Durkheim. Iallfall bestemmer teoriene og modellene hvilke fakta vi ønsker å undersøke - noen ganger også hvilke spørsmål vi ønsker å stille - og de kan også angi hvilke metoder og forskningsstrategier som det vil være aktuelt å benytte. Dette forutsetter imidlertid at for eksempel teorien er utviklet fram til et sett av temmelig konkrete påstander - hypoteser - om den virkelighet vi ønsker å undersøke. De fleste lærebøker i forskningsmetode deler gjerne forskningsprosessen
Figur 9 70
i to, tilsvarende de arbeidsoperasjoner som foregår på henholdsvis teori- og empiriplanet. Det er imidlertid viktig å være klar over at forskerens faktiske arbeidsmåte innebærer en stadig veksling mellom teori og empiri slik det er forsøkt illustrert ved et «flow-chart» over forskningsprosessen i figur 10. Teori
Empiri
Figur 10
Noe skarpt skille mellom teori og empiri eller for den saks skyld teori og praksis eksisterer ikke i den forskningsmessige hverdag. Teori er nyttig og verdifull bare dersom den fører til bedre praksis, eller som den franske øko nomen og nobelprisvinneren Maurice Allais sier det: Dersom teorien ikke kan hjelpe oss til bedre forskningsmessig praksis, er den bare en intellektu ell øvelse som er kunstig og uten verdi fra et forskningsmessig synspunkt.
Stikkord til kapittel 8 variabel sammenheng mellom variabler teori modell 71
Øvingsoppgave til kapittel 8 Vi påsto i dette kapitlet at teorier og modeller tjente omtrent samme forsk ningsmessige formål, nemlig det å beskrive virkeligheten ved å trekke ut de vesentligste trekk (variabler) ved det fenomen vi ønsker å undersøke. Ne denfor er det tegnet inn en enkel modell for posisjon på arbeidsmarkedet (figur 11).
Utdanning - lav - høy
Posisjon på arbeidsmarkedet - i fast arbeid - arbeidsløs
Figur 11
a) Vi har tidligere påstått at et saksforhold (her: posisjon på arbeidsmarke det) aldri kan forklares med henvisning til bare en variabel (her: utdan ning). Oppgaven blir derfor å utvide modellen med andre variabler med betydning for posisjon på arbeidsmarkedet. b) Forsøk å lage modeller som fremstiller følgende saksforhold: - kvinners yrkesvalg - valg av utdanning
Litteratur å gå videre med Hellevik, O.: Forskningsmetode i sosiologi og statsvitenskap, Universitets forlaget, 1993. Holme, I.M. og B.K. Solvang: Metodevalg og metodebruk, TANO, 1995.
Kapittel 9
Strategi, design og metodevalg: tre stadier i forskningsprosessen Forskningsstrategien Hva er egentlig strategi? Problemer forbundet med å gi en definisjon av strategibegrepet henger sammen med at «strategi» ikke er noe entydig og generelt begrep. Men i de aller fleste sammenhenger blir strategi knyttet til planer og planlegging. Strategi er i denne sammenheng: En bevisst hand ling eller retningslinje for å håndtere en gitt situasjon (Roos og von Krogh, 1994). Beveger vi oss fra en slik konseptuell definisjon av strategibegrepet og over i en mer prosessorientert, kan vi tilføye at strategi også kan ses på som iverksettelsen av en rekke planlagte handlinger. Dersom vi videre betrakter strategi som en prosess, kan vi hevde at den ne prosessen har et startpunkt og et mål, og at disse - dersom det nå var et forskningsprosjekt som utgjorde prosessen - vil være henholdsvis problem stillingen og resultatet. Når vi står overfor en forskningsoppgave, kan selvsagt en lang rekke stra tegiske valg være tenkbare. De amerikanske samfunnsforskerne Runkel og McGrath (1972) opererer med fire ulike strategiske muligheter (som kan brukes alene eller i kombinasjon) basert på fire ulike forskningsmessige rammer eller forutsetninger som vi i en gitt situasjon må forholde oss til. De strategiske alternativene som er vist i oversikten nedenfor, er ikke ut tømmende, men de gir likevel klare indikasjoner på ulike valgmuligheter:
Forutsetning eller ramme
Strategisk valg
Forskningen skal foregå i et «naturlig miljø»
«Feltstudier» i form av observasjon eller eksperiment
Forskningen skal foregå i et «kunstig miljø»
Laboratorieeksperiment
Forskningen er ikke avhengig av bestemte rammebetingelser
Surveys - for eksempel postale spørreunder søkelser
Empiriske undersøkelser er ikke nødvendig
Teoriutvikling
73
Med dette som utgangspunkt kan vi videre hevde at det i all forskning inn går tre likeverdige elementer: - en populasjon (P) - som gjør noe (A for atferd) - på et tidspunkt/sted (K for kontekst) Alt annet likt vil det alltid være et forskningsmessig mål å forsøke å maksi mere:
- generaliserbarheten når det gjelder populasjonen (P) - presisjonen når det gjelder måling og kontroll av de faktorer som heng er sammen med den type atferd vi er interessert i (A) - realismen, sett fra deltakernes synspunkt, i den kontekst (K) der atferden registreres
Problemet er imidlertid at den ene strategi som fører til slik ønsket maksi mering av disse tre forhold neppe finnes. Tvert om er det slik at ethvert strategisk valg som gir maksimal uttelling på ett av elementene har en slem tendens til å være langt fra tilfredsstillende på de to andre. La oss ta felteksperimentet som eksempel (altså et undersøkelsesopplegg som foregår ute i felten). Det er liten tvil om at et felteksperiment (eksem pelvis gjennomført i et kjøpesenter) finner sted i omgivelser som sikkert oppleves som naturlige og virkelige av deltakerne i eksperimentet. Kravet til «realisme» i forskningsopplegget innfris således med glans. Det samme gjel der imidlertid ikke kravet til generaliserbarheten for denne populasjonen. Funn som er resultat av en undersøkelse gjennomført i ett kjøpesenter ba sert på de kundene som tilfeldigvis befant seg der den dagen, kan neppe ge neraliseres, det vil si overføres til andre situasjoner. Grunnen til dette skal vi komme nærmere inn på i kapitlet om utvalg, men kort fortalt bunner det i at vi ikke vet om de kundene vi på denne måten undersøkte likner på «gjennomsnittskunden», eller har spesielle kjennetegn eller særtrekk. Siden vi heller ikke kan sies å ha full kontroll med alle faktorer som kan tenkes å påvirke atferden, for eksempel i kjøpssituasjonen, må vi nok innse at vi ikke har klart å maksimere mer enn ett av de tre elementene beskrevet over. For en som finner dette lite tilfredsstillende, ville kanskje et annet strate gisk valg være å foretrekke. La oss derfor se litt nærmere på hva vi kan få til gjennom et såkalt survey-opplegg. Som det fremgår av modellen over, ba serer dette strategiske valget seg på forutsetningen om at den atferd forske ren ønsker å måle ikke er avhengig av at målingen foregår under bestemte 74
rammebetingelser. Under en slik forutsetning kan for eksempel måling av kjøpsatferd like gjerne foregå hjemme hos personen (for eksempel i form av et personlig intervju) og altså ikke nødvendigvis der kjøpet foregår, altså i butikken. Slik sett kan forskeren som velger denne strategien, selv bestem me hvem, hvor mange og hvordan han vil velge ut dem han ønsker å un dersøke og således maksimere (P). Han er samtidig nødt til å innrømme at han har dårlig kontroll. Kan han for eksempel stole på at en respondent som hevder at han eller hun alltid kjøper miljømerkede varer virkelig gjør dette? Så hva gjør vi? For nok en gang å lene oss til Runkel og McGrath, så hevder disse: «Methodological discussions should not waste time arguing about which is the right strategy, or the best one; they are all poor in an absolute sense.» Løsningen blir derfor å akseptere at «the one best way» ikke finnes, men at det å kombinere flere ulike strategier som kompenserer hverandres svak heter sannsynligvis er veien å gå. Forskningsprosessen innebærer da også en rekke strategiske veivalg. Samtlige medfører minst ett nesten uløselig dilemma: nemlig ønsket om å maksimere to, av og til tre innbyrdes motstridende krav eller ønsker. Konsekvensen av dette blir at det ikke er noe som heter «feilfri» forsk ning. All forskning er belemret med feil og svakheter. I et forsøk på å redu sere slike feil så mye som mulig har det blitt utviklet, prøvet og videreutvi klet ulike metoder eller prosedyrer for praktisk forskningsvirksomhet. I det følgende skal vi se nærmere på en del slike forskningsmetoder. Vi vil imidlertid ikke bare redegjøre for konkrete metoder for innsamling og ana lyse av data. Vi vil også vie betydelig oppmerksomhet til noen mer overgripende eller fundamentale problemer forbundet med å gjennomføre under søkelsen. Uansett, med nok et Runkel og McGrath-utsagn, tar vi trøstig fatt på sel ve «forskningsprosessen» i håp om at noe av det vi fokuserer på kan være med på å redusere risikoen for «dårlig forskning»: «Det er ikke noe som he ter for mye forskning. Det er heller ikke noe som heter feilfri forskning, men dårlig forskning er verre enn ingen forskning.»
Forskningsdesignet - fra strategiske overveielser til taktiske løsninger Enkelt sagt er forskningsdesignet en mer eller mindre detaljert plan for hvordan vi vil sikre oss at våre forskningsmessige mål nås. Forskningsdesig net inneholder både strategiske overveiinger og taktiske beslutninger. Det finnes dessverre ikke noen idealoppskrift på et forskningsdesign. Designet, 75
eller planen, vil variere med problemstilling, og med tid og ressurser vi har til rådighet. Dessuten vil vi, mens vi arbeider med undersøkelsen, ofte være tvunget til å revidere vårt opprinnelige design i takt med økende innsikt i det fbrskningsproblem vi arbeider med. Det vil derfor være en sjeldenhet at virkelighetens forskningsdesign ser ut som lærebøkenes idealmodeller. Det betyr ikke at vi skal ta lett på denne delen av undersøkelsesprosessen. Selv om idealoppskriften mangler, tvinger likevel arbeidet med forskningsdesignet oss til å tenke igjennom alternative fremgangsmåter og alternative løs ninger, og sikrer på den måten antakelig et bedre og mer økonomisk un dersøkelsesopplegg enn om vi bare «hadde kastet oss ut i det». Vi nevnte lærebokmodeller. Selvsagt sier lærebøkene en hel del om forsk ningsdesign, og det de sier vil være et naturlig utgangspunkt for vårt eget arbeid med vårt eget undersøkelsesopplegg. Det er likevel viktig å ha in mente at lærebøkenes «oppskrifter» ikke alltid lar seg følge i praksis. Mange lærebøker i metode (for eksempel Churchill, 1991) opererer med tre idealtyper:
Eksplorativt design: gjerne anbefalt anvendt når problemstillingen er uklar, forkunnskapene begrensede, og hvor vi ikke er i stand til å stille opp klare hypoteser Deskriptivt design: brukes først og fremst når oppgaven er å beskrive varia bler og sammenhenger mellom disse. Baseres ofte på relativt klare hypote ser om hvordan slike sammenhenger ser ut Kausalt design: benyttes når vi ønsker å måle effekter av ulike stimuli, det vil si årsak/virkning-forhold.
Churchill sammenlikner arbeidet med forskningsdesignet med det arbeid arkitekten gjør når det skal bygges et hus. Arkitektens tegninger viser hvor dan planløsningen skal være og hvordan ulike deler av huset skal henge sammen. Det går an å bygge et hus uten arkitekttegninger også, men de fleste vil være enige om at resultatet av et slikt prosjekt er svært usikkert. På samme måte er det med undersøkelser. Man kan nok sette i gang et prosjekt uten å ha vurdert helhet og mål, men sluttresultatet blir i slike tilfeller oftest dårlig. Som et felles utgangspunkt for valg av forskningsdesign vil det være for målstjenlig å stille et sett av spørsmål: Hvor mye vet vi allerede om det området vi skal undersøke? Har andre forsket på liknende problemstillinger? Hva slags design benyttet de? Hvilke resultater kom de fram til? Hva slags spørsmål tar denne undersøkelsen sik76
te på å gi svar på? Hva slags undersøkelsesopplegg vil være best egnet i net topp dette tilfellet? Det vi har kalt strategiske overveielser dreier seg altså om hva slags under søkelsesopplegg vi vil være tjent med, mens taktiske beslutninger tas når un dersøkelsesopplegget er bestemt og vi skal forholde oss til beslutninger som har å gjøre med hvilke spørsmål vi skal stille, hvem vi skal spørre, hvor mange vi skal spørre osv. Avhengig av problemstilling, tidligere kunnskap på feltet, undersøkelsens mål, samt tid og ressurser vi har til disposisjon, har vi som nevnt ovenfor prinsipielt valget mellom tre (idealjtyper av forskningsdesign. I den videre fremstillingen vil vi primært konsentrere oss om eksplorerende og (spesielt) deskriptive design, mens såkalte kausale design i mindre grad vil bli berørt. Årsaken til dette er for det første at de aller fleste sam funns-, organisasjons- og markedsundersøkelser gjennomføres innenfor rammen av et eksplorativt eller (særlig) et deskriptivt design (eller som kom binasjon av disse). For det andre møter samfunnsforskeren, i motsetning til naturvitenskapsmannen, på en del særskilte problemer dersom han ønsker å gjennomføre et «sosialt eksperiment»innenfor rammen av et kausalt design. Dette av grunner vi allerede har berørt. Lovmessige sammenhenger mellom sosiale fenomen lar seg sjelden avdekke med like høy grad av presisjon som naturvitenskapelige lovmessigheten Dette henger naturligvis sammen med at samfunnsforskeren fortrinnsvis beskjeftiger seg med mennesker, og men nesker har en tendens til å oppføre seg «lovstridig». Dessuten vil vi uhyre sjelden være i stand til å holde alle andre variabler enn akkurat dem vi er in teressert i å studere under kontroll. Dette henger igjen sammen med at svært få problemer innenfor sam funnsvitenskapene er av en type som på en formålstjenlig måte lar seg un dersøke under såkalte kontrollerte «forsøksbetingelser», det vil si i et labo ratorium. (For øvrig skal ikke ordet laboratorium tas altfor bokstavlig. I vår sammenheng peker det ganske enkelt på at undersøkelsen finner sted i om givelser vi til en viss grad kan kontrollere, og som innebærer at de som er med på eksperimentet er trukket ut av sin naturlige situasjon.) Det vanligste eksperimentelle design er før og etter-måling med en kon trollgruppe. Det er med andre ord nødvendig at vi ved gjennomføring av et eksperiment deler forsøkspersonene i to grupper (helt tilfeldig). Den ene gruppen utsettes for eksperimentet (stimulusen), den andre ikke. Etterpå kan man måle forskjeller mellom gruppene i holdning, kunnskap eller at ferd. Vanligere - særlig innen markedsforskningen - er de såkalte naturlige ek sperimenter eller felteksperimenter. Denne typen eksperimenter (som strengt tatt knapt kan kalles et eksperiment) karakteriseres ved at den som 77
foretar undersøkelsen begrenser sin aktivitet til å foreta de nødvendige må linger. Et eksempel på et meget enkelt naturlig eksperiment kan være at man etter en reklamekampanje foretar en måling av kjennskapet til det pro dukt det ble reklamert for. Et utvidet naturlig eksperiment vil det være der som vi før reklamekampanjen måler kjennskapet, og så etter kampanjen må ler kjennskapet på nytt hos de samme menneskene. Fordelen ved det naturlige eksperiment eller felteksperimentet er net topp at undersøkelsespersonene befinner seg i sin naturlige situasjon. Ulempen er like åpenbart at det er vanskelig, for ikke å si umulig, å kon trollere for alle andre forhold som for eksempel kan ha innvirkning på folks kjennskap til et produkt.
Det norske arbeidslivseksperimentet
Det kanskje best kjente «naturlige eksperimentet» fra norsk organisasjonsforskning er antakelig de såkalte «eksperimenter i industrielt demokrati» gjennomført som et samarbeidsprosjekt mellom LO og NAF (tilsvarer nå værende NHO) i 1960- og 70-årene. Her gjennomførte man en rekke såkalte «feltforsøk» der forskerne valgte ut ulike bedrifter fra bestemte bransjer, hvoretter de på ulike vis omformet betingelsene for personlig medvirkning i arbeidet. Deretter ønsket de å måle de virkninger disse forandringene førte til med hensyn til de ansattes grad av tilfredshet eller misnøye med egen arbeidssituasjon, med grad av li kegyldighet eller konstruktiv interesse, samt når det gjaldt kommunikasjonsnivå, stabilitet og evne til problemløsing og utviklingsarbeid. Produk tiviteten måtte også måles før og etter, siden ingen av de deltakende parter (arbeidsgiver- og arbeidstakersiden) ville akseptere løsninger som kunne føre til lavere produktivitet. Disse eksperimentene har både teoretisk og praktisk, og ikke minst poli tisk, satt spor etter seg. (Resultatene hadde blant annet betydelig innvirk ning på innholdet i den norske Arbeidsmiljøloven.) Vi må likevel kunne si at fra et metodisk synspunkt lider disse - som de fleste andre felteksperimenter - under til dels betydelige svakheter. Det gjelder både utvalget av bedrifter (få og valgt etter prinsippet om «hvem som ville være med»), mangelen på kontrollgruppe, og manglende muligheter til å kontrollere forhold utenfor eksperimentets design som kunne tenkes å påvirke resultatene. Ovenstående er i sum antakelig tilstrekkelig til å illustrere vanskeligheter vi møter ved valg av kausale design i samfunnsforskning.
78
Det eksplorative design
\
Vi anførte ovenfor at valg av fbrskningsdesign langt på vei er et resultat av svarene på en rekke spørsmål som danner et slags felles utgangspunkt for undersøkelsesprosessens startfase. Dersom svarene på disse spørsmålene for eksempel er at: «Vi vet lite eller ingenting om det problemområdet vi er i ferd med å gi oss i kast med. Lit teratursøk har ikke dokumentert at liknende problemstillinger har vært gjenstand for andres undersøkelser.» Og dersom de spørsmål undersøkelsen tar sikte på å kaste lys over, er typiske «hvorfor-spørsmål» - da er det mye som tyder på at et såkalt «eksplorerende» design kan være det mest formåls tjenlige. Styrken ved dette designet er blant annet at det nettopp tar sikte på å gi oss ideer og innsikt i problemstillinger som ikke er presist formulerte, og hvor kunnskaps- og kjennskapsnivået er lavt. Sånn sett egner eksplorative undersøkelsesopplegg seg godt som forstudier for deskriptive studier gjen nom å gi oss den kunnskap som kreves for å kunne formulere hypoteser som utgangspunkt for mer systematiske, ofte kvantitative undersøkelser. Det betyr ikke at eksplorerende undersøkelser ikke kan stå på egne bein. Vi vil senere, i kapitlet om kvalitative undersøkelser, beskrive nærmere ulike typer av datainnsamlingsmetoder som også gjerne kan kalles eksplorative. Dybdeintervjuer, gruppesamtaler og ulike projektive teknikker er eksempel på slike.
Det deskriptive design
Den klart vanligste formen for undersøkelsesdesign er det deskriptive. Svært mye samfunns-, markeds- eller organisasjonsforskning tar nettopp sikte på så presist som mulig - å beskrive et utvalg undersøkelsespersoner (ansatte i en bedrift, velgere, forbrukere, studenter) med hensyn til egenskaper som kjønn, inntekt, utdanning, forbruk av en bestemt vare osv. Eller å anslå andelen av et utvalg med hensyn til et bestemt atferdsmøn ster, for eksempel hvor mange husstander eller personer som så nyhetssen dingen på TV2 sist lørdag. Dessuten egner deskriptive opplegg seg hvis vi videre ønsker å kombine re kunnskaper om forbrukernes egenskaper med kunnskaper om atferd. Ek sempelvis dersom vi ønsker å vite hvor stor andel av dem som så nyhetssen dingen på TV2 sist lørdag som var kvinner, eller om det er noen forskjell på dem som regelmessig ser TV2-nyhetene og dem som holder seg til NRK (men som kan ta inn TV2), osv. Vi vil i et senere kapittel diskutere ulike undertyper av deskriptive design nærmere (og der særlig konsentrere oss om den såkalte «surveymetoden»,
79
det vil si undersøkelser der antallet personer som inngår er relativt stort, og der vi oftest baserer oss på verbal informasjon). Vi vil i denne omgang der for nøye oss med kort og stikkordmessig å sammenfatte de tre undersøkelsesdesign med hensyn til bruksområde og kjennetegn ved hjelp av neden stående. Som grunnregel for all (god) forskning må vi uansett kunne hevde Design Eksplorerende
Deskriptivt
Bruksområde
Kjennetegn
Formulere problemstillinger
Litteratursøk
Presisere begreper
Casestudier
Utvikle hypoteser
Gruppesamtaler
Kunne «gå i dybden», gi innsikt og forståelse
Dybdeintervjuer
Beskrive karakteristika ved grupper
Utvalgsundersøkelser (surveys)
Estimere andel individer med visse egenskaper eller bestemt atferd
Panelstudier
Predikere bestemte utfall
Kausalt
Fremskaffe belegg for årsak/virkningeffekter mellom variabler
Laboratorieeksperiment Felteksperiment
at det skal være sammenheng mellom teori/perspektiv, problem og frem gangsmåte. I tillegg vil vi alltid stå overfor praktiske begrensninger og mu ligheter bestemt av ressurssituasjon og tilgang til det forskningsfelt vi øn sker å arbeide innenfor. En forskningsstrategi må derfor - med dette som utgangspunkt - søke å analysere hvilke grunnleggende valg vi står overfor i et konkret prosjekt, samt hvilke konsekvenser de ulike valg fører med seg. Forskningsdesignet skal nettopp være svaret på denne utfordringen. Vi anførte innledningsvis at forskningsdesignet kan sammenliknes med en detaljert plan for hvordan vi ønsker å gjennomføre et konkret prosjekt. Vi understrekte imidlertid også at en slik forhåndslagt «masterplan» sjelden lar seg gjennomføre uten betydelige modifikasjoner, blant annet som resul tat av nødvendige revurderinger etter hvert som vi lærer oss stadig mer om den problemstilling vi har satt oss fore å undersøke. Et eksempel kan illustrere dette: For en tid siden ble det gjennomført en undersøkelse der forskerne ønsket å se nærmere på personer som hadde vært deltakere i et utvekslingsprogram for skoleelever. Formålet med denne undersøkelsen var å påvise hvorvidt et
80
utvekslingsskoleår hadde medført konsekvenser for de deltakende skoleele vene som fikk betydning for livet deres senere, for eksempel for karriere, so sial status, personlighet osv. En «analyse» av det forskningsopplegget som ble anvendt, avslører at forskerne beveget seg gjennom en rekke stadier og kombinerte flere ulike design og datainnhentingsmetoder på en måte som slett ikke gir noe «strømlinjet» inntrykk å la lærebokmodellene.
1 Eksplorativ fase Innledningsvis definerte og identifiserte forskerne et utvalg bestående av 20 respondenter fra hvert av de to landene utvekslingselevene kom fra. Disse førti tidligere utvekslingselevene ble dybdeintervjuet. Disse intervjuene var først og fremst ment å skulle gi forskerne innsikt nok til å kunne identifise re sentrale problemstillinger, bestemme kategorier og utvikle hypoteser. 2 Deskriptiv fase Med bakgrunn i den eksplorative fasen ble spørreskjemaer beregnet for en større surveyundersøkelse utviklet og sendt til det endelige utvalget trukket ut fra de to elevgruppene i de to landene. 3 Kausal fase Under surveyundersøkelsen benyttet forskerne seg også av en kontroll gruppe. Parallelt med at spørreskjemaene ble distribuert til eks-utvekslings elevene, ble skjemaene også sendt til en «kontrollgruppe» bestående av et tilsvarende antall respondenter, plukket ut av eks-utvekslingselevene etter kriteriene «mest mulig lik deg selv på alle punkter, men har ikke vært utvekslingselev». Poenget var naturligvis, gjennom å sammenlikne eks-utvekslingselevenes svar med kontrollgruppens, med større sikkerhet å kunne forklare eventuel le forskjeller (i karriere eller annet) som resultat av utvekslingsoppholdet.
Med dette eksemplet, rent bortsett fra å vise til et interessant forsknings prosjekt, ønsker vi naturligvis å illustrere at selv om vi prinsipielt skiller mel lom ulike typer av forskningsdesign og lar dem fremstå som «hver til sitt bruk», så vil grensene mellom dem i virkeligheten ofte være både flytende og uklare. Ofte vil vi øke både vår forståelse for de problemstillinger vi un dersøker, samt sikkerheten på de resultater vi kommer fram til ved å kombi nere to eller flere undersøkelsesopplegg. Slike «kombinasjonsopplegg» kal les vanligvis «metodetriangulering» etter militær terminologi, basert på å sikre en observasjons pålitelighet gjennom å innhente minst tre ulike registreringer av for eksempel posisjonen til en fiendtlig avdeling. Slike kombi81
nasjonsmetoder er ikke minst blitt vanlig i medisinsk diagnostisering, ek sempelvis benyttes i stadig større grad kombinasjonen av mammografi, ul tralyd og vevsprøver under brystkreftdiagnosering. Forskning handler nettopp om å ta i bruk alle de metoder som til enhver tid best kan hjelpe oss med å kaste lys over et problem. Sånn sett må vi være innstilt på at teori og praksis av og til vil avvike. Erfaring lærer oss nødven digheten av å ha et udogmatisk syn på forskningsmetode.
Stikkord til kapittel 9 eksplorativt design deskriptivt design kausalt design
Øvingsoppgaver til kapittel 9 Du har fatt i oppdrag å undersøke hvordan en fusjon mellom to større be drifter har virket inn på de ansattes situasjon (trivsel, utrygghet osv.) Foreslå undersøkelsesdesign, eventuelt kombinasjon av design, for en slik undersø kelse.
Foreslå undersøkelsesdesign for følgende problemstillinger: - valg av bankforbindelse - valg av studium
Litteratur å gå videre med Hellevik, O.: Forskningsmetode i sosiologi og statsvitenskap, Universitets forlaget, 1993. Seines, F.: Markedsundersøkelser, TANO, 1993.
Kapittel 10
Forsk n ingsprosessen To eksempler Uansett om vi i forrige kapittel gjorde oss til en slags talsmann for «forskningspluralisme», betyr det selvsagt ikke at en vitenskapelig undersøkelse nær sagt kan gjennomføres på en hvilken som helst måte. Forfattere av metodebøker er gjennomgående iallfall enige om at det å forske kan beskrives som en prosess. Noen beskriver den som lineær, med et startpunkt og et mål, andre beskriver den som sirkulær, det vil si som en «evig rundgang» der resultatet av en undersøkelse utgjør startpunkt for den neste. Det er likevel ikke til å komme bort fra at de ulike beskrivelsene av forsk ningsprosessen utgjør en nokså tydelig bekreftelse av en antatt stor likhet, der forskjeller antakelig først og fremst kan forklares ut fra de fagtradisjoner litteraturen er sprunget ut av. Eksempler fra to innflytelsesrike metodebøker fra to forskjellige fagfelt, nemlig Ottar Helleviks Forskningsmetode i sosiologi og statsvitenskap og Gilbert A. Churchills Marketing research belyser denne prinsipielle likheten temmelig godt. Hellevik beskriver undersøkelsesprosessen slik: 1 2 3 4 5 6 7
valg og utforming av problemstilling utvelging av enheter og variabler som skal undersøkes innsamling av data behandling av data analyse av data tolkning av resultatene av analysen utarbeiding av forskningsrapporten
Churchill velger å sammenfatte forskningsprosessen på denne måten: 1 2 3 4 5
problemformulering valg av forskningsdesign valg av datainnsamlingsmetode valg av datainnsamlingsform bestemme utvalg og foreta datainnsamling 83
6 analyse og tolkning 7 utarbeiding av rapport
Årsakene til denne store prinsipielle likheten finner vi først og fremst i det faktum at de begge har trukket til dels store veksler på noe vi kan kalle «den vitenskapelige metoden». Med andre ord finnes det en form for «mønster» for hvordan vitenskapelige undersøkelser skal gjennomføres. At dette møn steret kan fravikes i en viss utstrekning - noe som blant annet medfører vis se forskjeller i hvordan representanter fra ulike fagfelt beskriver sin egen forskningsprosess - rokker imidlertid ikke ved det faktum at det på tvers av fagdisipliner og vitenskaper er relativt stor enighet om hvilke faser som inn går i undersøkelsesprosessen. Det er derfor all grunn til å se litt nærmere på hva denne såkalte «viten skapelige metoden» egentlig er for noe, samt i hvilken grad den faktisk er et godt mønster også for samfunnsvitenskapene. Ikke minst i lys av våre viten skapsteoretiske drøftinger, kanskje særlig rundt den såkalte hermeneutiske metode, kan det selvsagt diskuteres om Helleviks og Churchils beskrivelser av forskningsprosessen skal forstås som en slags «idealoppskrift».
En sikker vei til kunnskap - finnes den? La oss nærme oss dette spørsmålet ved hjelp av et eksempel fra den nære hverdag: Det vekker sannsynligvis både vår nysgjerrighet og interesse dersom en større del av våre gifte venner og bekjente begynner å skilles. Mange spørs mål vil ganske sikkert trenge seg på. «Hva kan dette bunne i? Hvorfor be gynner alle mennesker å skille seg akkurat nå? Jeg lurer på hvorfor de to går fra hverandre, de virket jo så lykkelige?» Osv., osv. Men vi lar det sannsyn ligvis ikke bli med det. Litt etter litt begynner vi - bevisst eller ubevisst - å lete etter en måte å ordne og sammenfatte det vi ser og hører på. Vi begyn ner kanskje å stille spørsmål ved om det for eksempel er noen forskjell mel lom de som skiller seg og de som fortsatt velger å leve sammen. Vi leter alt så etter en måte å sammenfatte det vi vet om dem som skilles på, for så å kunne sammenlikne dem med en tilsvarende sammenfatning av kunnskap om dem som ikke skilles. Vi leter med andre ord etter «systematiske» for skjeller mellom de to gruppene ektepar. Kunne det for eksempel være slik at skilsmisseparene gjennomsnittlig har færre barn enn de øvrige? Giftet de seg yngre? Har de gjennomsnittlig lave re inntekst? Bor de oftere i større byer? Svaret på slike spørsmål gir oss kunnskap som vi kan måle langs en eller 84
flere skalaer (ofte-sjelden, mye-lite), eventuelt tallfestes direkte (antall barn, inntekt målt i kroner), det vil si kunnskap i en form som kan gi den sikker het og den grad av presisjon som nettopp er alle undersøkelsers mål. Det dette eksemplet skal vise, er to ting: For det første at hensikten med en hvilken som helst undersøkelse oftest nettopp er å sammenfatte, ordne og gruppere en mengde observasjoner som ellers lett gir et kaotisk inn trykk. For at slike inntrykk (som kan være iakttakelser, men som også kan være svar på spørsmål) skal gi grunnlag for kunnskap, må de ordnes på en eller annen måte. Til det trenger vi et verktøy. Metodelære er nettopp et slikt verktøy. Dernest viser forhåpentligvis eksemplet at «metode» ikke er noe viten skapen har funnet på. Metodelære er altså ikke en teoretisk skrivebordskonstruksjon, men er tvert imot grunnet i vanlige menneskers daglige forsøk på å skaffe seg kunnskap om den virkelighet som omgir dem. Vi anvender oss daglig av undersøkelsesmetoder, selv om vi kanskje ikke gjør det systema tisk, og vi vil sannsynligvis heller ikke være i stand til å gjøre rede for hvor dan vi bruker dem. Den kanskje avgjørende forskjellen mellom en slik «hverdagsmetode» og det vi kaller en vitenskapelig metode, er at vi i vår hverdag sjelden gjør sys tematiske studier, mens systematikken nettopp betraktes som den vitenska pelige metodens «varemerke». En slik systematisk undersøkelsesmetode, den vi altså benevner «den vi tenskapelige metoden», kan på mange måter betraktes som all vitenskapelig virksomhets «minste felles multiplum», og bør således vies en del oppmerk somhet i en bok som blant annet har satt seg fore å besvare spørsmålet om hva vitenskap egentlig er.
Idealet? Svært mye av den forskning som gjennomføres på samfunnsmessige, mar kedsmessige eller organisasjonsmessige problemstillinger har altså «den vi tenskapelige metode» som forbilde og mønster. Som vi har drøftet i bokas første del, er begrepet «vitenskapelig» verken entydig eller ukontroversielt, men for mange forskere (og forfattere av lærebøker i metode) innebærer det i det minste et systematisk forhold til undersøkelsesprosessen der da tainnsamling og dataanalyse relatert til et presist formulert undersøkelsesproblem inngår som nødvendige elementer. En måte å fremstille denne undersøkelsesprosessen på er vist i figur 12.
85
Hovedfaser:
Arbeidsprosesser:
Teori
Hypotese
Deduksjon
▼ Datainnsamling
Operasjonalisering
Dataanalyse
Databehandling
Resultat
Tolknin3
T
T
▼ ----------------------------------------------- Induksjon
Figur 12
Her i Norge er det særlig gjennom Arne Næss og Johan Galtungs arbeider, først og fremst Innføring i logikk og metodeUre (1960), at «den vitenskape lige metode», og da i betydningen den «realvitenskapelige metode», det vil si den metode som først og fremst er utviklet for og tilpasset naturvitenska pene, vant innpass. I fellesskap utarbeidet Næss og Galtung et vitenskapsteoretisk system med det de kalte den «hypotetisk-deduktive metode», det vil si samspillet mellom induksjon og deduksjon (se figur 12) som basis. (Jf. diskusjonen på s. 26-27.) I god positivistisk tradisjon hevdet Næss og Galtung at kravene til vitenskapelighet må være de samme for alle vitenskaper - selv om de fleste ek sempler hentes fra naturvitenskapene, især fra fysikken, som for Næss og Galtung (slik det også var for Hume og Bacon) står fram som selve mønstervitenskapen. Resonnementet er altså at naturvitenskapene - især fysikken - danner grunnlag for vitenskapens mønster. Spørsmålet om andre vitenskapers vitenskapelighet blir derfor et spørsmål om disse vitenskapene tilfredsstiller kravene fra mønster vitenskapen. Forsøk på nettopp å tilfredsstille denne type krav har blant annet ført til at mye av den forskning som gjennomføres innenfor for eksempel markedsføringsfaget er av en type vi gjerne kaller «kvantitativ» (og altså gjennom 86
ført innenfor rammen av et deskriptivt design). Det betyr - for å si det litt enkelt - at undersøkelsen planlegges og gjennomføres på en slik måte at den informasjon som innhentes kan kvantifiseres, det vil si gjøres om til tall størrelser. Resultatene kan slik regnes ut med «matematisk nøyaktighet» på samme måte som om det dreide seg om en undersøkelse av fysiske størrel ser som eksempelvis masse eller volum. På den måten oppnår man - tilsyne latende - nettopp å legge seg nær opp til mønstervitenskapen. En slik etterlikning er imidlertid ikke helt uproblematisk innenfor fag der man sjelden er opptatt av å måle størrelser som lar seg måle direkte, som for eksempel høyde og vekt. Som vi allerede har diskutert i forbindelse med vår gjennomgang av de ulike vitenskapsteoretiske skoler, er det en vesentlig for skjell på det å måle en fysisk størrelse, eksempelvis vekt, og en ikke-fysisk størrelse som for eksempel behov eller motivasjon. Rett nok kan vi med full rett tale om styrken på et behov. Atskillig mer problematisk blir det dersom vi i tillegg ønsker å tallfeste denne styrken. Denne type problemer - som henger nøye sammen med den arbeidsfasen som i figur 12 kalles «operasjonalisering», det vil si å gjøre ikke-målbare størrelser målbare - skal vi kom me tilbake til i et senere kapittel. I tillegg til operasjonaliseringsproblemene vil nok mange mene at det er ytterligere forskjeller mellom naturvitenskapelig og samfunnsvitenskapelig forskning som far konsekvenser for i hvilken grad det faktisk er mulig (og hensiktsmessig) å benytte samme vitenskapelige modell for begge forskningsområder. Stikkord her er Skjervheims «deltaker og tilskuer-problematikk» (se side 46), altså forholdet mellom forskeren og det fenomen som skal undersøkes. Mens det i naturvitenskapene kan argumenteres for at det foreligger et nøytralt og objektivt forhold mellom forsker og objekt (ek sempelvis en meteorolog og de meteorologiske observasjoner han foretar), er det å hevde det samme om sosiale observasjoner både problematisk og omdiskutert. I dag vil antakelig bare de færreste hevde at for eksempel sosi al atferd kan beskrives som et hvilket som helst naturforløp ut fra en nøytral tilskuerposisjon. Tvert om hevder flere og flere at slike fenomen bare kan forstås dersom de relateres til forskerens eget verdisystem. Men dermed blir forskerens egne forestillinger om et fenomen direkte avgjørende for oppfatningen av hva som er interessant nok og viktig nok til å bli gjenstand for en undersøkelse. Det blir med andre ord disse forestil lingene som langt på vei utgjør referanserammen for den problemstilling han gir seg i kast med. Det gjelder for det meste av samfunns- og markedsforskningen at det er våre forestillinger om den menneskelige personlighet som tjener som forut setning for hvordan vi utformer den problemstilling vi ønsker å gi oss i kast med. Et eksempel fra organisasjonsforskningen kan belyse dette: 87
Ut fra en grunnleggende forestilling om at mennesket i sin natur er ne gativt innstilt til arbeid, blir bedriftens dominerende problemstilling natur ligvis hvordan kontroll- og styringssystemer kan utvikles slik at man kan sik re seg at de ansatte ikke gis anledning til å sluntre unna. Omvendt, dersom vår grunnleggende forestilling er at det er like natur lig for mennesker å arbeide som å gjøre noe annet, blir problemstillingen hvordan vi organisatorisk kan legge forholdene til rette slik at alle ansatte gis muligheter for å bruke sine evner og ferdigheter i sitt daglige arbeid. Av eksemplet følger videre at de forutsetninger vi baserer undersøkelsen vår på også bestemmer hvilke spørsmål vi stiller - som igjen er med på å be stemme hva slags svar vi far. A klargjøre våre eller andres forutsetninger (kall det gjerne grunnleggen de virkelighetsoppfatning) blir med andre ord temmelig avgjørende for å forstå hvorfor noen problemstillinger og noen fremgangsmåter blir valgt fremfor andre. Dersom vår oppfatning av den sosiale virkelighet er at den i bunn og grunn er tilnærmet lik den naturgitte virkelighet, at det altså finnes objekti ve og faktiske «sannheter» om eksempelvis menneskelig atferd, ja, så vil den naturlige konsekvens bli å velge et undersøkelsesopplegg sterkt påvirket av «den vitenskapelige metode» - eksempelvis en kvantitativ, «positivistisk» in spirert tilnærming. Dersom vi imidlertid mener at den sosiale virkelighet er subjektiv og menneskeskapt, og det meste vi kan håpe på, er å vinne innsikt og forståel se for den virkelighet vi undersøker, ja, da vil vi etter all sannsynlighet fore trekke kvalitative, «hermeneutisk» inspirerte tilnærminger. I et vitenskapsteoretisk perspektiv blir altså valget mellom såkalt kvantita tiv og kvalitativ metode til noe mer enn valget mellom to undersøkelsesdesign. De kan snarere, slik vi har prøvd å påvise, betraktes som uttrykk for hvordan kunnskap om virkeligheten i det hele tatt kan erverves (epistemologiske spørsmål). Men dermed blir valg av tilnærming og valg av metoder noe mer enn et forskningsstrategisk valg. Valg av forskningsmetode vil - bevisst eller ubevisst - være knyttet til den enkelte forskers erkjennelsesteoretiske ståsted, altså til fundamentale oppfat ninger om hvordan kunnskap om virkeligheten overhodet kan nås. Det vil derfor ikke være unaturlig å sammenlikne henholdsvis kvantitative og kvali tative tilnærmingsmåter med det Kuhn skrev om konkurrerende paradig mer. Men også et slikt utgangspunkt kan diskuteres. Innvendingene mot å be trakte kvantitativ og kvalitativ forskning som to konkurrerende paradigmer er iallfall to: For det første impliserer en slik tankegang at de to tilnærmingsmåtene utgjør et enten-eller, at de altså ikke lar seg kombinere. Sam88
tidig vet vi at dette er tilfelle i en god del forskning der man for eksempel benytter kvalitative metoder i en innledende, ofte eksplorativ fase, mens man senere lar de mer strukturerte, kvantitative metodene ta over. Dernest følger det av «paradigme-analogien» at metodevalg og erkjennelses- eller vitenskapsteoretisk ståsted henger intimt sammen. Imidlertid er det på ingen måte klargjort om og i tilfelle hvordan denne sammenhengen fungerer, eller hvorvidt den enkelte forsker er seg bevisst en slik sammen heng. Uansett - en diskusjon rundt valg av metodisk tilnærmingsmåte som går utover metodens rent funksjonelle kvaliteter vil være med på å heve bevisst heten om hva vi som forskere egentlig driver med. Vi kommer likevel ikke utenom at metodevalget for den enkelte undersøkelse først og fremst blir tatt ut fra metodens hensiktsmessighet i forhold til det problem som skal undersøkes.
Case: Hansa Pils i Klasse 1 Høsten 1991 lanserte Hansa Bryggerier - helt overraskende - sin «Original Pils i Klasse 1», det vil si med alkoholinnhold som i lettøl. Konkurrentene ble fullstendig tatt på sengen, og mange mente at det Hansa her hadde gjort, var en av de dristigste og mest kontroversielle produktlanseringer på lang tid. Dristig, javel, men kontroversiell? Da skal vi huske på at pilsnerølet har en helt spesiell posisjon i Norge. Dette ble ikke minst dokumentert da det såkalte «Statssekretærutvalget» i syttiårene vurderte å «vanne ut» pilsnerølet og i stedet skape et såkalt «folkeøl» med et lavere alkoholinnhold. Forslaget førte til en storm av protester og spontan etablering av folkebevegelsen «Pilsens venner», med formål å bevare det gode, norske pilsnerølet. Hansa måtte dermed være forberedt på sterke reaksjoner fra så vel for brukere som konkurrenter. De måtte vite at beslutningen om å lansere et pilsnerøl med alkoholinnhold som lettøl ville være kontroversiell. En slik beslutning tas derfor ikke uten videre. Hansa besluttet å gjennomføre en markedsundersøkelse, for på den måten å fa et bedre beslutningsgrunnlag. Beslutningsproblemet var for så vidt greit. Skulle Hansa lansere sitt pils nerøl i klasse 1, det vil si med et alkoholinnhold begrenset opp til 2,5 %, el ler burde man la være av frykt for at en slik lansering ville pådra seg samme type reaksjoner som ble statssekretærutvalget til del den gang det prøvde å «fikle» med pilsnerølet? Hva slags undersøkelsesproblem sto Hansa overfor her? Hva var det man i dette tilfellet burde undersøke? 89
Vi har for så vidt allerede vært inne på det. Selve pilsbegrepet måtte bli det sentrale. Hovedspørsmålet måtte bli hvorvidt forbrukerne ville aksepte re et «utvidet» pilsbegrep - at pils altså kunne innebære noe mer enn øl med en alkoholprosent på 4,5 % - eller om de ville vende det nye produktet ryg gen. Det markedsforskerne med andre ord konsentrerte seg om, var å un dersøke hvorvidt begrepet «pils» i forbrukernes bevissthet var uløselig knyt tet til ett bestemt produkt med ett bestemt alkoholinnhold, eller om «pils»begrepet var mer tøyelig. For å fa klarhet i dette bestemte forskerne seg for et eksplorntivt design, hvilket i dette tilfelle betydde relativt inngående gruppesamtaler basert på et utvalg hovedsakelig sammensatt av «øldrikkere». På den måten tok man sik te på å få fram informasjon om nettopp slike forhold som alkoholsstyrkens betydning og pilsbegrepets entydighet. Etter å ha gjennomført en rekke gruppesamtaler konkluderte markeds forskerne med at begrepet «pils» ikke syntes å være entydig knyttet til ver ken en bestemt alkoholprosent eller en bestemt øltype. Tvert om syntes det snarere som om «pils» mer var å betrakte som en felles betegnelse for øl i det hele. Dette fastslo de blant annet på grunnlag av informasjon fra for skjellige forbrukere som for eksempel kunne fortelle at når man slapp opp for drikke under for eksempel tippekampen, og en eller annen fikk beskjed om å stikke ut etter pils, kunne vedkommende gjerne komme tilbake med Sommerøl, Spesialøl, Fatøl eller andre øltyper uten at det ble noen reaksjo ner av den grunn. Konklusjonen fra markedsforskerne ble altså at Hansa kunne lansere sitt nye produkt «Orginal Pils i klasse 1» uten at det ville avstedkomme noen proteststorm fra forbrukerne.
Tok markedsforskerne feil? Men faktisk var det akkurat det som skjedde. Etter snaue seks måneder så Hansa seg tvunget til å trekke produktet tilbake fra markedet - først og fremst som resultat av protester nettopp fra forbrukerne. (Også «Pilsens Venner» begynte å rasle med sablene.) I tillegg var verken konkurrenter el ler Bryggeriforeningen spesielt fornøyd med hva som ble karakterisert som en omgåelse av lovverket. Motstanden mot produktet ble med andre ord langt sterkere enn ventet - og sterkere enn markedsforskerne hadde forutsett. Som vi tidligere har vært inne på, er ingen undersøkelser av sosiale feno men feilfrie. Dette henger sammen med generelle metodiske svakheter (mer om dette i neste kapittel), men det gjør heller ikke saken bedre at de egen-
90
skaper vi ønsker å kartlegge, for eksempel «holdninger til pils», slett ikke er spesielt lette å kartlegge med tilstrekkelig grad av sikkerhet. Når «holdning er», «følelser» eller andre abstrakte fenomen ønskes undersøkt, bør vi nok være ekstra varsomme, ikke minst fordi det verktøy vi har til rådighet i slike sammenhenger (oftest en form for utspørring) egentlig er nokså primitivt og ikke spesielt godt egnet til formålet. Og dessverre baserer bare de færreste forbrukervalg seg utelukkende på rasjonelle vurderinger som resultat av ob jektiv informasjon og saklig informasjon. Svært ofte er det tvert om det irra sjonelle og det følelsesladede som styrer våre handlinger. Tenk bare på dis kusjonen rundt norsk hvalfangst, der temmelig irrasjonelle og følelsesladede (iallfall sett med offisielle norske øyne) argumenter av typen: «det spiller ing en rolle for meg om bestanden av vågehval er stor nok til at man kan drive fangst på den. Hvalen er et intelligent dyr som det ikke bør drives fangst på uansett», var vanlige. (Uttalelsen stammer fra den amerikanske kongressmannen Peter de Fazio i intervju med Dagens Næringsliv den 18.7.92.) Markedsforskerens viktigste oppgave er å «ta pulsen» på markedet. Mar kedet er imidlertid ikke noe absolutt begrep, men består av ulike mennesker av kjøtt og blod, med følelser, sympatier og antipatier. Markedet reagerer sjelden rasjonelt og forutsigbart. Kunnskap om metodeproblematikk kan nok hjelpe oss til å redusere usikkerheten forbundet med undersøkelser på markeds- eller samfunnsmessige problemer. Men at en god porsjon ydmyk het bør være en samftmnsforskers faste følgesvenn, kan antakelig ikke un derstrekes tydelig nok. Skråsikkerheten har ingen plass i samfunns- og mar kedsforskningen. I neste kapittel skal vi underbygge et slikt synspunkt gjennom å se nær mere på noen av de utfordringer forskeren alltid møter i sine forsøk på å fravriste den sosiale virkelighet dens hemmeligheter.
Stikkord til kapittel 10 forskningsprosessen beslutningsproblem/undersøkelsesproblem objekt/subjekt
Øvingsoppgave til kapittel 10 Diskuter hvorvidt et undersøkelsesopplegg etter mønster av henholdsvis Hellevik og Churchill er godt/mindre godt egnet til å kaste lys over føl gende problemer: 91
-
stoffmisbruk blant ungdom arbeidsmiljøet i en bedrift forbrukeratferd på boligmarkedet flørting blant studenter
Litteratur å gå videre med Churchill, G.A. jr.: Marketing Research, 1991. Hellevik, O.: Forskningsmetode i sosiologi og statsvitenskap, Universitets forlaget, 1993.
Kapittel 11
Om d undersøke virkeligheten - noen overgripende problemer I denne sekvensen av boka vil vi ta opp og forsøke å belyse noen «overgripende» problemer vi alltid møter når vi gjennomfører undersøkelser, men som oppleves som særlig påtrengende når undersøkelsene dreier seg om samfunnsmessige problemstillinger. Det dreier seg for det første om i hvilken grad vi ved hjelp av ulike meto der er i stand til å «måle» en virkelighet som ikke alltid forekommer oss å være like målbar. Våre vanligste assosiasjoner til begrepet «måling» går helst i retning av hopplengden til Espen Bredesen, temperaturen en sommerdag eller andre fysiske fenomener det er naturlig å tenke på i sammenheng med ord som lengde, høyde, vekt, avstand osv. Undersøkelser om markeds- eller organisasjonsforhold måler nok av og til denne type størrelser, eksempelvis omsetning, antall ansatte eller kon sum. Men temmelig ofte er vi også opptatt av å måle fenomener som ikke på samme måte er direkte målbare, slik som holdninger, følelser eller verdi er. Det er - ikke overraskende - først og fremst i forbindelse med denne type fenomener at problemene oppstår. Nær sagt som direkte konsekvens av denne første vanskeligheten møter vi en annen type problemer, nemlig de som har med undersøkelsesresulta tenes kvalitet å gjøre. Litt forenklet kan vi si at vi opererer med to kvalitets kriterier i forskningssammenheng. Det ene dreier seg om undersøkelsesre sultatenes pålitelighet (reliabilitet). Det andre dreier seg om resultatenes gyldighet (validitet). Enkelt sagt skal en undersøkelse helst få karakteren reliabel og valid for at vi skal kunne gå god for den. Enkle målinger gir oftest liten grunn til å betvile resultatene. Har legen målt høyden min til 180 cm, regner jeg med at målingen både er rimelig reliabel (jeg mente jo også selv at jeg var ca. 180), og jeg betviler heller ikke at det faktisk var høyden min som ble målt og ikke noe annet. Men jo mer problematisk måleprosessen er, jo større grunn er det til å stille spørsmål ved om resultatene av måling ene er gyldige og til å stole på. Jeg vil for eksempel anta at dersom jeg i for bindelse med en jobbutvelgelse fikk «målt» personligheten min, ville jeg 93
både stille spørsmålstegn ved om det faktisk var personlighet som ble målt ved hjelp av en lang og omstendelig spørsmålsrekke inneholdende til dels «dustete» spørsmål eller påstander, samt hvor nøyaktig min eventuelle per sonlighet faktisk kunne bli målt på denne måten. Begrepene «måling», «reliabilitet» og «validitet» henger altså gjensidig nokså intimt sammen, samtidig som de har helt avgjørende konsekvens for kvaliteten på en undersøkelse. Det er derfor behov for å se litt nærmere på hva de egentlig innebærer.
Om å måle virkeligheten La oss innledningsvis se på et eksempel som kan hjelpe oss med å belyse hva slags utfordringer og problemer vi står overfor når vi forsøker å få grep om hvordan virkeligheten faktisk er gjennom å foreta en undersøkelse av den. La oss si at en journalist får i oppdrag av sin redaktør å skrive en artikkel serie om ekteskapsroller og arbeidsfordeling. Journalisten bestemmer seg for å starte opp med litt innledende «research». Hun tar derfor kontakt med en sosiolog og gjennomfører i tillegg noen samtaler med en del ekte par. Likevel følte journalisten etter noen tid at hun stadig manglet det rette grepet på stoffet. Det forble løst og uhåndterlig. En bekjent av henne, som var ansatt i et markedsforskningsinstitutt, sat te henne imidlertid på tanken om å gjennomføre en mer systematisk under søkelse. Journalisten tente på ideen, og antok at dette var noe hun kunne gjennomføre på egen hånd. Fordi hun visste hva slags informasjon hun var ute etter, utformet hun selv det spørreskjemaet hun skulle bruke. Her er et par eksempler på spørsmål hun planla å stille: A (for menn): Hjelper du til med husarbeidet?
JA
NEI
B (for kvinner): Bærer du ut søppelposen?
JA
NEI
Heldigvis for journalisten bestemte hun seg for å ta en prat med sin venn markedsforskeren før hun satte i gang. Det tok, som vi kanskje aner, ikke markedsforskeren lang tid å fastslå at en god journalist ikke nødvendigvis også er en god forsker. Etter å ha gått kritisk igjennom spørreskjemaet anbefalte han en nokså drastisk omarbeidelse, noe som blant annet innebar at journalistens nokså enkle ja/nei-spørsmål ble erstattet av en serie såkalte skaleringsspørsmål, det vil si spørsmål der svaralternativene er plassert langs en skala med flere
94
enn to punkter, som etter hans vurdering ville gi henne et rikere datatilfang enn hennes relativt enkle spørreskjema. Markedsforskerens forslag ble akseptert. Undersøkelsen ble gjennom ført, og resultatene dannet grunnlag for flere artikler om emnet. La oss derfor, som en innledning til vår diskusjon rundt noen av de pro blemer vi nær sagt alltid støter på når vi forsker på denne og liknende type problemstillinger, se litt nærmere på hvordan undersøkelsen om ekteskapsroller og arbeidsfordeling ble gjennomført. Som nevnt over benyttet journalisten seg av såkalte skaleringsspørmål. I dette tilfelle ble det benyttet en skala med fire punkter eller svaralternativer (fem-, syv- og ni-punktsskalaer er også relativt vanlig), der respondentene ble presentert for en serie påstander eller utsagn som de skulle forholde seg til. Eksempler er vist i de to tabellene under. Gjelder menn i to-inntektsfnmilier Nesten alltid
Ofte
Av og til
Sjelden/aldri
Tar oppvasken
5,5 %
24,3 %
32,5 %
37,7 %
Lager middag
5,0 %
20,0 %
38,5 %
36,5 %
Vasker tøy
3,9 %
13,0%
23,4 %
59,0 %
Gjør rent
3,4 %
18,5%
41,3%
36,9 %
12,2 %
15,9%
33,7 %
38,2 %
Handler mat
Gjelder kvinner i to-inntektsfamilier Nesten alltid
Ofte
Av og til
Sjelden/aldri
Fyller ut sel vangivelsen
28,6 %
5,5 %
8,9 %
57,0 %
Tømmer søppel
22,2 %
25,3 %
29,1 %
23,4 %
Reparerer ting i huset
8,7 %
10,6%
36,6 %
44,0 %
Maler/tapetserer
23,1 %
12,8%
25,5 %
38,5 %
Fikser bilen
12,7%
13,3%
26,2 %
47,7 %
Hva tabellene forteller oss (rent bortsett fra at vi kan lese av prosentforde lingene at arbeidsdelingen «i heimen» fortsatt synes å følge det tradisjonel le kjønnsrollemønsteret) er følgende: Journalisten og markedsforskeren for søker i denne undersøkelsen å måle begrepet «arbeidsdeling» gjennom å stille et utvalg menn og kvinner i såkalte to-inntektsfamilier en rekke spørs 95
mål om deltakelse i ulike gjøremål som tapetsering, oppvask, søppeltøm ming, rengjøring osv. Som vi har vært inne på flere ganger, er vi som sam funns-, markeds- eller organisasjonsforskere stilt overfor forskningsmessige utfordringer av ovennevnte type. Mange av de fenomener eller egenskaper vi er opptatt av å undersøke lar seg vanskelig måle direkte, og vi er altså nødt til å ta slike «omveier» som i eksemplet. Men dermed øker naturligvis også usikkerheten med tanke på om det vi faktisk måler på denne måten er det vi i utgangspunktet ønsker å måle. Kan vi for eksempel være sikre på at vi måler fenomenet «mannssjåvinist» gjennom å stille følgende tre spørs mål: 1 Er du for eller imot at kona jobber utenfor hjemmet selv om familien greier seg på mannens inntekt? 2 Er du for eller imot at menn og kvinner skal ha samme seksuelle frihet innenfor ekteskapet? 3 Skal en mann straffes dersom han overrasker sin kone og hennes elsker og skyter begge? (Det er antakelig unødvendig å røpe hva man skal svare på ovennevnte spørsmål for å fa tildelt merkelappen «mannssjåvinist».) Hva vi har gjort i tilfellene «arbeidsdeling» og «mannssjåvinist» er å operasjonalisere begrepene, hvilket nettopp betyr å angi hvordan vi kan måle et fenomen eller en egenskap som vi har en teoretisk oppfatning av, men synes det kan være vanskelig å konkretisere. Veien fra en slik teoretisk definisjon av begrepene til vi sitter der med fak tiske data om arbeidsdelingen i ekteskapet eller menns kvinnesyn, er som vi forstår, ikke uten problemer. Det er derfor all grunn til å ta denne prosessen nærmere i øyesyn, ikke minst for å bevisstgjøre oss på hvor vanskelig det egentlig er å gjennomføre undersøkelser på en slik måte at kvalitetsnivået er akseptabelt.
Målebegrepet For den som nå undrer seg over hvorfor vi i det hele tatt snakker om måling og måleinstrumenter i forbindelse med undersøkelser av sosiale fenomen (som attpåtil ofte unndrar seg måling i egentlig forstand), så ligger forkla ringen også her i «arven fra naturvitenskapene». Selv om altså måling av lufttrykk og måling av holdninger strengt tatt innebærer to helt forskjellige 96
operasjoner, så bruker vi likevel samme terminologi for å beskrive arbeids prosessen. På samme måte blir følgelig både barometeret (til måling av luft trykk) og spørreskjemaet (til måling av holdninger) måleinstrumenter. Men hva innebærer det egentlig å måle noe? Enkelt forklart betyr måling at vi tildeler en egenskap et tall som skal re presentere den verdien egenskapen har. Poenget er altså at den tallverdi vi tildeler er ment å skulle gi uttrykk for den mengde av en gitt egenskap vi mener å finne hos den enheten (som oftest individer) vi måler. Det er viktig å understreke at det i denne sammenheng ikke er individet selv vi måler, men egenskaper ved individet. En organisasjonsforsker måler med andre ord ikke den ansatte i seg selv, men egenskaper ved den ansatte som for ek sempel kjønn, alder, utdanning, motivasjon osv. Videre er det viktig å mer ke seg at denne tildelingen av tall til egenskaper ikke skjer helt tilfeldig. Det finnes regler eller retningslinjer som forskeren må forsøke å etterleve. For eksempel kan en regel si:
- Tildel tallene 1 til 5 til gifte menn overensstemmende med i hvilken grad de deltar i husarbeidet hjemme. Dersom de fullt ut deltar i de fleste former for husarbeid, tildel tallet 1. Hvis de overhodet ikke deltar, tildel tallet 5.
Tilsvarende må vi også bestemme reglene for hvordan tallverdiene 2, 3 og 4, skal brukes. Et problem i forbindelse med slike regler for tildeling av tallverdier er at det ofte blir uklart for oss hva slags tallverdier som skal gå sammen med gra den av en egenskap som skal påvises. La oss likevel gjøre et forsøk på å be skrive den arbeidsprosessen som ligger bak enhver måling av egenskaper eller som vi kaller dem: variabler av ulik abstraksjonsgrad.
1 Identifisering av undersøkelsesfenomenet Innledningsvis starter vi gjerne med å identifisere eller «sirkle inn» det fe nomen vi ønsker å undersøke, slik journalisten i eksemplet over startet med å ville se nærmere på såkalte ekteskapsroller og arbeidsfordeling i ekteska pet. Fenomenet eller begrepet «ekteskapsrolle» er en abstraksjon som er skapt av oss selv eller andre, og som først og fremst anvendes for å gi feno mener identitet. Det er imidlertid behov for videre bearbeiding av slike fe nomen før de kan gjøres til gjenstand for måling. 2 Definering av undersøkelsesfenomenet Neste steg i prosessen blir derfor å forsøke å definere det vi ønsker å under søke - først teoretisk, deretter operasjonelt. Den teoretiske definisjonen («leksikondefinisjonen») skal først og fremst hjelpe oss med å kunne skille 97
det fenomen vi er opptatt av fra alle andre (særlig liknende) fenomener. En upresis teoretisk definisjon kan føre til at vi i neste omgang ikke makter å stille de riktige (og viktigste) undersøkelsesspørsmålene. La oss igjen bruke «ekteskapsroller» som eksempel.
Å si at vi er interessert i å studere «ekteskapsroller» blir så omtrentlig og ge nerelt at det i en forskningssammenheng blir nærmest intetsigende og nes ten meningsløst. Ja, selv om vi snevrer begrepet kraftig inn og for eksempel presiserer at det vi ønsker å studere er «ekteskapsroller blant nygifte, det vil si gift mindre enn 12 måneder, i aldersgruppen 24-28 år, der begge ekte feller har utdanning utover videregående skole», kan det vise seg å bli for upresist. En forsker kan for eksempel være interessert i kommunikasjonsmønstre med basis i rolleoppfatning, mens en annen er interessert i forel dreroller. Vår journalist var åpenbart først og fremst interessert i ekteskaps roller relatert til arbeidsfordelingen mellom ektefellene. Å gjøre en teoretisk definisjon så presis som mulig gjør oss i neste om gang i stand til å utvikle den såkalte operasjonelle definisjonen - eller, som vi ofte sier, å operasjonalisere begrepet. Mens altså et begreps teoretiske definisjon hjelper oss med å avgrense be grepet i forhold til andre og liknende begreper, skal den operasjonelle defi nisjonen henvise til gjennomførbare fremgangsmåter (operasjoner) som kan benyttes når vi skal avgjøre om et fenomen faller inn under begrepet el ler ikke. Kravet om at alle vitenskapelige begrep skal være operasjonaliserbare ut viklet seg innenfor fysikken og bredte seg litt etter litt til andre vitenskaper. I mange tilfeller skaper ikke operasjonaliseringskravet særlig store proble mer. I botanikken er for eksempel plantesorter beskrevet - og følgelig begrepsbestemt gjennom konstaterbare egenskaper som for eksempel form, farge, størrelse osv. Det samme gjelder innenfor de fleste andre naturviten skaper. Også medisinernes sykdomsbegreper er beskrevet gjennom kjenne tegn som i prinsippet lar seg iaktta. Derimot er begreper der begrepskjennetegnene henviser til psykiske og psykologiske forhold av typen følelser, holdninger, motiver osv. langt mer problematiske med hensyn til operasjonalitet. Men fordi det nettopp er de operasjonelle begrepene som hjelper oss med å knytte de nødvendige og (ofte) klargjørende forbindelseslinjene mel lom på den ene side begreper, teorier og hypoteser, og på den andre side den vitenskapelige måleprosessen som skal gjøre oss i stand til å fastslå hvor vidt et fenomen faller inn under begrepet, bør vi tillegge operasjonaliseringsarbeidet betydelig vekt. Det er i mange tilfeller likevel neppe mulig å komme fram til den ene 98
operasjonelle definisjonen som uansett fremstår som den beste. Det vil all tid finnes mange mulige operasjonelle definisjoner av et samfunnsvitenska pelig begrep, og forskeren må simpelthen velge den operasjonaliseringen som passer best for hans, det vil si undersøkelsens formål. Noen ganger kan nettopp det faktum at forskere velger forskjellige operasjonaliseringer av samme begrep forklare forskjeller i resultatene av ulike undersøkelser av samme fenomen. Et illustrerende eksempel finner vi i en undersøkelse foretatt for noen år siden der to anerkjente norske forsknings institutter (Statens institutt for forbruksforskning og Institutt for samfunns forskning) tok mål av seg til å tallfeste hvor mange norske husstander som befant seg i en såkalt «gjeldskrise». Resultatene av undersøkelsene viste seg imidlertid å bli dramatisk forskjellige. Mens det ene instituttet kom til at det høsten 1991 var om lag 120 000 norske husstander som befant seg i en gjeldskrise, konkluderte det andre med at tallet neppe var høyere enn 30 000. Den store forskjellen mellom instituttenes anslag viste seg nettopp å skyl des at forskerne hadde operasjonalisert begrepet «gjeldskrise» ulikt. For det ene instituttet var bekreftende svar på spørsmålet: «Betaler du vanligvis regninger først etter tredje gangs purring?» en klar indikator på at responden ten befant seg i en gjeldskrise, mens det andre instituttet mente at dette nærmest måtte betraktes som normal atferd, og at det dermed fortalte lite eller ingenting om personens økonomiske situasjon.
Stikkord til kapittel 11 teoretisk definisjon operasjonell definisjon (operasjonalisering) skaleringsspørsmål
Øvingsoppgaver til kapittel 11 Vi har i dette kapitlet blant annet understreket at operasjonaliseringer av te oretiske begrep (gjøre dem målbare) til dels er vanskelig og utfordrende, og i siste instans helt avgjørende for kvaliteten på undersøkelsen. Et eksempel på operasjonalisering hentet fra det norske valgforskningsprogrammet er følgende: For å oppmuntre innsatsviljen til den enkelte, bør vi godta større lønnsforskjeller enn i dag.
99
a) Hva er det som ønskes målt gjennom denne operasjonaliseringen? b) Foreslå flere operasjonaliseringer av samme fenomen. c) Hvordan ville du operasjonalisere følgende begrep? - svak forbruker - arbeidsglede - kvalitet
Litteratur å gå videre med Holme, I.M. og B.K. Solvang: Metodevalg og metodebruk, TANO, 1995. Høivik, T.: Mål og metode, Universitetsforlaget, 1974.
Kapittel 12
Om måleskuluer (tø skallkonstruksjon Som vi så av eksemplet i forrige kapittel, foreslo journalistens markedsforskningsvenn bruk av såkalte skaleringsspørsmål i stedet for enkle ja/neispørsmål i forbindelse med hennes planlagte undersøkelse omkring ekte skapsroller. For å få plassert de ulike svarene i forhold til hverandre på en fornuftig måte måtte det altså utvikles en såkalt måleskala, det vil si en skala som er utformet slik at den blir et hensiktsmessig instrument for måling av de fe nomener vi er ute etter. Til spørsmålet «Hender det at du tar oppvasken hjemme?» kan vi for ek sempel konstruere følgende skala og plassere respondentene i overensstem melse med hva de har svart: Nesten alltid
Ofte
Av og til
Sjelden/aldri
Vi kunne selvsagt ha laget skalaen enklere, eksempelvis ved å bruke bare to svaralternativer: Nesten alltid
Sjelden/aldri
Eller vi kunne lage en mer presis variant gjennom å tallfeste de ulike alter nativene: 5-7 ganger pr. uke
3-4 ganger pr. uke
1-2 ganger pr. uke
rnmdre enn i gang pI. U i\c
Hva slags måleskala vi velger å konstruere er resultat av hvilket malemva vi anser som ønskelig eller mulig. Metodelitteraturen omtaler vanligvis fire ulike målenivåer, og vi skal i det følgende se nærmere på hva det innebærer at en måleskala befinner seg på det ene eller det andre av disse målenivåene. 101
De fire skala- eller målenivåer, kalt nominal-, ordinal-, intervall- og forholdstallnivå, ble første gang beskrevet i 1946 i en liten artikkel som den engelske vitenskapsmannen S.S. Stevens offentliggjorde i tidsskriftet «Scien ce». Foranledningen var uenighet i en britisk komité som skulle utrede om sanseopplevelser (sensory events) kunne måles. Stevens mente at når komi teens medlemmer ikke kunne enes, så var hovedgrunnen at ikke alle med lemmene la samme innhold i begrepet «måling». Han antok at det ville bli lettere å komme til enighet dersom det ble sondret mellom forskjellige for mer for måling og tilsvarende måleskalaer. Stevens' oppfatning av hva disse fire målenivåene egentlig innebar kan spores tilbake til en vitenskapsteoretisk bevegelse eller retning som ble kalt «Unity of Science-bevegelsen». Talsmenn for denne retningen, blant annet Carnap og Hempel, hevdet at alle vitenskapsgrener skal ha samme type tankesett og formål, og at foregangsvitenskapen - den som alle andre vitenska per prøver å innhente - er matematisk fysikk. Matematisk fysikk arbeider med data på forholdstallsnivå (se forklaring nedenfor). En måte å minske avstanden til denne vitenskapsgrenen på blir følgelig å fremskaffe data på forholdstallsnivå i alle fagområder. Spørsmålet er imidlertid om dette lar seg gjøre i praksis? I et forsøk på å svare er vi nødt til å se nærmere på de fire skala- eller må lenivåene, hva som kjennetegner dem og i hvilken grad det er mulig å opp fylle Stevens' ambisjon om enhetlig behandling av alle typer data.
Forholdstallsnivå Data, det vil si informasjon om et saksforhold, befinner seg på forholdstalls nivå. Det innebærer at vi har å gjøre med et målenivå som gjør det mulig å sammenlikne avstander (mellom de talluttrykk som representerer den mengde av en egenskap vi finner hos det fenomen vi undersøker), og at vi i tillegg opererer med skalaer som har et naturlig nullpunkt. Dermed vil alle egenskaper som uttrykker absolutte eller relative fordelinger, som for ek sempel antall barn i en familie, prosent markedsandel av et gitt marked, el ler en bedrifts omsetning målt i kroner, tilfredsstille kravet til forholdstalls nivå. I alle disse tilfellene har vi et naturlig nullpunkt, nemlig «ingen barn», «null prosent markedsandel» eller «null kroner i omsetning». Videre vil den tallverdi som angir mengden, for eksempel 4 barn eller 2 millioner kroner i omsetning, ha en absolutt empirisk mening i den forstand at 4 barn er 4 ganger så mange som 1 barn og 2 millioner i omsetning er dobbelt så mye som 1 million. Stort sett er det liten uenighet om plasseringen av denne type faktadata i
102
måleskalasystemet, selv om man av og til kan støte på situasjoner der selv denne type datas plassering i målesystemet kan diskuteres. Hellevik (1993) viser for eksempel til variabelen «studielengde». Med ett semester som mu lig måleenhet og «ingen studietid» som naturlig nullpunkt vil de fleste være enig i at denne variabelen kan betraktes som en forholdstallsnivåvariabel. Om vi derimot ikke er interessert i studietidens lengde i seg selv, men ønsker å bruke variabelen studielengde som mål på en students kunnskapsnivå, blir det straks mer tvilsomt om vi fortsatt kan betrakte dette som en egenskap på forholdstallsnivå. Ville vi hevde noe slik, måtte vi forutsette at studenter til egner seg samme kunnskapsmengde hvert semester uansett hvilket studie trinn de befinner seg på. Vi ville altså bli nødt til å forsvare en påstand om at studenter med for eksempel seks semestre bak seg generelt har dobbelt så høyt faglig kunnskapsnivå som studenter med bare tre semestres studietid. De fleste ville nok finne en slik påstand lite rimelig. Vi ville i dette tilfellet an takelig være på den sikreste siden dersom vi plasserte «studielengde» på et lavere målenivå som ikke forutsetter matematisk beregnede avstander. Man kunne for eksempel nøye seg med å påstå at studenter etter seks semestre forventes å kunne mer enn de som bare har studert i tre semestre, men hvor vi altså avstår fra å si noe om hvor mye mer de kan. En liknende diskusjon kan vi finne hos Blalock (1971), som i boka Social statistics tar opp en diskusjon om hvorvidt variabelen inntekt målt i dollar kan sies å være en forholdstallsvariabel. Motargumentet vil ifølge Blalock være at: «A difference of 1 000 dollar will have a different psychological meaning, depending on whether the differences are between incomes of 2 000 and 3 000 dollars or between incomes of 30 000 and 31 000.»
Slike innvendinger til tross - det er nok slik at det vanligvis hersker liten fag lig uenighet om hva et forholdstallsnivå innebærer. Noe mer problematisk kan det derimot bli når vi beveger oss et trinn ned og tar det målenivå som kalles intervallnivå nærmere i øyesyn.
Intervallnivå Kvikksølvtermometeret er i alminnelighet holdt fram som skoleeksemplet på en intervallskala i fysikken. Gradestokken har ikke noe naturlig null punkt, men når først et nullpunkt er valgt (som for eksempel ved den tem peratur der vann fryser til is) gir, det mening å snakke om verdier på varia belen temperatur. Det blir videre meningsfylt å hevde at forskjellen mellom
103
20 og 25 grader er den samme som mellom 30 og 35 grader, men fordi vi opererer med et valgt og ikke et naturlig nullpunkt, blir det meningsløst å hevde at for eksempel 20 grader er dobbelt så varmt som 10 grader. Net topp her ligger forskjellen mellom en intervallskala og en forholdstallskala, hvor vi har sett at begreper som «dobbelt så» er meningsfulle. Mens det altså innen fysikken er åpenbart at intervallskalaen brukes, er det verre å finne (naturlige) eksempler på intervallskalavariabler innenfor samfunns-, markeds- eller organisasjonsforskning. Ja, ifølge Hellevik (1993) er det faktisk vanskelig å finne eksempler på sosiologiske intervallvariabeler overhodet. Når vi i markeds- eller organisasjonsmetodelitteraturen likevel møter eksempler på intervallskalavariabler, kan det derfor være grunnlag for å være kritisk. Men intervallskalaen er ordinalskalaen (målenivået under) overlegen med hensyn til statistiske analysemuligheter (vi kan for eksempel beregne aritmetisk gjennomsnitt og standardavvik på intervallnivå, men ikke på ordinalnivå). Derfor kan man i en konkret undersøkelse lett bli fristet til å presse dataene inn i en form som gir grunnlag for å bruke et høyere målenivå enn det strengt tatt er dekning for. La oss tenke oss følgende situasjon: Du er i ferd med å gjennomføre en organisasjonsstudie, og ønsker blant an net å måle hvordan de ansatte i den bedriften det gjelder forholder seg til følgende utsagn: - «Jeg har i det store og hele høy grad av innflytelse over egen arbeidssitu asjon.» Du har videre konstruert følgende svarkategorier med tilhørende verdier: Helt enig
Delvis enig
Usikker
Delvis uenig
Helt uenig
2
1
0
-1
-2
De øvrige utsagn/svar er konstruert etter samme prinsipp.
Tilsynelatende har vi altså her å gjøre med en intervallskala med et tilfeldig valgt nullpunkt og tallverdier med lik avstand (intervaller). Anta så at to av de spurte avga følgende svar på ovenstående spørsmål samt et annet spørsmål: Person 1: «Helt uenig» (-2) og «Delvis enig» (1)
Person 2: «Delvis uenig» (-1) og «Delvis enig» (1) 104
I tråd med kjennetegnet på en intervallskala kan vi nå regne ut et gjennomsnittsmål for de to respondentene for de to spørsmålene. Vi velger aritme tisk gjennomsnitt, og far følgende: Person 1:
= -1/2, altså en svak uenighet, og
Person 2:
= 0, altså usikker
Sett imidlertid at vi har en følelse av at det skal mer til for å ha en oppfatning enn bare å gi uttrykk for usikkerhet. I tillegg skal det mer til for å være ue nig enn enig i denne type utsagn (har for eksempel å gjøre med at det er mer akseptabelt å være enig enn uenig i dette tilfelle). Derfor endrer vi svaralternativenes verdier i henhold til dette til:
En ny utregning for de samme to personene ville da gi følgende resultat: Person 1:
-4 + 2 2
Person 2:
-3 + 2 2
-1
Hva dette litt omstendelige eksemplet er ment å skulle illustrere, er den temmelig avgjørende forskjellen mellom den fysiske utvidelse og sammentrekning av kvikksølvet i et termometer som vi måler i grader langs en ska la, og en verbal holdningsskala der tilordningen av tallverdier til syvende og sist avgjøres av forskerens skjønn. Og dermed står vi i fare for å havne i den situasjon blant andre Galtung (1969:74) advarer mot: «Since equal numerical differences [...] do not correspond to equal attitudinal differences, the operations of addition and subtraction are illegitimate.» Generelt bør vi altså passe oss for å betrakte skalaer der måleverdiene er verbalt definert som intervallskaler. Det hjelper heller ikke - slik eksemplet over var ment å illustrere - å tilordne verdiene tall så lenge det ikke er talle ne (mengden) selv, men noe bakenforliggende (for eksempel holdninger) vi egentlig ønsker å måle. Hellevik nevner for eksempel at når Thurstone 105
(mannen bak den såkalte Thurstone-skalaen) mente at de holdningsskalaer han kom fram til - som resultat av at såkalte «dommere» hadde ordnet på stander om et saksforhold i 11 grupper eller hauger med samme innbyrdes avstand - ga målinger på intervallnivå, så er dette svært omstridt - forsiktig uttrykt. Vi finner for øvrig samme begrunnelse i mye av organisasjons- og markedsundersøkelseslitteraturen: det legitime i å betrakte en i utgangs punktet verbal skala som en intervallskala begrunnes i en «allmenn oppfat ning» med at det er lik avstand mellom de ulike svaralternativene. Men det te vil som sagt alltid kunne diskuteres. Avslutningsvis om intervallskalaer kan vi - som en ytterligere forklaring på intervallskalaens popularitet - naturligvis anføre påstanden om at tall mer presist enn ord uttrykker noe om et saksforhold. Forholdet mellom viten skapelige utsagn og dagligspråket oppfattes jo nettopp slik at det vitenska pelige språket er så mye mer presist. Når for eksempel matematisk fysikk an gir tallforhold, innebærer dette som oftest en presisering av vår daglige om tale av fysiske forhold. Mens vi gjerne sier at «i dag var det tung luft», ut trykker fysikken samme forhold i millibar. I samfunns- og markedsforskning er det imidlertid ikke sikkert at «fysikkmodellen» gir best utbytte. Tvert om er det kanskje heller slik at den verbale beskrivelsen av et saksforhold nesten alltid vil være mest nøyaktig iallfall i den forstand at denne måten tar vare på flest detaljer. Den som prøver å anvende intervallnivå på samftmnsdata, må derfor sta dig vokte seg for skinnpresiseringer.
Ordinalnivå Grensen mellom ordinal- og intervallskalaen kan sies å være flytende i den forstand at de begge benyttes til å rangere verdier langs en gitt skala. For skjellen er, slik vi allerede har vært inne på, at mens intervallskalaen stiller krav til at skalaen skal inneholde et nullpunkt, samt at det skal være fast avstand mellom verdiene langs skalaen, stiller ordinalskalaen ingen slike krav. Spørsmålet om hvorvidt en såkalt Thurstone-skala eller en Likert-skala (fem verdier), eller for den saks skyld en hvilken som helst konstruert skala tilordnet tall, nullpunkt og lik avstand mellom verdiene skal behandles som intervall- eller ordinalskala, blir i siste omgang den enkelte forskers vur dering. Lekvall og Wahlbin (1987) anbefaler for sikkerhets skyld at skalaer der de ulike skalaverdiene er verbalt definert ikke bør betraktes som inter vallskalaer. I så fall står vi tilbake med en skala der det gir mening å rangere ulike verdier eller utsagn. Der kan vi også utsi noe om hva som rangeres som bedre eller høyere, men vi kan altså ikke måle avstanden mellom verdi-
106
ene og således ikke si noe om hvor mye bedre et saksforhold er i forhold til et annet.
Nominalnivå Nominalskalaen er strengt tatt ingen skala i det hele tatt. Betegnelsen «no minal» peker derimot på at tall brukes som navn (av det latinske nomen). Forutsetningen for at tall kan brukes på denne måten er at de ikke endrer noe ved betydningen av det vi kaller for klassifisering, som nettopp er den arbeidsoperasjon vi gjennomfører når vi skal ordne variabeler på nominalni vå. Og fordi klassifikasjon er sentralt på dette målenivået, skal vi bruke litt tid til å ta klassifikasjonsprosessen nærmere i øyesyn. La oss si at vi ønsker å klassifisere en mengde personer etter problemstil lingen: Hvordan er kjønnsfordelingen i denne mengden av personer? Her vil vi naturligvis bruke kjennetegnet eller variabelen «kjønn» som klassifikasjonsgrunnlag. Kjønn har som kjent to kjennetegn eller attributter: mann og kvinne. Elementene i mengden (dvs. personene) skal følgelig tilordnes de to klassene «mann» og «kvinne» etter sine egenskaper. Når vi som her har bare to egenskaper knyttet til en variabel, har vi følgelig også bare to klasser: Har egenskapen - har ikke egenskapen. Klassifiseringen av en mengde personer ut fra kjennetegnet (variabelen) kjønn med de mulige egenskapene mann/kvinne, gir derfor følgende klas sifikasjon: Alle personer med egenskapen kvinne
Alle personer med egenskapen mann
Det finnes en mengde regler for hvordan vi i praksis skal klassifisere - både logiske og forskningsstrategiske. Her skal vi bare gjengi den mest grunnleg gende logiske og den tilsvarende forskningsstrategiske klassifikasjonsregel (Ugelvik-Larsen 1976):
1 Den logiske regel Når vi klassifiserer, må vi gjøre det slik at ingen av elementene i mengden blir klassifisert i mer enn en klasse. De ulike klassene vi har valgt å plassere elementene i må altså både være uttømmende og gjensidig utelukkende. 2 Den forskningsstrategiske regel Denne dreier seg om operasjonell klarhet, og sier rett og slett at klassifika sjonen må basere seg på begreper som er operasjonelt definert, slik at det blir entydig klart hva begrepet innebærer. Dette er uproblematisk i forbin-
107
deise med «mann/kvinne», men dersom vi for eksempel ønsker å klassifise re ledere som «autoritære» eller «demokratiske», blir det straks vanskeligere. Noen ganger ser vi at det også i forbindelse med data på nominalnivå tilordnes tall til en variabels ulike verdier, eksempelvis når man til spørsmålet «bosted» gir følgende svaralternativer med ulike tallverdier: Oslo
Bergen
Trondheim
Stavanger
Annet
1
2
3
4
5
Her er det imidlertid viktig å være oppmerksom på at tallene brukes som helt vilkårlige «navn» på de ulike verdiene. Det er altså ikke tale om verken rangordning eller avstand, og det er helt likegyldig hvilket tall vi anfører til de ulike verdiene. I ovennevnte «skala» kunne Oslo like gjerne ha tallverdi en 5 og Annet 1, eller Oslo kunne ha 53 og Annet 17, dersom vi syntes det var noe poeng. Bruk av tallverdier på nominalnivå henger utelukkende sam men med muligheten for maskinell behandling av dataene, og det er kan skje riktigst å si at tallene fungerer som «koder». Som Galtung (1969) un derstreker: «At the nominal level numbers serve only to keep what is diffe rent apart and join together what is considered equivalent.» Etter nå å ha gått igjennom og diskutert egenskaper knyttet til de fire forskjellige målenivåene, vil vi avslutningsvis stille opp en skjematisk over sikt over de fire måleskalaene der vi stikkordsmessig karakteriserer dem, samt henviser til noen av de viktigste statistiske analysemetoder som benyt tes på de ulike målenivåene. Vi er klar over at begreper som for eksempel kji-kvadrat (test) kanskje ikke er kjent for lesere av boka. Vi kommer heller ikke - slik vi gjorde klart i innledningen av boka - til å gå særlig inn på dataanalysedelen, hvilket betyr at den som alt nå ønsker nærmere innføring i statistikk og dataanalyse, må finne den i en dertil egnet innføringsbok. (Se ellers forslag til videre lesing nedenfor.) Målenivå
Eksempel
Egenskap
Analyseverktøy
Forholdstall
Liter øl konsumert pr. år
Som for intervall
Som for intervall
Intervall
Holdning til øking av bensin avgiften måles til +2,5 på en Likert-skala
Målbar rangering
Modus median aritmetisk gj.snitt standardavvik
Ordinal
Foretrekker lønn fremfor avspassering
Rangering
Modus median prosentil kji-kvadrat
Nominal
Har bil/har ikke bil
Enten/eller
Modus kji-kvadrat
108
Stikkord til kapittel 12 måleskalaer skalanivå/målenivå klassifisering
Øvingsoppgaver til kapittel 12 I en lærebok i markedsforskning (Seines 1993) finner vi følgende eksempel på spørsmål på intervallnivå: a) Vennligst angi i hvilken grad De er enig i følgende påstand: «Flatbrød er et grått og kjedelig produkt!» Helt uenig
Uenig
Verken/eller
Enig
Helt enig
1
2
3
4
5
Med referanse til diskusjonen rundt skalanivåer i kapitlet, skal du foreta en kritisk drøfting av dette eksemplet. b) I mange undersøkelser bes respondenter blant annet om å oppgi alder. Når resultatet av slike undersøkelser gjengis, finner vi som regel alder grup pert i kategorier eller klasser. For eksempel slik: 15-25
26-35
36-45
46-55
56 og eldre
Hva slags målenivå er dette? Konstruer skalaen slik at den tilfredsstiller kravene til ulike målenivåer.
Litteratur å gå videre med Hellevik, O.: Forskningsmetode i sosiologi og statsvitenskap, Universitetsfor laget, 1993. Krokan, A.: Forstå statistikk. Statistiske metoder for samfunnsfag og huma niora, Kolle Forlag, 1995.
109
Kapittel 13
Validitet og rdiabilitet Vår tidligere diskusjon rundt det vi kalte teoretiske og operasjonelle defini sjoner bringer oss nokså umiddelbart inn i et annet problemområde, nem lig det som har med en undersøkelses reliabilitet og validitet å gjøre. Vi har tidligere vært inne på kvaliteten av en undersøkelse. I praktisk talt alle kritiske vurderinger av empiriske undersøkelser trekkes spørsmålet om undersøkelsens reliabilitet og validitet fram. I den sammenheng synes det som om det hersker stor enighet om iallfall én ting, nemlig at høy reliabili tet og høy validitet er et gode. Derimot finner vi nokså forskjellige oppfat ninger av hva som egentlig menes med henholdsvis reliabilitet og validitet, og den enkelte forsker eller kritiker går sjelden særlig dypt i analysen av sin egen bruksmåte av begrepene. Det skal heller ikke vi gjøre, men vi skal iall fall bruke noen sider på å drøfte dem. Kort fortalt dreier reliabiliteten av en undersøkelse seg om hvor nøyaktig undersøkelsen er gjennomført, mens validiteten går på hva undersøkelsen har kastet lys over - om den ga informasjon om det som ble formulert i pro blemstillingen. For en nærmere utdyping av dette starter vi med et eksempel: Et museum i en liten amerikansk by var stolt av sitt høye besøkstall som, naturlig nok, ble tatt til inntekt for innbyggernes høye kulturelle interesse. Stor ble derfor forbauselsen da man etter at de kommunale myndigheter hadde reist et lite bygg vegg i vegg med museet, konstaterte at museets be søkstall falt betydelig. Hva den lille bygningen inneholdt? Et offentlig toa lett! (Etter Høivik 1974.) Dette er et eksempel på lav validitet. Et tall (her museets besøkstall) kan i og for seg være korrekt (reliabelt), men likevel ikke relevant for det vi ønsker å måle. Ikke alle forbrytelser blir anmeldt, ikke alle innkjøpte bøker blir lest, og ikke alle går gjennom museumsdøren for å nyte kulturens gleder. Problemet med validitet oppstår primært når det som registreres (måles) ikke har direkte sammenheng med det problemet som skal undersøkes. Høy eller lav validitet er altså noe som karakteriserer forholdet mellom da taene og måten de registreres på. I eksemplet over er museets besøkstall en valid indikator på antall besøkende, men ikke på antall kultursøkende. Til110
svarende kan kriminalstatistikken brukes som indikator på politiets arl mengde, men ikke uten videre på kriminaliteten i samfunnet.
Nærmere om validitet Som Hellevik (1993, s. 156) understreker, oppstår validitetsproblemer for di forskeren er nødt til å arbeide på to plan: teoriplanet og empiriplanet, og overgangen fra det første til det andre er ikke uproblematisk. Vi arbeider på teoriplanet når vi arbeider med å formulere problemstil lingen, avgrenser de fenomener vi er interessert i og definerer begreper teo retisk. Måleprosessen, derimot, foregår i sin helhet på empiriplanet. For at vi skal lykkes i å gripe de deler av virkeligheten vi er interessert i, må det altså være samsvar mellom bruken av et bestemt begrep på de to planene. Helle vik benytter betegnelsen «definisjonsmessig validitet» som uttrykk for hvor ' godt dette samsvaret er. I den før omtalte undersøkelsen av gjeldskrisen blant norske husstander vil svaret på spørsmålet om hvilket av de to under søkelsesresultatene vi kan stole på avhenge av hvem som best har klart å oppnå slikt samsvar. Er det for eksempel samsvar mellom begrepet «gjelds krise» og det som uttrykkes som konkret svar på spørsmålet «Hvor ofte vil du si at dine regninger først betales etter tredje gangs purring?» Et problem når det gjelder vurderingen av en undersøkelses validitet er at samsvaret mellom den teoretiske og den operasjonelle definisjonen ofte ikke lar seg fastslå gjennom empiriske tester. Det finnes riktignok i en del, oftest amerikanske, lærebøker i metode ulike forsøk på å beskrive tester som skal hjelpe oss med å avgjøre validiteten av en undersøkelse, men det er i praktisk forskningsarbeid likevel grunn til å sette spørsmålstegn ved disse testenes teoretiske utgangspunkt og praktiske gjennomførbarhet. Det er, for igjen å referere til Hellevik, kanskje mulig gjennom slike tester å fa visse holdepunkter for å bedømme validiteten, men til syvende og sist blir dette langt på vei et spørsmål om skjønn. La oss likevel knytte noen kommentarer til forsøkene - på «objektivt» grunnlag - på å avgjøre en undersøkelses validitet. Sentralt i slike forsøk står to typer validitet, nemlig det som kalles «indre validitet» og «ytre validitet». Langt på vei er indre validitet overensstemmende med hva vi har diskutert til nå, nemlig samsvarproblemet. Det vil si at i forholdet mellom teoretisk og operasjonell definisjon, henger ytre validitet sammen med prediksjonsproblemet - det vil si i hvor stor grad for eksempel svar på et spørsmål stem mer overens med et «objektivt» mål på samme fenomen. Dersom for ek sempel en persons (kvinnes?) svar på spørsmålet «Hvor gammel er du?»
111
samsvarer dårlig med det vi kan lese ut av vedkommendes dåpsattest, har undersøkelsen lav ytre validitet fordi det avgitte og registrerte svar er lite eg net til å forutsi vedkommendes alder. I dette eksemplet kan den ytre validiteten altså måles som grad av over ensstemmelse mellom to sett av «svar», nemlig intervjuobjektets svar på spørsmålet «Hvor gammel er du?» og dåpsattestens svar på det samme. I dette tilfelle vil det antakelig være stor grad av enighet om at gyldigheten til det svar vi bruker som kontroll, nemlig dåpsattestens faktiske informasjon, angir at den ytre validiteten av undersøkelsesresultatet var lav. I svært mange andre sammenhenger, derimot, hvor vi ikke kan holde våre respondenters svar opp mot slik «faktisk informasjon» om et saksfor hold, står vi igjen tilbake i en vurderingssituasjon. Oppsummeringsvis kan vi si at validiteten av en undersøkelse henger sammen med: -
måleinstrumentets evne til å måle det det faktisk er ment å måle dataene vi fremskaffer ved hjelp av måleinstrumentet vårt resultatet av undersøkelsen tolkningen av resultatene
Altså: Er for eksempel resultatene fra Examen Philosophicum valide mål på hvordan studenter gjør det videre i sine studier? Og hvis det viser seg at de er det, kan karakterene i så fall ses på som valide mål på studenters intelli gens? Validiteten på våre data er koplet sammen med validiteten på måleinstru mentet vårt. Dersom det å stille folk spørsmål vedrørende opplevelser i barndommen ikke er en valid fremgangsmåte for å skaffe oss sikre kunnska per om folks barndomsopplevelser (pga. glemsel eller fortrenging), vil na turligvis heller ikke de data vi fremskaffer gjennom en slik spørreundersø kelse være valide. Og videre: Dersom de fremskaffede data er valide, er i så fall de resultater og konklusjoner vi kommer fram til også automatisk valide? Undersøkelser blant skoleelever i USA viser at elever med orientalsk bak grunn (japanere, koreanere osv.) jevnt over gjør det bedre i matematikk enn de øvrige elevene. Hvorfor? Er dette et resultat av at disse elevene kommer fra hjem med en lavere skilsmisseandel enn de øvrige elevene? Ja, skilsmisse andelen er lavere, men nei, dette er ikke forklaringen! Uansett: Det gjennomgående problemet med validiteten er at vi i sam funnsvitenskapelig forskning aldri kan utsi med 100 % sikkerhet at vi har å gjøre med et valid måleinstrument eller er kommet fram til valide resultater. Som vi har påpekt tidligere: Forskning gir sjelden grunn til skråsikkerhet.
112
Det beste vi kan gjøre er å forsøke å komme nærmere og nærmere sannhe ten gjennom bedre og bedre målinger av den virkelighet vi er nysgjerrige på. Våre teoretiske begreper, enten det dreier seg om «gjeldskrise» «kjønns rolle», eller «intelligens», må i siste instans legitimeres gjennom den virk ning vi kan dokumentere at slike fenomener har på målbar atferd. Dersom for eksempel kvinner systematisk velger utdanningsveier og yrker annerle des enn menn, og dersom individer med over middels intelligens systema tisk gjør det bedre på skolen eller i studiene enn de med under middels in telligens - ja, da kan begreper som kjønnsrolle og intelligens sies å være valide uttrykk for en bestemt, målbar atferd.
Reliabilitet Det er imidlertid praktisk og teoretisk nesten umulig å diskutere begrepet validitet uten samtidig å inkludere et annet, vesentlig begrep, nemlig relia bilitet. Dette begrepet antas vanligvis å være noe mindre omstridt enn vali ditet. Det er i litteraturen større enighet om betydning og bruk av dette be grepet, og dessuten er det ikke teoretisk like fundamentalt som validiteten selv om en kan hevde at reliabilitet er en betingelse (nødvendig, men ikke tilstrekkelig) for validitet. Når det gjelder spørsmålet om å bestemme en un dersøkelses reliabilitet, er vi også heldigere stilt enn når det gjelder validitet. Når det gjelder å avgjøre en undersøkelses reliabilitet, det vil si hvorvidt målingene som leder fram til de endelige resultatene er utført så nøyaktig at vi kan stole på dem, så finnes det altså tester som gjør oss i stand til, empi risk, å vurdere reliabiliteten av en undersøkelse. Dels dreier dette seg om tester der samme fenomen undersøkes på ulike tidspunkt (den såkalte test-retest-metoden), dels dreier det seg om ulike tester av samme fenomen gjennomført samtidig (såkalte parallelle tester). I det første tilfellet er det stabiliteten i målingene som undersøkes, i det andre tilfellet graden av ekvivalens i resultatene. Hva skal så til for å sikre høy reliabilitet? Et sett av ulike faktorer vil i praksis påvirke reliabiliteten av en undersø kelse. Viktigst er de som har med måleinstrumentet og selve måleprosessen å gjøre. Også sider ved dataanalysen har konsekvenser, men for vår del vil vi understreke at det først og fremst er vårt arbeid med måleinstrumentet (for eksempel pre-testing av spørreskjemaet) og opplæring (for eksempel av in tervjuere) som kan bidra til reliabilitetsforbedring. Vi kan antakelig sammenfatte diskusjonen rundt reliabilitet og validitet med å si at:
113
«The problem of the relation between the recorded data and the 'true facts' is commonly called the question of validity. Related to it is the pro blem ot the agreement of repeated measurements of the same fact. This is the question of reliability» (Stephan og McCarthy, 1958:83).
Og videre: «Reliability is a necessary prerequisite for validity. Unreliable instruments always lack validity» (Zetterberg, 1967:43).
Forholdet mellom reliabilitet og validitet er altså slik at resultatet av en un dersøkelse kan være både valid og reliabelt, reliabelt, men ikke valid, men al dri valid uten også å være reliabelt. Med dette anser vi oss for å være ferdig med diskusjonen rundt det vi har kalt overgripende problemer i forbindelse med det å gjennomføre undersø kelser av sosialt eller samfunnsmesig betingede fenomener. Resten av boka vil dreie seg om de mer «praktiske grep» vi kan og bør gjøre i forbindelse med gjennomføringen av undersøkelser. Det er undersøkelsesprosessen, slik vi har diskutert den tidligere i boka, som vil gi rammen for gjennomgangen. Følgelig vil vi ta for oss de ulike arbeidsfasene, fra det å utforme undersøkelsesproblemet til vi er i mål, det vil si har gjennomført analysen av de innsamlede data. Vi vil bestrebe oss på å være praktiske. I denne delen av boka vil det mer umiddelbare «nytteaspek tet» være i fokus, men vi kan heller ikke her garantere at fremstillingen blir fri for problematisering. Det er nok en slags ambisjon at «kokebokpreget» ikke skal bli for sterkt.
Stikkord til kapittel 13 validitet, indre og ytre reliabilitet forholdet reliabilitet - validitet
Øvingsoppgaver til kapittel 13 Diskuter forholdet mellom reliabilitet og validitet i forbindelse med gjen nomføring av en tenkt undersøkelse av bedriftskulturen i NSB .
114
Hva kan true reliabiliteten og validiteten av en slik undersøkelse? Hva kan eventuelt gjøres for å sikre høy reliabilitet og validitet?
Litteratur å gå videre med Høivik, T.: Mål 0/7 metode, Universitetsforlaget, 1974. Hellevik, O.: Forskningsmetode i sosiologi og statsvitenskap, Universitetsfor laget, 1993.
Kapittel 14
Gungen i en undersøkelse Utforming av undersøkelsesprobkmet I alle metodebøker understrekes betydningen av en presis og avgrenset for mulering av den problemstilling vi akter å gi oss i kast med. Uttrykk som «formuler problemet og det er løst» understreker dette forholdet på en spissformulert måte. Det er imidlertid verd å merke seg at problemformuleringsfasen har et vesentlig forskjellig forløp i en klart anvendelsesbasert mar keds- eller organisasjonsundersøkelse og en mer «fri» akademisk undersø kelse. Det kan derfor være hensiktsmessig å behandle problemformuleringsfasen knyttet til disse to typer av undersøkelser separat, selv om det i praksis vil være overgangsformer mellom de to typene.
Markeds- og organisasjonsundersøkelsen I en markeds- eller organisasjonsundersøkelse er det vanligvis ikke forske ren, men oppdragsgiveren som først blir oppmerksom på problemet. Det kan være endringer i bedriftens omgivelser, produktivitet eller trivsel blant de ansatte. Det er vanligvis først når et problem er registrert at forskeren involveres. Dennes første oppgave er - sammen med oppdragsgiver - så presist som mulig å definere eller identifisere det problem hvis symptomer (misfornøy de medarbeidere, fallende produktivitet, tap av markedsandeler) allerede har blitt observert. Denne prosessen er både krevende og viktig, og fordrer så vel kreativitet som innsikt og analytisk evne. En god og formålstjenlig problemdefinisjon angir retning for hele undersøkelsesprosessen. Anthony Miles, vice-president i Boston Consulting Group, peker på tre sentrale spørsmål han alltid ønsker å besvare under problemstillingsfasen: 1 Hva skal informasjonen brukes til? 2 Finnes denne informasjonen tilgjengelig allerede? 3 Kan undersøkelser løse problemet?
Mye tid og betydelige kostnader har vist seg å være bortkastet fordi opp-
116
dragsgiver ikke i tilstrekkelig grad har tenkt igjennom hvorfor han ønsker å gjennomføre en undersøkelse. Som ledd i en bevisstgjøringsprosess kan det derfor innledningsvis være nyttig og kanskje også nødvendig at forsker og oppdragsgiver sammen diskuterer hva den informasjon undersøkelsen ven tes å fremskaffe skal brukes til, og hvilke beslutninger den kan gi grunnlag for. Det kan også skje at forskeren igangsetter sin undersøkelse uten først å bringe på det rene om den informasjon man er på jakt etter allerede finnes tilgjengelig. Det synes ofte som om det er en tendens til å mene at egne innhentede data alltid er å foretrekke fremfor data innsamlet av andre på et tidligere tidspunkt, til tross for at dette må vurderes i hvert enkelt tilfelle ut fra faktorer som ambisjonsnivå, tids- og kostnadsbruk - for å nevne noe. Det er også viktig å forsøke å bringe på det rene om det problem opp dragsgiver har faktisk kan løses ved hjelp av for eksempel en markedsunder søkelse. Eksempelvis hadde Pepsi Cola i mange år problemer med å vinne innpass på det norske markedet. Årsaken hadde imidlertid med distribusjon å gjøre, og all verdens markedsundersøkelser kunne neppe hjelpe til med å løse dette problemet. Noe av årsaken til at markedsforskning i enkelte tilfel ler har pådratt seg et frynset rykte, er nettopp at markedsforskere har latt være å vurdere i hvilken grad en markedsundersøkelse er det «riktige svar» på oppdragsgiverens problem.
Sentrale utfordringer I arbeidet med å komme fram til en god utforming av den problemstilling som skal hjelpe oss med å treffe fruktbare valg i forskningsprosessens senere faser, er det viktig å være klar over at vår egen «referanseramme», det vil si de forestillinger vi har om det problem eller fenomen vi skal undersøke, ut gjør et vesentlig premiss. Slike forestillinger, som i høy grad henger sammen med rådende forskningsparadigmer innen det felt vi arbeider på, vil ofte gi oss rammen eller forutsetningene for hva vi definerer som vesentlig eller in teressant nok til at det «fortjener» å bli forsket på. Det blir derfor en utfordring for forskeren at flest mulig av de forutset ninger problemstillingen bygger på formuleres eksplisitt i undersøkelsen. Bare da blir det mulig både for forskeren selv og hans publikum å ta stilling til hvor rimelig og fruktbar en formulert problemstilling synes å være. Arbeidet med formulering av problemstillingen fremstår ikke sjelden som den vanskeligste og mest krevende fase i hele undersøkelsesforløpet (Holme og Solvang, 1995). Den er vanskelig fordi den avkrever forskerens begrunnelser og svar på hvorfor man arbeider i den ene eller den andre ret117
ning, og den er krevende fordi den forutsetter viten (teori/empiri) man sjelden er i besittelse av. Ofte må vi derfor gjette, vurdere og innhente ufull stendig informasjon for i det hele tatt tilnærmelsesvis å kunne angi i hvilken retning vi arbeider eller ønsker å arbeide. Prosessen vanskeliggjøres ytterligere av at vi heller aldri vet når vi skal el ler kan stoppe. Når kan vi si at vi har funnet fram til den «riktige» problem stillingen? Erkjennelsesprosessen (og dermed kunnskapsproduksjonen) begynner jo allerede fra det øyeblikk hvor vi begynner å tenke over et eller annet pro blem - og den stopper i realiteten aldri. For selv etter at vi har gjennomført en på alle måter oppskriftsmessig undersøkelse av et veldefinert og velavgrenset fenomen, oppstår det som regel flere ubesvarte spørsmål enn det vi selv var i stand til å formulere i begynnelsen av prosessen. La oss - i et forsøk på å anskueliggjøre noe av det vi har pekt på - gå igjennom et eksempel på en problemformuleringsprosess. Som vi vil se er eksemplet hentet fra markedsforskning, men det hindrer naturligvis ikke at det er illustrerende også for hvordan problemformuleringsprosessen innen samfunns- eller organisasjonsundersøkelser gjerne forløper. La oss tenke oss at vi har fatt i oppdrag fra en EDB-programvareleverandør å undersøke behovet for EDB-program som pedagogisk hjelpemiddel i norsk grunnskole. Oppdragsgiver er usikker på om utvikling av programva re til undervisningsbruk vil være lønnsomt (utviklingskostnadene er betyde lige), og ønsker derfor at det skal gjennomføres en markedsundersøkelse med sikte på å komme fram til et sikrere beslutningsgrunnlag. For å gjennomføre en relevant markedsundersøkelse må vi kjenne opp dragsgivers problem og beslutningssituasjon, slik at undersøkelsestema og problemstilling dekker et reelt informasjonsbehov. For å lykkes med en markedsundersøkelse må vi basere den på grundig forarbeid i problemformuleringsfasen, og på bevissthet om at resultatene av undersøkelsen skal gi (et godt) grunnlag for faktiske beslutninger. Det heter seg at et upresist svar på et riktig spørsmål er mer verd enn et presist svar på et galt spørsmål. Med dette mener vi at det kan ofte være van skeligere å finne fram til de rette spørsmålene enn å finne de rette svarene. Ideelt sett bør informasjonsbehovet presiseres så godt at problemformuleringsfasen kan munne ut i et sett av hypoteser, det vil si begrunnede på stander om saksforhold. Hypoteser gir oss et godt grunnlag både for å klargjøre hvilke spørsmål vi bør stille, samt fungere som rettesnor for de videre fasene i undersøkel sesprosessen. Før vi kan formulere vår endelige problemstilling, bør det altså være en forutsetning at vi foretar en grundig analyse av det problemområdet vi øn-
118
sker å undersøke. I vårt tilfelle kan en slik analyse for eksempel ta for seg føl gende forhold:
Beslutningsproblemer Hvilke beslutningskriterier benyttes? -
læring pris brukervennlighet oppdateringsmuligheter tilleggsytelser totalløsning
Hva er målet med beslutningen?
- anskaffelse av programvare - løsning av læringsproblemer Hvilke begrensninger finnes?
-
økonomi tid til opplæring tid til forberedelser for lærerne forkunnskaper skepsis til edb
Hvor betydningsfull er beslutningen? - betydningsfull, stor investering - betydningsfull, binder skolen opp for flere år Hvilke alternative beslutninger skal evalueres fra kundens side?
-
hvilke alternativer som eksisterer IBM Apple Tiki
119
Vare problemer -
skolene mangler generelt kunnskap om EDB-løsninger skolene mangler kunnskap om oss som leverandør myndighetene kan anbefale en annen leverandør generasjonskløft, beslutningstakerne er ofte eldre lærere verdien av investeringen, hva tror de de får igjen
Hva skal oppdragsgiver bruke undersøkelsesresultatene til?
- politisk/økonomisk: oppdragsgivere holder til på et mindre tettsted og kan med bakgrunn i resultatene fra markedsundersøkelsen søke om støt te fra SND - strategi - salgsargument, undersøkelsen gir signaler om viktige salgsargument - skreddersy tilbud, produkt/pris/service På bakgrunn av en slik gjennomgang sammen med oppdragsgiver, bestem mer vi oss for å formulere følgende problemstilling:
- «Vi vil gjennomføre en markedsundersøkelse der målsettingen er å kart legge norske grunnskolers innstilling til bruk av EDB som pedagogisk hjelpemiddel i undervisningen.»
Konkret skal undersøkelsen gi svar på følgende spørsmål: - Hvor mange skoler har bestemt seg for å anskaffe datautstyr i løpet av inneværende eller neste skoleår? - Hvilken type maskin/p ro gramvare har disse skolene vurdert? - Hva blir det lagt mest vekt på ved beslutning om kjøp? - Hvem tar beslutningen?
Når databehovet vårt er beskrevet på denne måten, blir vårt neste skritt å identifisere datakildene, det vil si finne fram til hvor vi kan hente den infor masjonen som trengs for å besvare spørsmålene over. Prinsipielt kan disse dataene være av to typer: - Sekundærdata, det vil si data som allerede finnes, men som vi må lete opp i litteraturen, i forskningsrapporter, i bedrifters regnskap, på Inter nett o.l. (se neste kapittel).
120
- Primærdata, det vil si data vi selv må tilveiebringe ved å gjennomføre undersøkelser der vi selv bestemmer metode, utvalg, analyseverktøy osv.
I eksemplet over ble det raskt klart at for å fa svar på de undersøkelsesspørsmål som ble stilt, var det behov for å gjennomføre en primærdatainnhenting. Dette skjedde imidlertid først etter at oppdragsgiver sammen med forskningsinstituttet hadde sporet opp og vurdert den informasjon de kun ne fa fra blant andre Statistisk sentralbyrå, Kirke, utdannings- og forskningsdepartementet og Norsk senter for internasjonal skoleutvikling (IMTEC), som alle hadde utgitt rapporter fra forsøk med datateknologi i sko len. (Som undersøkelsesmetode ble valgt spørreskjemautsendelse. Spørre skjemaet er gjengitt som vedlegg bakerst i boka.) Gjennomgang av sekundærdatakilder var altså et viktig skritt på veien mot en vurdering av behovet for å gjennomføre en egenundersøkelse. I dette eksemplet fant man, etter å ha gjennomgått og vurdert relevant sekundærinformasjon, at disse ikke dekket det databehov problemanalysen hadde identifisert. Det er likevel liten tvil om at sekundærdatagjennomgang er en nyttig og nødvendig fase i enhver undersøkelsesprosess: - Sekundærdata gir oss generell innsikt og hjelper oss dermed med å for mulere undersøkelsesproblemet vårt på en bedre og mer presis måte. - Sekundærdata kan gi oss tips om metodevalg, utvalgsstrategi og analyse metode («benchmarking»). - Sekundærdata forsyner oss med resultater fra liknende undersøkelser som vi kan sammenlikne med våre egne, og på den måten trekke kon klusjoner med større grad av sikkerhet. Det er altså all grunn til å avlegge disse såkalte sekundærdata en nærmere vi sitt.
Stikkord til kapittel 14 undersøkelsesproblemet problemstillingen beslutningsproblemet
121
Øvingsoppgave til kapittel 14 For en tid tilbake ble den første såkalte «telefonbanken» (NOR-24) lansert. Tenk deg at du på oppdrag fra Sparebanken NOR ble bedt om å gjennom føre en markedsundersøkelse forut for en tenkt lansering av NOR-24. Drøft hvilket beslutningsproblem og undersøkelsesproblem oppdragsgiver (og du) sto overfor. Skisser videre et undersøkelsesopplegg i tråd med EDB-eksemplet i kapitlet.
Litteratur å gå videre med Holme, I.M. og B.K. Solvang: Metodevalg og metodebruk, TANO, 1995. Halvorsen, K.: Å forske på samfunnet, 1993.
Kapittel 15
Innsamling av sekundærdata Som vi alt har vært inne på, vil data samlet inn i forbindelse med en under søkelse prinsipielt være av to forskjellige slag: 1
data samlet inn spesielt for den aktuelle undersøkelsen, altså data som ikke hadde eksistert dersom ikke vi hadde sørget for å samle dem inn
2 data frembrakt uavhengig av undersøkelsen vår
Det er denne siste typen vi kaller sekundærdata. Forholdet mellom sekundær- og primærdata er ikke nødvendigvis noe enten-eller. Snarere er det i en gitt undersøkelse oftest spørsmål om et både-og. Vi trenger, slik det forhåpentligvis også ble klart i eksemplet i for rige kapittel, faktisk begge datatyper. De to datatypene krever imidlertid forskjellige arbeidsformer. Den store fordelen med primærdata er at vi med utgangspunkt i hvilke opplysninger vi ønsker selv kan bestemme undersøkelsesopplegg, utvalg, datainnsamlingsmetode, analyse osv., slik at kravene til dataenes omfang, nøyaktighet og representativitet blir tilfredsstilt. Ulempen er den store ar beidsinnsats (og de ofte betydelige kostnader) som kreves hver gang en un dersøkelse gjennomføres. Problemene med sekundærdata er at kildene ofte ikke gir oss de data vi helst ville hatt, at opplysningene er ufullstendige, og at feilkildene er uten for vår kontroll. Bruken av den ene eller den andre av de to datatypene må i det enkelte tilfelle i siste instans derfor bli resultat av vurdering og aweiing av formål, tids- og kostnadsbruk, ambisjoner osv. i forbindelse med den un dersøkelse vi ønsker å gjennomføre. I denne fremstillingen vil vi legge hovedvekten på primærdatainnsamlingsmetoder, men vi finner det også nødvendig å bruke litt tid på sekundærdataproblematikken. Sosiologen Stein Rokkan har foreslått en inndeling av sekundærdata i tre kategorier som han kaller henholdsvis prosess-, bokholderi- og forsknings data. Tabellarisk kan dette fremstilles slik:
123
Typer av sekundærdata Struktureringsgrad
Høy
Lav
Generering Prosessdata
Bokholderidata
Forskningsdata
Dagbøker
Valgdata
Intervju med faste svaralternativer
Privatbrev
Folketellinger
Åpne intervjuer
Avisinnlegg
Likningsdata
Muntlige historier
Plakater
Bedriftsregnskap
Antropologiske rapporter
Graffiti
Husholdningsregnskap
Psykoanalytiske protokoller
I oversikten over refererer struktureringsgraden seg til hvor systematisk for beredt dataproduksjonen er, og hvor standardiserte og kvantifiserte dataene blir, mens genereringen henviser til den sosiale sammenheng data oppstår i med et skille mellom: - data med umiddelbar tilknytning til den løpende aktivitet i samfunnet - data registrert i et administrativt apparat - data produsert ved forskning
Innen samfunnsfagene finner vi i stadig høyere grad forsøk på å bryte ned faggrensene og ta i bruk data og metoder som andre fag har spesialisert seg på. Men grensene har lange tradisjoner, og særegne former for ekspertise har gjennom tidens løp utviklet seg bak dem. Det er for eksempel ennå nødvendig å lese historisk og filologisk faglitteratur for å få tilgang til de beste diskusjoner rundt bruken av prosessdata og for vurderinger av eldre tiders bokholderidata. Studiet av befolkningsstatistikk krever at vi setter oss inn i demografens tenkemåter, mens økonomiske data bare kan tolkes for nuftig ut fra en viss sosial- eller bedriftsøkonomisk innsikt. Det er derfor ikke overraskende at sosiologer og statsvitere har sin styrke i tabellens øvre høyre hjørne, mens for eksempel sosialantropologene - ek sperter på de mykeste metoder og de som må tolke det som ikke sies åpent i ord og tall - er mer på hjemmebane nederst til høyre. Som vi har vært inne på under vår drøfting av forskningsdesignet, må bruk av sekundærdata nesten betraktes som en nødvendig del av et hvilket som helst undersøkelsesopplegg. Det betyr imidlertid ikke at vi står overfor en valgsituasjon der vi skal vurdere om undersøkelsen vår kan gjennomføres 124
som en «ren» sekundærdataundersøkelse eller om vi må samle inn egne data. Snarere er det slik at sekundærdataene kan hjelpe oss på vei, eksempel vis gjennom å gi oss teoretisk innsikt eller tips om metodevalg. De fleste un dersøkelser baserer seg på innsamling av egen informasjon relatert til den spesielle problemstilling som gir utgangspunkt for undersøkelsen. Det fin nes likevel eksempler på undersøkelser som helt og holdent har basert seg på sekundærdata. Hyppigst, kanskje, innenfor markedsforskningen, der fo religgende data om for eksempel markedsandeler, forbruk eller fritidsaktivi teter kan danne grunnlag for eksempelvis utvikling av et foretaks markedseller kommunikasjonsstrategi. Det er imidlertid viktig å forholde seg til sekundærdata med en viss for siktighet. Det hefter seg nemlig noen begrensninger ved bruken av dem. Ett problem er naturligvis at det for enkelte problemstillinger rett og slett ikke finnes sekundærdata å oppdrive. Det kan bero på at ingen har forsket på liknende problemstillinger. Mer sannsynlig er det likevel at dataene fin nes, men ikke er tilgjengelige for enhver. I Hansa-eksemplet visste man at det blant øldrikkere var skepsis til all «tukling» med pilsnerølet, men det fantes selvsagt ingen sekundærdata som kunne fortelle dem hvorvidt deres nyutviklede produkt virkelig kunne bli akseptert blant forbrukerne. Hansa måtte selv teste produktet blant potensielle konsumenter. Et annet problem forbundet med bruk av sekundærdata er mangel på re levans. De data vi eventuelt finner fram til, har opprinnelig blitt samlet inn for å løse et annet problem enn vårt, og de «passer» derfor ofte mindre godt i forhold til våre spesifikke behov. Manglende aktualitet er et annet problem. Tiden fra dataene har blitt samlet inn til de har blitt alminnelige og tilgjengelige løper raskt opp i et par år eller mer. Dermed blir sekundærdata lett «historiske» og må følgelig bru kes med en viss forsiktighet. Kvalitetskontroll er også problematisk. Fordi det ikke er oss selv, men an dre som har samlet inn de dataene som vi benytter oss av, kan det ofte være vanskelig å vurdere kvaliteten på dataene. Som et forsøk på å danne oss et bilde av kvaliteten kan det ofte være lurt å stille et par (kritiske) spørsmål før vi tar de foreliggende dataene i bruk. Ett slikt spørsmål går på hvem som opprinnelig har samlet inn disse dataene. Kilden til sekundærdataene kan gi oss indikasjoner på dataenes pålitelig het. Mens for eksempel Statistisk sentralbyrå så å si alltid gjennomfører sine undersøkelser «etter læreboka», kan det i mange andre tilfeller være beretti get grunn til å stille spørsmål ved både kvaliteten og seriøsiteten til den som har stått for undersøkelsen. Særlig er nok dette tilfellet ved en del kommer sielle undersøkelser (eksempelvis har fagtidsskriftet Kampanje ved flere an ledninger kommet over resultater av markedsundersøkelser som man har
125
måttet forkaste som underlag for artikler fordi kvaliteten på undersøkelsene viste seg ikke å holde faglig mål). Likeledes kan det være fornuftig å forsøke å finne ut hva som var hensik ten med den opprinnelige undersøkelsen. Data blir alltid innhentet med et bestemt mål for øye, og kunnskap om undersøkelsens mål kan også være med på å forbedre vår mulighet for kvalitetsvurdering. Mange lærebøker i metode har en egen oversikt over tilgjengelige og mye brukte kilder for sekundærdata. Vi finner derfor ingen grunn til å gjen ta dette her, men henviser til for eksempel Seines (1993) eller Holme og Solvang (1995). Uansett er det liten tvil om at utviklingen innenfor EDB som gir oss til gang til et stadig større antall databaser, og ikke minst det som skjer på In ternett, gjør tilgjengeligheten og bruksmulighetene for sekundærdata sta dig bedre. Likevel- det vi har anført ovenfor, står fast. Sekundærdataene er ikke «våre» data. De kan ofte gi oss verdifull hjelp på veien, men vil sjelden helt ut kunne erstatte egen innsamling av informasjon. Vi vil derfor i resten av boka se nærmere på noen metoder for innsamling av primærdata. Den fremstillingen vi gir er på ingen måte komplett. Vi velger å konsentrere oss om de vanligste datainnsamlingsmetodene, nemlig de som har som et felleskjennetegn at de forutsetter verbal informasjon. Denne informasjonen kan gis muntlig eller skriftlig, og det kan dreie seg om mange eller få respondenter. Vi kan videre velge å kvantifisere informa sjonen (dvs. gjøre svarene om til talluttrykk) eller beholde informasjonen slik den gis. Både såkalt kvantitativ og kvalitativ metode har sine primære bruksområder innenfor datainnhentingsmetoder basert på verbal informa sjon. At vi velger å konsentrere oss om datainnsamlingsmetoder som forutset ter verbal kommunikasjon, betyr at vi velger bort metoder der ikke det ver bale, men atferden står i fokus. Observasjonsmetoden vil således ikke bli omtalt i særlig grad i denne fremstillingen. Det kan en selvsagt beklage. Ikke minst fordi ett ankepunkt mot den såkalte «surveymetoden» (spørs mål/svar-tilnærmingen) er at den kanskje bare gir oss bruddstykker av den helheten vi forsøker å fange inn. Ofte dreier det seg om å påvise enkeltstå ende sammenhenger, eksempelvis mellom jobbtilfredshet og produktivitet eller mellom utdanning og valgatferd, men sjelden klarer den tradisjonelle surveybaserte forskningen å gi oss helhetlige forklaringer. Når vi likevel hol der oss innenfor rammen av den verbale informasjonsutvekslingen mellom forsker og respondent, har dette flere årsaker: Den ene er at de aller fleste samfunnsvitenskapelige (bruks)undersøkelser er en eller annen form for spørsmål/svar-undersøkelser. Dette er altså den klart mest benyttede datainnsamlingsmetoden.
126
Den andre er at langt de fleste studenter som gjennomfører undersøkel ser som del av semester- eller hovedoppgaver benytter seg av denne typen datainnsamlingsmetode. Videre ville en god innføring i bruk av observa sjonsmetoden kreve mye plass, samt en ekspertise denne forfatter ikke er sikker på at han er i besittelse av. Å gjennomføre observasjoner på en god måte er langt vanskeligere enn mange tror. For det første er det tidkreven de. En vanlig feil er å avslutte observasjonen for tidlig i den tro at man har registrert et mønster. En annen vanskelighet er å holde atskilt observasjon og evaluering av det man observerer. Her kan et obscrvasjonsskjema med klare anvisninger for når man observerer og når man evaluerer være til hjelp. Det hefter også andre problemer ved bruk av observasjonsmetoden som i sum gir god grunn til å velge andre innsamlingsmetoder, især for utrenede studenter. Den eksperimentelle metoden har vi kort omtalt tidligere. Heller ikke denne er spesielt anvendelig i vår sammenheng, og vi vil følgelig ikke gå nærmere inn på denne. For dem som likevel vurderer observasjons- eller den eksperimentelle metoden i sammenheng med sin undersøkelse vil de al ler fleste metodebøker, norske eller utenlandske, omtale disse mer eller mindre i detalj. For øvrig tror vi at vi i vår diskusjon rundt noen av de såkalte kvalitative metoder i kapittel 18 langt på vei vil fokusere på egenskaper som kan kom pensere for de svakheter som antas å hefte ved den tradisjonelle kvantitative tilnærmingen til undersøkelsesproblemene. Før vi imidlertid tar fatt på en diskusjon rundt de mest sentrale datainnsamlingsmetodene, er vi nødt til å vie noen sider til et problem vi sjelden kommer unna, nemlig det som har å gjøre med hvem vi skal undersøke, hvor mange vi trenger å undersøke, samt hvordan vi får fatt i dem vi bestemmer oss for å undersøke. Kort sagt, det vi vanligvis betegner som utvalgsproblemer.
Stikkord til kapittel 15 datakilder primærdata sekundærdata
127
Øvingsoppgave til kapittel 15 Tenk igjennom hvor og hvordan vi vanligvis henter informasjon i form av sekundærdata som vi benytter til ulike formål. Forsøk å analysere typer av slike sekundærdata i henhold til de kriterier som ble drøftet i kapitlet.
Litteratur å gå videre med Seines, F.: Markedsundersøkelser, TANO, 1993. Holme, I.M. og B.K. Solvang: Metodevalg og metodebruk, TANO, 1995.
Kapittel 16
Om utvalg og utvalgstrekking Det å basere seg på resultater fremkommet gjennom å undersøke et utvalg (av alle dem vi egentlig ønsker å vite noe om) er ikke noe som er særegent for forskere. Mange av de vurderinger og avgjørelser vi tar i det daglige ba serer seg nettopp på at vi har nøyd oss med å undersøke et utvalg i stedet for alle de enheter vi er interessert i. Vi tar for eksempel ikke alle ledige hybler i øyesyn når vi skal finne oss husvære i studietiden. Vi nøyer oss kanskje med å forhøre oss om 4-5 styk ker før vi gjør valget vårt. Sånn sett har bare de hybelvertene som inngår i vårt utvalg muligheten for å sko seg økonomisk på oss de nærmeste 3—4 årene, mens alle de som ikke kom med i utvalget - og blant hvilke «idealhybelen» meget vel kan tenkes å befinne seg - ikke far denne muligheten. Det er altså ikke sikkert at den informasjon vi baserer oss på gjennom å undersøke et utvalg gir et dekkende bilde av den virkelighet vi egentlig er interssert i å vite noe om. Vi har nok, de fleste av oss, en slem tendens til å trekke slutninger på et nokså tynt grunnlag, og det er derfor all grunn til å spørre hvorvidt forske re som benytter samme fremgangsmåte er i stand til å trekke konklusjoner som er til å stole på. La oss med en gang røpe at det ikke nødvendigvis er noe problematisk å benytte seg av utvalg i et undersøkelsesopplegg, men som vi skal se nærme re på i dette kapitlet er det stor forskjell på ulike utvalgstyper, og det blir helt avgjørende å være bevisst på hva slags utvalg man benytter seg av i sin undersøkelse, samt hvilke muligheter og begrensninger dette gir. I den sammenheng vil enkelte begrep til stadighet dukke opp, og det kan derfor kanskje være fornuftig å starte opp med å avklare betydningen av dis se. Ett slikt begrep er begrepet «univers» (noen ganger også kalt popula sjon). Universet er det totale antall enheter (for eksempel alle dagligvarefor retninger i Oslo, alle motorsykkeleiere i Østfold, eller alle norske advokater) som vi er interessert i å si noe om i undersøkelsen vår. Det neste er begrepet «utvalg», som rett og slett er den delen av univer set vi velger ut for å kunne gjennomføre vår undersøkelse, for eksempel 300 av Oslos dagligvareforretninger. Når vi imidlertid ikke undersøker alle en-
129
hetene, men nøyer oss med et utvalg, oppstår såkalte «utvalgsfeil» som et uunngåelig resultat. Vi kan gjennomføre tiltak for å redusere utvalgsfeilene, men til gjengjeld er det lite vi kan gjøre med en annen type feil, såkalte «må lefeil». Målefeil er gjerne feil som oppstår når store datamengder skal hånd teres (når altså data innhentes fra relativt mange enheter), og som i første rekke påvirker datas reliabilitet. Vi omtaler dessuten målefeil som henholds vis tilfeldige og systematiske, der særlig sistnevnte skaper problemer. Sammenliknet med det å skulle undersøke hele universet har utvalgsun dersøkelser en rekke fordeler. Først og fremst sparer en utvalgsundersøkelse oss for tid og kostnader, men den kan likevel - under visse forutsetninger gi oss omtrent like presise og nøyaktige resultater som om vi hadde under søkt hele universet. Fordi de fleste undersøkelser gjennomføres under tids press og med begrenset budsjett, er vi ofte «tvunget» til å basere oss på et utvalg, og gjerne et utvalg med en håndterbar størrelse. Dette innebærer ikke nødvendigvis noen kvalitetsforringning. For selv om størrelsen er en viktig egenskap ved et utvalg, skal vi huske på at selv om utvalgsfeil reduse res med økende utvalgsstørrelse, øker målefeilene. Det kan derfor faktisk være mulig å trekke mer nøyaktige konklusjoner fra en utvalgsundersøkelse enn fra en undersøkelse av hele universet, ganske enkelt fordi en utvalgs prosedyre som tar sikte på å redusere usikkerheten gjennom å redusere både utvalgs- og målefeil, har bedre forutsetning for å lykkes enn et undersøkel sesopplegg basert på målinger av alle enheter som inngår i universet. Figur 13, som illustrerer forholdet mellom målefeil og utvalgsfeil, viser dette.
Meget lite utvalg
Større utvalg
Enda større utvalg
Hele universet
Figur 13 Forholdet mellom målefeil og utvalgsfeil
Som vi ser, er effekten av økende utvalgsstørrelse omvendt for henholdsvis måle- og utvalgsfeil. Når utvalg er lik univers, vil naturlig nok utvalgsfeilen være helt eliminert. Uansett er det viktig å være klar over at det er mulig å beregne størrelsen på utvalgsfeilen (under visse forutsetninger som vi kom-
130
mer tilbake til), mens omfanget av målefeil aldri kan beregnes, men må overlates til forskerens skjønn.
Gangen i utvalgsprosedyren Gitt at vi nå har bestemt oss for å gjennomføre en utvalgsundersøkelse hvordan er det i så fall fornuftig å gå fram? Figur 14 angir iallfall en måte å gå fram på:
Figur 14 131
Hvordan bestemmer vi universet? For mange undersøkelser er det aktuelle univers gitt i og med problemstil lingen, for eksempel: - I hvilken grad er beboerne i en bestemt bydel plaget av trafikkstøy? - Hvor tilfredse er de som nettopp har skaffet seg et bestemt produkt med dette produktet? - Hva fikk siviløkonomer uteksaminert fra BI i årene 1990-92 til å velge nettopp den utdanningen?
Derimot er universet ikke gitt for mer generelle problemstillinger av typen - Er det slik at når prestasjonsnivået går opp, så øker også aspirasjonsnivået foran neste oppgave? - Er det slik at sosial støtte reduserer stress og dermed også reduserer sy kefravær i arbeidslivet? - Bidrar delegering av ansvar alltid til høyere jobbtilfredsstillelse?
Men selv der hvor vi tilsynelatende står overfor et undersøkelsesproblem der universet synes å være gitt, er det likevel viktig å tenke etter om det fort satt er mulig å definere universet enda mer presist. La oss se på et eksempel. La oss si at vi var gitt i oppdrag å gjennomføre en undersøkelse omkring bilbruk i Oslo sentrum. Skulle i så fall alle bilister som på et gitt tidspunkt befant seg i sentrum inkluderes i universet vårt? Eller skulle vi kanskje skille mellom yrkes- og privatbilister? Eller ville det være en idé å ekskludere bilis ter som rent tilfeldig befant seg i Oslo sentrum den dagen (var egentlig hjemmehørende i Kristiansand, men var på Oslo-besøk, noe som vanligvis skjedde en gang pr. år) osv. Slikt er viktig å avklare, ikke minst av hensyn til intervjuerne som ellers lett kan få et uavklart forhold til hvilke enheter som faktisk skal inngå i universet «sentrumsbilister».
Valg av utvalgsramme Utvalgsrammen er i utgangspunktet ment å skulle omfatte alle enheter i det univers vi har identifisert. Uheldigvis er det imidlertid slik at vi ofte ikke har mulighet til å komme i kontakt med alle enheter som befinner seg i univer set vårt, enten fordi det rett og slett ikke finnes noen oversikt eller register over enhetene («menn mellom 20 og 40, bosatt i Oslo som drikker øl ofte re enn en gang pr. uke»), eller fordi det kanskje finnes et register («bedrifter
132
i Oslo med mellom 50 og 100 ansatte»), men hvor registeret inneholder mange feil og ikke er oppdatert. Sånn sett utgjør utvalgsrammen sjelden en fullstendig oversikt over en hetene, men den kan iallfall hjelpe oss med å identifisere de enheter vi øn sker å undersøke.
Valg mellom sannsynlighetsog ikke-sannsynlighetsutvelgelse Vi snakker her om to prinsipielt forskjellige måter å velge ut de enheter på som skal være med i utvalget. Valget av den ene eller den andre er imidler tid ikke noe vi som forskere står fritt til selv å bestemme. Forutsetningen for å trekke et sannsynlighetsutvalg, det vil si et utvalg karakterisert av at alle enheter i universet skal ha lik sannsynlighet for å bli trukket ut, er nettopp at vi har mulighet til å identifisere alle enheter i det aktuelle univers. Der som dette ikke er tilfelle, for eksempel slik som med de mannlige øldrikkerne, har vi heller ingen mulighet til å sikre at samtlige mannlige øldrikkere mellom 20 og 40 i Oslo har samme sannsynlighet til å bli trukket ut blant de for eksempel 800 vi skal sende spørreskjemaene våre til. Det vi i slike tilfeller må gjøre, er å trekke et ikke-sannsynlighetsutvalg, altså et utvalg der vi er klar over at ikke alle enheter har hatt samme sann synlighet for å bli trukket ut. Men fordi vi altså ikke kjenner alle enheter i universet, og dermed heller ikke kan vite om de vi har trukket ut avviker på avgjørende måter fra dem som ikke er trukket ut, kan vi heller ikke påstå at vårt utvalg er representativt for alle enheter i det opprinnelige univers. Og dermed kan vi heller ikke generalisere fra utvalg til univers, det vil si påstå at de resultater vi fikk fra utvalgsundersøkelsen ville blitt de samme som om vi hadde undersøkt hele universet. Felles for utvalg som faller inn under kategorien ikke-sannsynlighetsutvalg er altså at de er trukket ut på en slik måte at vi ikke kan påstå at alle en heter i universet har hatt samme sannsynlighet for å komme med i utvalget. Konsekvensen av dette blir at utvalget lett blir «skjevt» sammensatt i for hold til universet, og generalisering blir følgelig ikke mulig. Dermed er utvalg trukket på denne måten strengt tatt ikke representati ve for andre enn seg selv. Når denne type utvalgsmetode likevel er ganske hyppig benyttet, henger dette delvis sammen med problemer vedrørende kjennskap til universet, og delvis har det sammenheng med tids- og kostnadsbesparelser. Samtidig skal vi også være oppmerksom på at statistisk representativitet, at utvalget er å betrakte som et univers i miniatyr, ikke er noe krav for å gjennomføre gode 133
og interessante utvalgsundersøkelser. At resultatene fra et ikke-sannsynlighetsutvalg ikke gir grunnlag for generalisering (i streng forstand) betyr slett ikke at de er verdiløse. I mange tilfeller vil vi ha sterke kort på hånden når vi argumenterer for at også resultater fra slike undersøkelsesutvalg kan tilleg ges betydelig vekt. Dersom for eksempel jeg som foreleser ved Universitetet i Oslo ønsket å gjennomføre en undersøkelse av studenters studiefinansie ring, og jeg for enkelhets skyld brukte mine egne studenter på Blindern som utvalg, vet jeg naturligvis at dette er et ikke-sannsynlighetsutvalg, fordi ikke alle studenter har hatt samme sannsynlighet for å bli inkludert i utval get. Likevel ville jeg påstå at resultatene fra en slik studentundersøkelse, selv om den altså bare gjaldt, la oss si 600 studenter på Blindern, ville fortelle oss ganske mye om hvordan studenter flest finansierte studiene sine. Den utvalgsmetode jeg benyttet i eksemplet over, kalles «forhåndenvæ rende» eller «makelighetsutvalg», og indikerer at vi for en gitt undersøkelse benytter de enheter det er lettest å fa tak i. Andre eksempler på ikke-sannsynlighetsutvalg er såkalte «vurderingsutvalg», det vil si at vi selv vurderer hvem vi ønsker skal inngå i utvalget, gjer ne på bakgrunn av spesielle egenskaper eller kvalifikasjoner som vi tillegger vekt. Kvoteutvalg er en tredje form for ikke-sannsynlighetsutvalg. Her prø ver vi å sette sammen utvalget på bestemte måter (andeler kvinner under 35 år osv.) slik at det mest mulig gjenspeiler visse karakteristika ved det univer set vi er interessert i å vite noe om.
Bestemmelse av utvalgsmetode La oss si at vi har mulighet til å trekke et sannsynlighetsutvalg og bestem mer oss for å gjøre det. Målet vårt blir altså å trekke et representativt utvalg. Spørsmålet blir: Hvordan gjør vi det? Som et utgangspunkt kan vi si at vi dermed ønsker å trekke det vi kaller et tilfeldig utvalg. Et tilfeldig utvalg kan vi definere ved at hver enhet innen det univers vi ønsker å undersøke (utvalgsrammen) er kjent og skal ha den samme sannsynlighet for å komme med i utvalget. Dette garanterer riktig nok ikke representativitet, men gjør det iallfall sannsynlig. Det betyr med andre ord at dersom utvalget ikke er trukket ved hjelp av en prosedyre som sannsynliggjør representativitet, må vi som en hovedregel anta at det ikke er representativt. Prosedyrer som i denne sammenheng er hyppig brukt, er flere. Vi skal kort se nærmere på noen av de vanligste, og starter med den som gjerne kalles «enkel lotterisk trekking». Prinsippet her er i bunn og grunn det samme som ved loddtrekning. Alle
134
enheter i universet får ett lodd, og så trekker vi «vinnerne», som altså blir med i utvalget vårt. Tenker vi oss at vi skal gjennomføre en undersøkelse i en kommune med 10 000 (N) innbyggere over 15 år, og vi har bestemt oss for et utvalg på 500 (n), har vi det som kalles utvalgsbrøken: n/N = 500/10 000 = 1 /20, som betyr at sannsynligheten for en innbygger i kom munen for å komme med i utvalget blir 0,05 eller 5 %. Men hvordan skal vi så gå fram for å sikre at alle innbyggere i kommunen over 15 år har den samme, nemlig 5 % sjanse for å bli trukket ut? Teoretisk kan vi tenke oss at vi nummererer alle innbyggerne fra 1 til 10 000 og så trekker ut 500. Vi kan også tenke oss vi stiller opp alle 10 000 på en lang rekke, uordnet. Vi vet at utvalgsbrøken er 1 /20, det vil si at hver 20. person skal trekkes ut. Vi starter med å velge et tilfeldig tall mellom 1 og 20. La oss anta at tallet 6 blir trukket ut. Da kommer person nr. 6 med som førstemann, deretter nr. 26, 46, 66 osv. til alle 500 er trukket ut. Vær oppmerksom på at de 10 000 er oppstilt tilfeldig. Prinsippet er bruk bart i praksis for eksempel ved undersøkelser blant abonnenter på et tids skrift eller en avis. Her finnes som regel ajourførte lister over samtlige abon nenter. Altså: Såkalt tilfeldige utvalg er utvalg basert på loddtrekning der alle en heter i universet har samme sannsynlighet for å komme med i utvalget.
Stratifierte utvalg
En annen type utvalg er de vi kaller stratifierte utvalg. Bakgrunnen for at denne utvalgsformen benyttes kan blant annet forklares ut fra visse svakhe ter ved de tilfeldige utvalg. La oss tenke oss at det i kommunen i eksemplet over bor like mange kvinner som menn. Anta videre at vi gjennom den tilfeldige uttrekning av et utvalg på 500 personer som vi gjorde ble sittende med 200 kvinner og 300 menn. Forholdet kvinner/menn i utvalget ville altså være 40/60, mens for holdet i universet (som utvalget var ment å skulle speile) altså var 50/50. På grunn av rene tilfeldigheter er således det utvalget vi har fått skjevt, det vil si kvinnene er underrepresentert. For å unngå slike skjevheter i utvalget benytter vi oss noen ganger av stratifierte utvalg. Det innebærer at vi innledningsvis deler universet opp i undergrupper (strata), og deretter trekker tilfeldig fra hvert stratum det an tall utvalgsenheter som stratumets størrelse tilsier. I kommuneeksemplet vet vi at det bør være ca. 50 % menn og 50 % kvinner i utvalget. For å sikre det te trekker vi først ut 250 kvinner fra kommunens 5000 kvinnelige innbyg gere, deretter 250 menn fra de 5000 mannlige. Som vi ser, er sannsynlighe ten for at en tilfeldig kvinne eller mann skal komme med i utvalget, 250 (n)
135
/ 5 000 (N) = 0,05, altså den samme som ved det tilfeldige utvalget basert på loddtrekning blant alle enheter i universet. Ved stratifierte utvalg sikrer vi altså at de forskjellige grupper i universet blir forholdsmessig representert i utvalget. I praksis vil stratifieringskriteriene variere etter undersøkelsens formål, ganske vanlige kriterier er for ek sempel kjønn, alder, handelsfelt, bostedstype, bransje. Vi kan i enkelte tilfeller også benytte oss av en utvalgstype som kalles disproporsjonale stratifierte utvalg. Som navnet tilsier dreier dette seg om å stratifiere, men ikke slik at størrelsen på de ulike strata gjenspeiler størrelsen i universet. La oss som et eksempel anta at vi er interessert i å foreta en un dersøkelse av tidsskriftet Kapitals abonnenter innen forskjellige bransjer. La oss videre anta at det totale antall abonnenter er 30 000, og at disse forde ler seg bransjevis som følger: Antall abonnenter innen:
5%
Bank/finans
8 500
425
Handel
5 000
250
Media
1 500
75
Industri
15 000
750
Vi har videre bestemt at vi skal trekke et tilfeldig utvalg bestående av 1 500 abonnenter, det vil si at sannsynligheten for at en abonnent skal komme med i utvalget er 5 %. Dersom vi nå foretar utvelgelsen basert på stratifieringskriteriet «bran sje», vil vi altså sitte med et utvalg der antallet abonnenter fra hver bransje er som over. Dersom vi, enten fordi vi synes antallet fra stratumet «medier» er for lite, eller fordi vi er spesielt opptatt av synspunktene til denne gruppen, bevisst trekker ut flere abonnenter herfra enn det antallet enheter i univer set skulle tilsi, har vi «ødelagt» den matematiske fordelingen og i stedet fått et disproporsjonalt utvalg. La oss si at vi trekker ut 75 abonnenter i tillegg til de opprinnelige 75, slik at bransjen «medier» i utvalget er representert med 150 abonnenter. Dette gir oss et sikrere grunnlag for å kunne utsi noe om denne gruppens oppfatninger om tidsskriftet, men samtidig må vi innse at totalutvalget vårt ikke lenger er et represenatativt utvalg, fordi abonnen tene fra mediebransjen har større sannsynlighet for å komme med i utvalget enn de øvrige abonnentene. I situasjoner der vi er interessert i å studere undergrupper som ville bli for svakt representert ved rene sannsynlighetsutvalg, kan vi altså gripe til denne utvalgsmetoden. I vår diskusjon over fastslo vi at en forutsetning for å kunne trekke sann-
136
synlighetsutvalg etter rene tilfeldighetsprinsipper var at vi «kjente» enhete ne i universet, for eksempel gjennom at det fantes registre eller oversikter over dem. Det er imidlertid mulig å gjennomføre trekking av sannsynlighetsutvalg selv der vi ikke har denne typen registre. Den typen utvalg vi her benytter oss av, kalles klyngeutvalpf, og er kjennetegnet av at vi ikke trekker de enkelte utvalgsenheter spesielt, men i grupper. Hvis vi for eksempel skal trekke et landsomfattende utvalg av norske hus stander og må konstatere at et landsomfattende register ikke finnes, kan dette likevel gjøres ved at vi først trekker et representativt utvalg av kom muner (oversikt over kommuner med diverse kjennetegn finnes), og deret ter trekker utvalget av husstander innen de uttrukne kommuner. Dermed trenger vi bare registre over de husholdninger som finnes i de uttrukne kommuner. For å ha sagt også det: For kjøpere av undersøkelser, eksempelvis mar kedsundersøkelser, er dette ikke problemstillinger man vanligvis må enga sjere seg i. Dersom problemstillingen tilsier en landsomfattende undersø kelse, vil det i de fleste tilfeller være fornuftigst å kjøpe seg inn i en såkalt «omnibus-undersøkelse». Det betyr at man for en gitt pris pr. spørsmål kan «hekte på» et antall spørsmål på en rullerende landsomfattende undersøkel se der utvalgsproblematikken er løst - så å si en gang for alle. Samtlige stør re markedsforskningsinstitutter kan tilby slike omnibus-undersøkelser. Spørsmålet om størrelsen på det utvalget vi skal trekke er naturligvis vik tig. Det har konsekvenser for kvaliteten på undersøkelsen, men det har sam tidig økonomiske konsekvenser. Prinsipielt gjelder det at med økende stør relse øker sikkerheten med hvilken vi kan generalisere fra utvalg til univers, men samtidig øker også kostnadene. Et spørsmål for mange blir derfor: «Hvor stort bør utvalget være for at jeg med akseptabel sikkerhet kan generalisere fra utvalg til univers?» Noe absolutt svar på et slikt spørsmål er antakelig umulig å gi, men noen eksem pler kan muligens illusterere problemstillingen. Som et utgangspunkt kan vi fastslå at resultater fra utvalgsundersøkelser alltid er beheftet med usikkerhet. En årsak til slik usikkerhet henger altså sammen med størrelsen på utvalget. I statistisk terminologi benyttes gjerne betegnelsen standardavvik som mål på denne usikkerheten. Med standard avvik mener vi hvor stort avvik vi kan vente fra hva vi hadde fatt dersom alle i universet hadde blitt spurt. Størrelsen på standardavviket avhenger av stør relsen på utvalget. Vi kan illustrere dette med et eksempel fra de politiske meningsmålingene: For Arbeiderpartiet (Ap) vil for eksempel standard avviket med et utvalg på 1 200 personer være rundt 1,5-2 %. Det betyr at dersom meningsmålingene en måned gir Ap en oppslutning på 37,5 % kan dette like gjerne bety 36 eller 39 %. Riktigere ville det altså være å si at Ap 137
denne måneden har en oppslutning som ligger et sted mellom 36 og 39 %. Et utvalg på 200 personer vil gi et standardavvik på ca. 6 %, altså en betyde lig større usikkerhet. De fleste vil vel være enig i at en usikkerhetsprosent på 6 er altfor høy, mens ca. 1,5 er til å leve med. Så har da også de fleste landsrepresentative undersøkelser en utvalgsstørrelse på fra ca. 1 200 til 1 600. Hvorfor de ikke er enda større, har med en avveining mellom krav til sikkerhet og ønsket om å holde kostnadene nede å gjøre. Det viser seg nemlig at vi må firedoble utvalgsstørrelsen hver gang vi ønsker å halvere standardavviket. Hvis vi derfor i eksemplet over ønsket et standardavik på i underkant av 1 %, måtte altså utvalget økes til 4 800. De fleste ville nok mene at dette er en for høy pris å betale for en relativt marginal reduksjon av usikkerheten. Ett viktig poeng i forbindelse med ovenstående: En forutsetning for å kunne beregne usikkerheten, det vil si utvalgsfeilen, er at utvalget er et sannsynlighetsutvalg! Dersom dette ikke er tilfelle, hjelper det ikke hvor stort utvalget vårt er, vi kan likevel aldri beregne usikkerheten på samme måte. Et annet poeng som tåler å gjentas er at selv om utvalget er likt universet, blir resultatet likevel ikke feilfritt. Utvalgsfeilen blir riktignok eliminert, men målefeil vil alltid forekomme, og øker med økende utvalgsstørrelse. Resultater fra utvalgsundersøkelser vil av disse grunner (og andre, ek sempelvis bortfall) alltid være beheftet med usikkerhet, og må derfor be handles med forsiktighet.
Stikkord til kapittel 16 sannsynlighetsutvalg ikke-sannsynlighetsutvalg utvalgsfeil målefeil
Øvingsoppgaver til kapittel 16 Drøft forholdet mellom utvalgsstørrelse og utvalgs- og målefeil for en tenkt undersøkelse.
Hvorfor gjennomføres ikke alle utvalgsundersøkelser ved hjelp av et sann synlighetsutvalg? Når vil det være påkrevet/fornuftig å benytte stratifiserte utvalg? 138
Litteratur å gå videre med Hellevik, O.: Forskningsmetode for sosiologi og statsvitenskap. Universitets forlaget, 1993. Krokan, A.: Forstå statistikk, Statistiske metoder for samfunnsfag og huma niora, Kolle forlag, 1995.
Kapittel 17
Innsamling av primærdata Data kan innhentes på mange måter. Innsamlingsmetodene er mange, og valget mellom dem skal ideelt sett styres av den problemstilling vi akter å undersøke. I virkeligheten er det mange andre faktorer enn problemstilling en som er med på å bestemme vårt valg av datainnsamlingsmetode. Tidsog kostnadsbruk, for eksempel. Noen innsamlingsmetoder er mer tidkre vende (og dermed mer kostbare) enn andre, og unngåes følgelig dersom vi arbeider under sterkt tidspress. Observasjonsmetoden er eksempel på en da tainnsamlingsmetode som krever tålmodighet og relativt romslige kost nadsrammer. Hva man som forsker føler at man behersker best, vil nok også i mange tilfeller virke styrende. Fagtradisjoner må heller ikke glemmes. Mens for eksempel sosiologer og statsvitere tradisjonelt har sverget til surveyopplegg og kvantitativ analyse av de innsamlede dataene, har sosialan tropologene sin styrke i observasjon kombinert med mer fortolkende analy se. Etablerte paradigmer innenfor de ulike vitenskaper vil således virke sterkt styrende på vår forskningsatferd. Det er også slik at vårt vitenskaps teoretiske ståsted, det vil si våre grunnleggende oppfatninger av hvordan virkeligheten «ser ut» og hvordan kunnskap om denne virkelighet best kan samles inn, blir et sentralt premiss når valg skal gjøres. Som vi alt har gjort klart, vil vi i denne fremstillingen konsentrere oss om den type av datainnsamling som skjer ved hjelp av spørsmål og svar. Grun nen er at dette uten tvil er den mest benyttede datainnsamlingsmetoden, og ikke minst er den helt dominerende i forbindelse med studentarbeid. Vi mener derfor det er mer hensiktsmessig å drøfte denne typen datainnsam ling forholdsvis grundig fremfor å fare over en hel rekke metoder som med stor sannsynlighet likevel ikke blir utprøvet. Grovt kan vi dele denne type datainnsamling inn i to hovedtyper: 1
Surveymetoden, som kan karakteriseres ved at
-
den gir data (informasjon) av og om personer spørsmålene (som regel) er formulert på forhånd (ofte av forskeren selv) responsen gis verbalt, skriftlig eller muntlig datamengden er stor (mange respondenter inngår i undersøkelsen)
140
- dataene analyseres kvantitativt, det vil si den verbale responsen gjøres om til talluttrykk og behandles statistisk (gjerne maskinelt)
2 De mer kvalitative metoder for innhenting av verbale data, som karakte riseres ved at -
de gir data (informasjon) fra og om personer spørsmålene ikke er forhåndsbestemt responsen gis muntlig antallet respondenter er relativt lite dataene analyseres kvalitativt, det vil si de beholdes i sin opprinnelige form
Figurlig kan dette forholdet illustreres som i figur 15. Mange
Kvantitative/ekstensive undersøkelser
Antall personer
Kvalitative/intensive undersøkelser
Få
Mange
Få
Antall spørsmål
Figur 15
I det følgende vil vi se nærmere på både surveymetoden og de kvalitative innsamlingsmetodene. Vi minner i den forbindelse om diskusjonen vi had de omkring såkalt «metodetriangulering» i kapittel 9, der vi nettopp under streket fordelen ved å kombinere kvantitative og kvalitative metoder. Vi vil også - i de to neste kapitlene - ta for oss analysemetoder av hen holdsvis kvantitative og kvalitative data. Her vil vi imidlertid nøye oss med å drøfte noen grunnleggende prinsipper ved de to analyseformene. Spesielt når det gjelder kvantitativ analyse kan fremstillingen ellers lett bli vel mate
141
matisk - og vi finner det derfor hensiktsmessig å henvise til lærebøker i sta tistikk og dataanalyse for grundigere gjennomgang av dette stoffet. Intervjusituasjonen, altså interaksjonen mellom intervjuer og respon dent, kan anta ulike former langs et kontinuum avhengig av graden av kon troll vi prøver å ha over de svar respondenten avgir. For enkelhets skyld kan vi dele et slikt kontroll-kontinuum i fire deler.
1
På det ene ytterpunktet finner vi det vi kan kalle det uformelle intervju et karakterisert av noe nær fullstendig fravær av struktur eller kontroll. Dette er strengt tatt ikke noe intervju i det hele tatt, men snarere en si tuasjon der forskeren prøver å «snappe opp» noe av det som foregår, for eksempel på en arbeidsplass, for på den måten å skaffe seg et bedre grunnlag for å gjennomføre en nøyere planlagt og mer kontrollert un dersøkelse senere. Det uformelle intervjuet krever altså tilstedeværelse, men ikke nødvendigvis involvering i enkelttilfeller.
2 Neste type kalles ustrukturert intervjuing. Denne intervjutypen er ikke på noen måte uformell. Du setter deg sammen med en respondent og gjennomfører et forhåndsplanlagt intervju. Punktum. Ustrukturerte in tervjuer er karakterisert av planmessighet, men også av et minimum av kontroll over respondentens svar. Grunnideen er å få folk til å åpne seg og å la dem uttrykke seg med egne ord og i eget tempo. Ustrukturerte intervjuer kan følgelig være temmelig tidkrevende.
3 Dernest har vi den formen vi kaller semi-strukturerte intervjuer (ikke alle skiller mellom ustrukturerte og semi-strukturerte intervjuer, men vi har funnet dette formålstjenlig). Det som - slik vi ser det - skiller semistrukturerte fra ustrukturerte intervjuer (de har ellers mange av de sam me kjennetegn og kvaliteter), er bruken av intervjuguide. En intervju guide er en liste der spørsmål og temaer vi ønsker å dekke er skrevet ned. Bruken av intervjuguide hindrer ikke forskeren i å forfølge interessante svar eller uventede temaer som kan dukke opp under intervjuet, men den sikrer samtidig større grad av reliable og sammenliknbare kvalitative data. 4 Den siste og sterkest formaliserte intervjutypen er det strukturerte inter vjuet der alle respondenter blir bedt om å svare på et så identisk sett av spørsmål som mulig. Denne intervjuformen kan gjennomføres på for skjellige måter, som personlig intervju, som telefonintervju eller postalt ved at respondentene selv fyller ut et tilsendt spørreskjema. Disse måte ne har sine spesielle fortrinn og ulemper (som vi vil drøfte nærmere mot
142
slutten av kapitlet), men felles for dem er at de - som resultat av måten intervjuet (spørreskjemaet) er konstruert på - gir betydelig høyere grad av kontroll enn de tre øvrige intervjuformer. Men samtidig innebærer det å velge det strukturerte intervjuet fremfor et av de andre at vi også mister noe i forhold til de andre intervjuformene, nemlig de nyanser og detaljer som bare en mer åpen og ffittstrømmende dialog kan gi.
Av de fire intervjuformene vi kort har omtalt, regnes vanligvis de tre første inn under gruppen «kvalitative» intervjuer, mens den siste er typisk for det som gjerne omtales som «surveymetoden». I det følgende vil vi først se nærmere på nettopp surveymetoden. Fordi denne gjerne fører med seg ulike former for kvantitativ dataanalyse (pga. ofte store datamengder) vil vi dernest ta for oss noen prinsipielle sider ved kvantitativ dataanalyse. Dernest vil vi behandle noen kvalitative metoder for datainnsamling (fortrinnsvis intervjuer), fulgt av noen betraktninger rundt kvalitativ dataanalvse. J
Surveymetoden I snever forstand - og det er nettopp i en slik «snever» forstand surveyme toden ofte blir presentert for studenter i ulike metodekurs - er surveymeto den den datainnsamlingsteknikk som bruker enquete eller spørreskjema som måleinstrument, har individet som undersøkelsesenhet, og der variab lene fortrinnsvis er atferdsvariabler, holdningsvariabler eller sosioøkonomis ke bakgrunnsvariabler. Som resultat av dette blir surveyopplegg oftest beskrivende - egentlige forklaringer blir ofte vanskeligere å fa til. En årsak til dette, hevdes det, er vanskeligheter med å integrere teori og empiri innenfor rammen av slike opplegg. Det betyr ikke nødvendigvis at de fleste surveyundersøkelser gjen nomføres i et teoretisk vakuum. Det som fremholdes, er at så vel teorier som empiriske funn i beste fall gir oss bruddstykker av den helheten vi for søker å fange inn. Ofte dreier dette seg om enkeltstående sammenhenger, eksempelvis mellom informasjonsinnhentingsatferd og kjøpsbeslutninger eller mellom utdanningsnivå og politisk tilhørighet, men sjelden klarer den tradisjonelle surveybaserte samfunns- eller for eksempel, markedsforskning en å gi helhetlige forklaringer. Vitenskapsteoretisk kan dette muligens forklares gjennom de positivistiske «tilbøyeligheter» vi vanligvis finner i (særlig store) surveyopplegg. Vi husker positivistenes krav om at vi må holde oss innenfor området av våre erfaringer og en beskrivelse av disse. A spørre etter tingenes grunner eller å
143
kunne levere forklaringer blir det samme som å overskride grensen mot «tingene i seg selv» hvor forklaringer ikke lenger kan anvendes. Et slikt fo retakende blir derfor lett bare tankespinn. Nå er det vel ingen for alvor som mener at en surveyundersøkelse ute lukkende skal beskrive et sett av faktisk erfarte objektive fakta, men det er li kevel et poeng at i den delen av samfunnsvitenskapelig forskning som er sterkest inspirert av det positivistiske vitenskapsideal, tenderer den vitenska pelige virksomheten mot å spaltes i en teoretisk og en empirisk del som ikke alltid henger sammen. Uansett om en måtte mene at det er godt mulig å fo reta helhetlige forklaringer som resultat av et surveyopplegg, er det likevel blitt mer og mer akseptert at det først er når et rendyrket surveyopplegg kombineres eller suppleres med mer kvalitative (gjerne fenomenologiske) undersøkelsesopplegg, at vi vil kunne bevege oss fra et ståsted der vi beskri ver verden i sine ytre sammenhenger (slik den fremstår i form av svar ned tegnet på et spørreskjema) til å kunne begripe intensjonene bak de ulike respondentenes svar. Det er åpenbart mange forhold ved gjennomføringen av en surveyun dersøkelse som kan bidra til å gjøre det endelige resultatet bra eller dårlig. Vi har allerede drøftet utvalgsproblematikk (surveyundersøkelser er i rege len utvalgsundersøkelser). Men det er også andre sider ved denne undersøkelsesformen som kan være problematiske. Betydningen av riktig spørsmålsformulering og oppbygging av spørre skjemaet vil naturligvis være helt sentralt. Forholdet mellom intervjuer og respondent (ved det personlige intervju) likeså. Hvem man intervjuer viser seg også å ha betydning. Vi vet også at ulike typer av det vi kan kalle «svareffekter» vil kunne redusere validiteten på undersøkelsen. Vi har ikke til hensikt å drøfte alle disse forhold like grundig, men vi fin ner det likevel nødvendig å ta for oss iallfall noen av dem. La oss starte med å konstatere at en surveyundersøkelse i alminnelighet består av visse trinn eller faser: 1
En forberedende fase, der vi prøver å gjøre oss opp en mening om iall fall to nokså grunnleggende forutsetninger som bør være avklart før vi begynner å utvikle måleinstrumentet vårt, nemlig: - hvilke data (informasjon) er det ønskelig (og mulig) å fremskaffe? - hvilke intervjuobjekter skal inngå i undersøkelsen?
2 Når de to ovenstående spørsmål er besvart, kan vi lage utkast til spørre skjemaet, der vi blant annet konsentrerer oss om følgende:
144
- hvorvidt vi skal benytte personlig intervju eller enquete (postal undersøkelse) - rekkefølgen på spørsmålene - formuleringen av det enkelte spørsmål - struktureringsgrad
Den typiske intervjuundersøkelse innholder gjerne to typer av spørsmål: det vi kan kalle for faktaspørsmål (navn, alder, bosted etc.), som har den egen skap at de er kontrollerbare, og såkalte intraspektive spørsmål som kan være spørsmål, om holdninger, meninger osv. som sjelden kan kontrolleres. Hva angår struktureringsgraden, det vil si hvorvidt spørsmålene skal være fullstendig standardiserte (at både rekkefølge og formulering er forhåndsbestemt) og strukturerte, at det altså foreligger ferdigutviklede svaralterna tiv, så kan det være greit å være klar over at jo høyere grad av standardisering og strukturering, jo høyere reliabilitet. Validiteten kan derimot lide under et sterkt strukturert og standardisert intervju. Dette vil naturligvis avhenge av hva det er vi ønsker å måle. Men som vi har drøftet tidligere, så er validi teten avhengig av hvordan vi operasjonaliserer de begrepene vi ønsker å måle. Jo mer sammensatt (flerdimensjonalt) og abstrakt et begrep er, jo vanskeligere er det å måle det på en valid måte. Det vil si slik at det blir definitorisk overensstemmelse mellom det opprinnelige begrepet og det vi måler som svar på ett eller flere spørsmål. Utfordringene som ligger i å måle begreper som for eksempel «frem medgjøring», «makt», «konsultativ lederstil» eller «svak forbruker» ved hjelp av standardiserte og strukturerte spørsmål, er naturlig nok helt andre enn når vi skal måle for eksempel alder eller inntekt. (Men selv når det gjel der å måle begrepet inntekt, kan problemer oppstå. Skal for eksempel bare lønnsinntekt måles? Hva med aksjeutbytte og renteinntekter? Og hva med bonus? Eller verdien av frynsegoder?) Når det gjelder rekkefølgen på spørsmålene, mener noen at det er for nuftig å starte med faktaspørsmål av typen «kjønn», «alder», «yrke», osv., mens andre mener at de første spørsmålene skal være direkte relatert til for målet med undersøkelsen, men at de fortrinnsvis skal dreie seg om faktiske forhold som det ikke er vanskelig å svare på. Et eksempel kan være: «Hvor lenge har du vært ansatt i denne organisasjonen?» Uansett er det bred enighet om at respondenten har behov for å «varmes opp» innledningsvis, at han deretter kan konfronteres med vanskelige, tru ende eller følelsesladede spørsmål, før han «kjøles ned» til slutt med en ny serie med faktaspørsmål. Når det gjelder det enkelte spørsmål, er det selvfølgelig også en del å hus ke på: 145
- Unngå at spørsmålet inneholder mer enn én dimensjon, det vil si spør om én ting av gangen. Spørsmål av typen «Når var første gang du dro hjemmefra for å finne arbeid?» er eksempel på to-dimensjonale spørs mål. - Unngå ord med lav presisjon, for eksempel i forbindelse med angivelser av tid eller mengde. «Mye», «lite», «ofte», «sjelden» er eksempler som neppe er særlig anvendelige med mindre de suppleres med (eller erstat tes av) mer presise angivelser av typen «en gang pr. uke», «ett glass om dagen» eller liknende.
- Unngå ladede ord og begreper. «Rasist» og «sosialist» er ladede ord. «Miljøbebevisst» likeså. Problemet med slike begreper er at responden ter som blir konfrontert med dem vil ha en tendens til å svare vurderen de. «Ingen» vil fremstå som rasister, mens «alle» vil fremstå som miljø bevisste. Nok en gang blir det derfor spørsmål om operasjonalisering. I stedet for å spørre om i hvilken grad folk oppfatter seg som miljøbevis ste, kan vi spørre om de for eksempel sorterer avfall, leverer spesialavfall dit det skal, kjøper miljømerkede produkter osv. Gjør vi dette innenfor rammen av et strukturert skjema, kan svarene avmerkes langs en skala som for eksempel går fra:
Alltid............................................................... Aldri - Unngå fremmedord, slang o.l. Dette er ikke alltid lett å få til. Ord som kan være velkjent for deg, kan lett vise seg å være fremmede for respondentene. Det vil naturligvis også være forskjell mellom respondenter i ett og samme utvalg, og - ikke minst - forskjeller mellom utvalg. Testing av måleinstrumentet kan hjelpe oss med å identifisere problemer, men så lenge vi har bestemt oss for å benytte et standardisert skjema, kan språkog forståelsesproblemer neppe helt unngås. Det er i denne sammenheng også viktig å huske på at respondentene må vite noe for å kunne besvare spørsmålene. Forbausende ofte stilles det spørsmål i undersøkelser som det er tvilsomt om respondenter flest er i stand til å svare på. Det vi da risikerer, er at de svarer likevel (strukturerte skjemaer gjør det jo svært lett å svare gjennom for eksempel å krysse av for et alternativ langs en skala), med det resultat at vi sitter igjen med svar fra en rekke personer som egentlig ikke vet noe om det de har blitt bedt om å svare på. Det er også viktig å være klar over hvor dårlige vi gjennomsnittlig er til å huske begivenheter eller situasjoner. Erfaringer fra mange spørreundersøkel-
146
ser synes å bekrefte at folk flest har problemer med å huske lenger tilbake enn en måned vedrørende mer dagligdagse hendelser som kinobesøk, inn kjøp, ting som har hendt på jobben osv.
- Unngå for lange spørsmål, av den enkle grunn at dersom spørsmålet blir for langt (noen sier at spørsmål bør bestå av maks. 20 ord), må respon denten kanskje lese det flere ganger for å få sammenhengen. Hvis dette skjer ofte under arbeidet med å besvare et skjema, er det lite trolig at vedkommende vil fullføre. Følgende (skrekk)eksempel fra en markedsundersøkelse illustrerer dette (og flere andre poeng, ikke minst såkalt ledende spørsmål) temmelig godt: «Over Drammens Havn ekspederes i dag store godsmengder. Dagens kon kurranse mellom havnene er meget hard. For ikke å tape i konkurransen med andre havner, ikke minst Gøteborg Havn - med tap av inntekter og arbeidsplassser - har Drammen Havnevesen planer om å utvide havnen. En slik utvidelse betyr at deler av Bragernesløpet (utløpet av Drammenselven) må fylles igjen. Det vil bli tatt særlige miljøhensyn ved gjenfyllingen. Er De for eller imot en slik utvidelse av Drammen Havn, eller har De ikke tatt stil ling til dette?»
Legg så til at utvalget besto av 200 personer, og det er all grunn til å spørre seg hva resultatet av en slik undersøkelse er godt for. Også lengden på selve spørreskjemaet bør vies oppmerksomhet. Litt for enklet kan vi si at en undersøkelses svarprosent er omvendt proporsjonal med lengden på spørreskjemaet. I denne forbindelse skal det imidlertid ikke unnslås at avsender virker klart inn på i hvilken grad mer omfattende skje maer tåles. Et spørreskjema tilsendt fra for eksempel Kreftregisteret eller Statens institutt for folkehelse, vil nesten alltid oppnå høyere svarprosent enn et som kommer fra for eksempel et oljeselskap eller en dagligvarekjede, uavhengig av lengde på skjemaet.
Feilkilder
Det er bare å fastslå at surveymetoden er belemret med feilkilder. Vi har ovenfor pekt på noen forhold som kan være med på å gjøre resultatet fra en intervjuundersøkelse mer eller mindre godt. Så lenge det til syvende og sist er svarene fra en gruppe respondenter som skal gjøre oss i stand til å kunne utsi noe om en situasjon, er det klart at dersom respondentenes svar påvir kes i en eller annen retning - av oss eller av situasjonen slik at det ikke er re147
spondentens egen, subjektive oppfatning som fremkommer - har vi et pro blem. Betegnelsen svareffekter brukes gjerne på denne typen problemer. Validiteten uttrykker hvorvidt undersøkelsen måler det den er ment å skul le måle, det vil si de sunne verdier. Dersom det vi kaller svareffekter medvir ker til at det vi registrerer avviker fra den sanne verdi, vil vi oppleve at vali diteten av undersøkelsen svekkes. Dersom vi skjematisk fremstiller validiteten som variansen (S2) mellom den informasjon vi får fram gjennom undersøkelsen og den sanne verdi, og antar at denne variansen primært skyldes feilkilder, altså at S2
—
S1
+
S3
registrert informasjon
-
sanne verdier
+
feil
blir det selvsagt om å gjøre å redusere feilkildene så mye at Sl er tilnærmet lik S2, med andre ord at validiteten blir så høy som mulig. Lav validitet i en spørreundersøkelse forteller oss at svarfordelingen ikke bare er uttrykk for det forhold det spørres om, men også reflekterer egen skaper ved spørsmålet, intervjueren og/eller respondenten. Kunnskap om svareffekter vil således være vesentlig når det gjelder å eliminere eller korri gere skjevheter i resultatene og dermed høyne validiteten. Sudman og Bradburn (1979) har analysert svarfordelinger fra en rekke undersøkelser med tanke på å finne fram til hvilke faktorer som fører til svar effekter. Resultatene viste at en rekke faktorer eller forhold rundt en under søkelse kan bidra til slike. Det dreier seg om forhold som blant annet går på:
- innsamlingsmetode-, svareffekter oppstår hyppigst ved personlige inter vjuer, sjeldnest ved postale - konstruksjon av spørreskjema-, åpne versus lukkede spørsmål, rekkefølgen av spørsmålene - spørsmålenes tema-, mindre svareffekter på faktaspørsmål enn på holdningsspørsmål - hvordan spørsmål oppfattes-, «truende spørsmål» besvares ofte slik det oppfattes sosialt ønskelig - intervjusituasjonen-, omstendigheter rundt intervjuet, trygg/utrygg si tuasjon 148
- egenskaper ved intervjuer og respondent, kjønn, alder, utdanning, status osv. gir også ulike svareffekter Nedenfor skal vi se litt nærmere på noen av disse forholdene: 1 Tendens til å avgi «sosialt akseptable» svar For mange spørsmål er svaralternativene ulike med hensyn til hvor aksepta ble eller ønskelige de er ut fra respondentens dominerende normer eller verdier. På spørsmålet «Hender det at De nasker i butikker?» er det åpen bart at det sosialt ønskelige svaret er «nei», og vi må derfor anta at dette sva ret velges oftere enn de faktiske forhold skulle tilsi. Effekten av å svare sosi alt ønskelig gjør seg trolig mer gjeldende jo klarere normene er med hensyn til hva som er ønskelig. Eksempelvis viser undersøkelser fra USA at: «Since, at least among middle-class Americans, the most desirable responses are those that define one as happy, healthy, rational, unprejudiced, welladjusted, and democratic, it is likely that a good deal of distortion will be found in some people's responses to questions concerning these matters» (Phillips 1971:86).
Det viser seg videre at de samme respondentene som legger vekt på å frem stå som «happy, healthy» osv., reagerer lettere (enn andre) på ytre egenska per hos intervjueren, noe som igjen kan medføre at ulike intervjuere vil fa ulike svarfordelinger.
2 Egenskaper ved intervjueren Egenskaper ved intervjueren kan tenkes å påvirke respondentenes svar på flere måter. Mer og mindre åpenbare egenskaper som kjønn, alder, sosial status m.v. kan influere respondenten ved at han tillegger intervjueren be stemte forventninger. Hva respondenten opplever som sosialt akseptabelt, kan blant annet avhenge av om intervjueren er mann eller kvinne. Videre er det påvist at intervjuerens kjønnsrollemønster kan påvirke svarene på spørs mål om forhold det knytter seg kjønnsbestemte forventninger til. Det har blant annet fremkommet fra en undersøkelse der kvinnelige respondenter ble spurt om de pleide å besørge vedlikehold av bil, at kvinnelige intervjue re som selv pleide å sørge for slike ting, oppnådde langt flere ja-svar på det te spørsmålet enn øvrige kvinnelige intervjuere. Når det gjelder svareffekter som resultat av intervjuerens kjønn, synes det iallfall ganske klart at når det ved såkalte «truende» spørsmål (spørsmål om personlige forhold, proble mer osv.) åpner respondentene seg i alminnelighet heller overfor kvinnelige enn mannlige intervjuere. 149
Mye av det vi har anført over gjelder først og fremst de personlige, direkte intervjuene, det vil si der intervjuer og respondent befinner seg ansikt til an sikt. Mye har imidlertid også relevans for den typen personlig intervju vi gjerne kaller «indirekte» - nemlig der intervjuet foregår over telefon. Telefonen har lenge vært et omstridt informasjonsinnhentingsverktøy. Først og fremst har dette med utvalgsproblemer å gjøre. I land med lav telefontetthet (slik tilfellet stadig er i store deler av utviklingsland) vil bruk av telefon i datainnsamlingsarbeidet uvegerlig føre til sosial skjevhet i det ut valget man på denne måten når. Nettopp faren for utvalgsskjevheter har da også vært en av hovedinnvendingene mot å bruke telefon i samfunns- eller markedsundersøkelser. I dag har vi en telefontetthet på over 90 % i Norge. En slik innvending har følgelig ikke lenger gyldighet her. Når telefonen nå har blitt allemanns eie, representerer den tvert imot en mulighet til raskere og rimeligere datainnhenting enn for eksempel postale undersøkelser, uten at muligheten for generalisering er vesentlig dårligere. Når vi i mange tilfeller likevel for kaster telefonintervjuet som metode, henger dette sammen med en del begrensninger ved denne metoden: - Telefonen er ikke særlig egnet til lange og komplekse intervjuer.
- Faktisk informasjon om for eksempel forbruk kan være problematisk å innhente fordi respondenten ikke far samme tid til å tenke seg om som ved utfylling av spørreskjema. - Telefonintervjuet oppfattes av mange som en mindre seriøs metode. - Respondenten har lav kontroll med intervjuer. Hvem er det egentlig som stiller meg alle disse spørsmålene? Er det virkelig fra Statistisk sen tralbyrå?
To faktorer har likevel bidratt til at telefonintervjuet har fatt økende betyd ning som datainnsamlingsmetode (i tillegg til telefontettheten): - den jevnt over lave svarprosenten vi oppnår ved bruk av postale under søkelser - den høye kostnaden forbundet med bruk av personlige intervjuer
Med ovenstående er vi i ferd med å drøfte argumenter for bruk av den ene eller den andre av de tre mulige datainnsamlingsmetodene som vi forbinder
150
med surveymetoden. Vi oppsummerer fordeler og ulemper ved de tre me todene nedenfor, men kan sammenfatningsvis fastslå at når det gjelder pos tale undersøkelser versus personlige intervjuer, er den ene metodens styrker den andres svakheter og vice versa. Telefonintervjuer plasserer seg et sted midt imellom. Altså: styrker og svakheter ved de tre metodene for datainnsamling:
Personlig intervju Ulempe
Fordel
Høy svarprosent
Kostbart
Oppklare misforståelser
Intervjuereffekt
Demonstrere eller vise frem god kontroll
Lav anonymitet (lite egnet til intime/følelsesladede spørsmål)
Postale undersøkelser Ulempe
Fordel Rimelig
Lav svarprosent
Når mange
Lav kontroll
Sikrer anonymitet
Tidkrevende
Ingen intervjuereffekt
Misforståelser oppstår
Kan stille mange spørsmål
Telefo nin tervju et Fordel
Ulempe
Raskt og rimlig
Ikke alle har telefon
Når mange
Manglende troverdighet
Høy svarprosent
Bare korte intervjuer
Avklare misforståelser
Avslutningsvis kan vi gjengi noen mer prinsipielle innvendinger Johan Gal tung har fremført mot surveymetoden, og som gjerne kan brukes som dis kusjonsgrunnlag. 151
1
Det er, sier han, en individualistisk forskningsmetode. Ved enkeltvise in tervjuer av et utvalg respondenter har vi vanskelig for å få tak i den sosi ale struktur de alle er en del av.
2 Metoden er videre for demokratisk. I virkeligheten teller ikke personer like mye. Opinionsstrukturen vi får fram kan gi et skjevt bilde av hvilke krefter som er virksomme i samfunnet. 3 Metoden er i praksis begrenset til midtpartiet i lagdelingsstrukturen. Øvre og nedre lag er erfaringsmessig vanskelig å få tak i. 4 Metoden er for statisk. Vi får opplysninger fra bare ett tidspunkt.
5 Metoden baserer seg på den forutsetningen at det er samsvar mellom tanke og ord, samt ord og handling.
Stikkord til kapittel 17 surveymetoden intervjuereffekt intervjuets struktureringsgrad feilkilder ved surveys
Øvingsoppgave til kapittel 17 Diskuter opplegg og gjennomføring (evt. alternativer) av en undersøkelse blant studenter om moralske/etiske spørsmål.
Litteratur å gå videre med Ilstad, S., T. Paasche og J. Hovden: Surveymetoden, Tapir, 1981.
152
Kapittel 18
Kvalitative metoder Det er etter hvert mange (forskere) som føler at den tradisjonelle survey metoden, med sitt positivistiske tilsnitt og sin kvantifisering av sosial infor masjon (med kvantifisering mener vi som nevnt overføring av verbale ut sagn eller observert atferd til tall, kurver og tabeller), øker avstanden mel lom forskeren og den sosiale virkelighet han søker å kartlegge. Gapet mel lom den empiriske virkelighet og forskerens oppfattelse av den samme vir kelighet blir bare bredere i takt med bruken av mer og mer raffinerte kvantifiseringsmetoder, blir det hevdet. «Svært mye av det som i dag presenteres som metode er i virkeligheten gymnastiske øvelser i teknikker, som regel av avansert statistisk karakter, kombinert med konstruksjon av logiske og matematiske modeller (ofte valgt etter et elegansekriterium), bruk av input-output-analyser, systema nalyser, stokastiske analyser og andre finurligheter mer egnet til å tilsløre enn til å oppklare» (Blumer, 1969).
I stor grad har denne utviklingen vært bestemt av ønsket om å gjøre sam funnsfagene like «vitenskapelige» som de etablerte naturvitenskapene. Mid let har i den forbindelse blant annet vært adopsjon av naturvitenskapelig metodebruk, især den hypotetisk-deduktive. Den uttalte misnøye med mye av det eksisterende metodeverktøy har fått mange forskere til å se i andre retninger enn til naturvitenskapene for å hen te inspirasjon og metodiske forbilder. Utilfredshet med det naturvitenska pelige vitenskapsideal har i stigende grad fått samfunnsforskere til å utvikle forskningsmetoder i en slags symbiose med de humanistiske vitenskapene i særdeleshet historie og språkvitenskap. Men det betyr at det er mer enn fravær av statistiske modeller og mate matiske symboler som skiller kvalitativ metode fra kvantitativ. Det dreier seg like meget om fundamentalt forskjellige oppfatninger om den virkelighet vi ønsker å undersøke (som såkalte ontologiske utfordringer, som dreier seg om hvorvidt fakta eksisterer uavhengig av menneskelig erkjennelse, eller om de tvert om er et produkt av dette). Også hvordan det er mulig å få kunnskap om denne virkeligheten (epistemologiske spørsmål relatert til hvordan vi kan
153
gripe denne kunnskapen). Den praktisk-forskningsmessige konsekvens er iallfall at de forskningsstrategier den kvalitativt innstilte forskeren velger eksempelvis deltakende observasjon, dybdeintervjuer etc. - nettopp gjør det mulig for forskeren å få en så nær og direkte kunnskap som mulig om kring de sosiale forhold han undersøker. Som illustrasjon kan vi for eksempel se på hvordan vi innenfor markeds forskningen skiller mellom kvantitative og kvalitative metoder: Kvantitative metoder benyttes her for å registrere konkrete saksforhold som for eksempel utbredelsen av CD-spillere, hvor mange som har hund og katt, som handler på lørdager osv. Mye markedsforskning dreier seg rett og slett om varemerkers utbredelse i distribusjonskanalene (de såkalte «butikk indeksene»): Man registrerer for eksempel distribusjonsgrad, lagerlevetid, omsetningshastighet m.v. Slike undersøkelser kan gjøres mer eller mindre raffinerte. Kvantitative undersøkelser kan være alt fra enkle registreringer og like enkle krysstabuleringer, via korrelasjonsanalyse til de mest sofistikerte metoder som for eksempel faktoranalyse eller multidimensjonal skalering. (Prinsippene bak noen av disse analysemetodene blir kort gjennomgått i analysekapitlet.) Kvalitative metoder, derimot, brukes i forbindelse med problemstillinger som ikke på en meningsfull eller rasjonell måte kan brytes ned til numeriske størrelser. Mens de kvantitative metodene kan betraktes som analytiske i tradisjonell forstand, krever de kvalitative en, ja, kvalitativt forskjellig tilnær ming. Spissformuleringen «med en kvantitativ metode kan vi aldri oppdage kvalitative ulikheter» kan kanskje antyde hva vi mener. For å kunne sam menlikne ulike undersøkelsesobjekter på en meningsfull måte, må vi nød vendigvis sørge for at sammenlikningen skjer med hensyn til samme kvalitet. Kvalitativ metode skal gjøre forskeren i stand til å komme «close to the data», og jo nærmere eller tettere han kommer den virkelige verden (slik den oppleves av de personer han ønsker å få kunnskap om), jo større er mu ligheten for forståelse. Kort fortalt krever den kvalitative metoden at forske ren tolker og forklarer den sosiale virkelighet ut fra undersøkelsespersonens (objektets) eget perspektiv. Eksempelvis hevder den amerikanske forskeren Shere Hite dette synet i forordet til den såkalte Hite-rapporten (om kvinne lig seksualitet), der hun argumenterer for at informasjon om kvinnelig sek sualitet bare kan innhentes på en troverdig og valid måte av en som selv er kvinne og som selv kjenner dette på kroppen. Selv om vi ikke i alle tilfeller er villig til å gå like langt som Hite, kan det likevel - slik vi har brukt noen sider til å drøfte i bokas første del - ikke nok understrekes at samfunnsforskeren, i motsetning til naturvitenskapsmannen, ikke står overfor «objekter», men «subjekter» i sin forskning. Som
154
samfunnsforskere møter vi mennesker som tenker, snakker og handler som oss selv. Det er derfor tvilsomt om menneskelig samhandling og sosiale sys temer, eksempelvis en bedrift, kan bli tilfredsstillende beskrevet og analysert hvis vi ikke har tilgang til feltets aktører og deres forestillinger om og for tolkninger av virkeligheten. En sentral og ofte referert bok innenfor kvalitativ metode ble skrevet i 1968 av to amerikanske forskere, Glaser og Strauss, og hadde tittelen: The Discovery of Grounded Theory: Strategies for Qualitative Research. Grounded Theory-metoden er ikke interessert i å få vite hvor mange pro sent som mener eller gjør det ene eller det andre. Ei heller har metoden som mål å regne ut gjennomsnittsverdier for den gruppen som undersøkes med hensyn til ulike kvaliteter som alder, inntekt, utdanning eller for ek sempel alkoholforbruk. I stedet kan den, for eksempel når det gjelder alko holforbruk, ta sikte på å få kunnskap om på hvilke ulike måter folk nyter al kohol fremfor altså å telle opp hvem som drikker «ofte - sjelden - aldri» (med ulike måter kan for eksempel menes om man drikker alene, sammen med andre, til mat, hjemme eller ute, fordi man nyter det, for å bli full, om det gir skyldfølelse, osv.). Kvalitative variasjoner oppfattes med andre ord som mer interessant kunnskap enn kvantitativ opptelling. Et annet poeng med Grounded Theory er at utvalgets grad av representativitet heller ikke blir veldig betydningsftillt. Heller enn å begrense oss til å registrere et antall kvantifiserbare seksu elle kvaliteter, vil vi være opptatt av å få et så fullstendig bilde som mulig av den kvinnelige seksualitetens mange ulike kvaliteter. Om vi altså betrakter oss som Grounded Theory-tilhengere. Et annet poeng ved den såkalte Grounded Theory er at «teorien blir til mens vi går». Vi starter altså ikke opp forskningsprosessen med å holde opp en teori som vi deretter, gjennom avledning av hypoteser, innsamling av data osv. (i nokså klar sekvensiell form), vil «teste» holdbarheten av (jf. vår beskrivelse av «Den vitenskapelige undersøkelsesprosessen» på side 85-86). Akkurat dette vil vi hevde er et kjennetegn ved svært mye kvalitativ forskning, og det forklarer også hvorfor ulike kvalitative metoder gjerne samles under det forskningsdesignet vi kalte «eksplorativt», altså utforsk ende. I innledningen til dette kapitlet beskrev vi ulike måter å gjennomføre in tervjuer på - gradert etter grad av formalisering og kontroll. Uformelle, ustrukturerte og semistrukturerte intervjuer kalte vi med en fellesbetegnel se «kvalitative intervjuer». (Semistrukturerte intervjuer kommer vel strengt tatt i en mellomstilling.) Det finnes imidlertid et alternativ til individuelle kvalitative intervjuer som vi bør ofre noen linjer på, nemlig gruppeintervju et eller gruppesamtalen. Det er iallfall to grunner til at denne datainnhen155
tingsformen bør drøftes for seg. En tredje er at denne datainnhentingsmetoden er mye brukt, særlig innen markedsundersøkelser. Den ene er at det å intervjue åtte personer som utgjør en gruppe, vil kunne gi data som avviker fra hva vi hadde fatt om vi hadde intervjuet dem en og en og «lagt sammen» informasjonen til slutt. Årsaken til dette finner vi i det psykologene kaller for «gruppedynamiske prosesser». Det skjer med andre ord noe med oss når vi opptrer som gruppe. Det vil føre for langt å gjengi resultater fra gruppepsykologisk forskning i vår sammenheng, men to poeng kan være verd å ta med seg. Det ene karakteriseres ved stikkordet «konformitetspress», det andre ved stikkordet «holdningspolarisering». Med konformitetspress menes naturligvis gruppepress i retning av «minste felles multiplum» eller gjennomsnittsløsninger. Det betyr at gruppens sam lede oppfatning ikke nødvendigvis er overensstemmende med den individu elle oppfatning til enkeltmedlemmene. Og det kan derfor lett bli risikabelt dersom vi i etterhånd trekker slutninger og anviser tiltak på bakgrunn av re sultater fra gruppesamtaler alene. Husk for eksempel hva som skjedde i Hansa-eksemplet vårt. Det andre stikkordet antyder på mange måter den stikk motsatte prosess, nemlig at gruppemedlemmer med bestemte holdninger til et eller annet fe nomen ofte kommer ut av en gruppeprosess med de samme holdningene enda mer tydeliggjort. Dette er først og fremst noe vi skal være oppmerk som på der temaet for gruppesamtalen er kontroversielt eller følelsesladet, og der gruppemedlemmene tilkjennegir sterke holdninger innledningsvis. For øvrig er det viktig å peke på at kvalitative data ikke innskrenker seg til gjengivning av sitater, resonnement, forklaringer, problemformuleringer, forslag, dialoger eller reaksjoner. Kvalitative data omfatter også beskrivelser av situasjoner, relasjoner, konkrete prestasjoner og handlinger, verbalt, på bånd, film, video o.l. Kvalitative data fremkommer også når tekster, sosiale situasjoner o.l. analyseres ut fra bestemte kriterier (ofte verdiforankrede prinsipper eller normer). Eksempler på denne siste formen finner vi særlig tydeliggjort innenfor det vi kaller «aksjonsforskning», og som vi har diskutert relativt grundig i bokas første del. Helt til slutt minner vi om hva vi tidligere har sagt om bruk av både kvan titative og kvalitative datainnsamlingsmetoder i ett og samme undersøkel sesopplegg (såkalt metodetriangulering). Det er altså viktig å understreke at dette ikke nødvendigvis er strategier som står i motsetning til hverandre, men som på ulike måter kan (og flere og flere synes å mene bør) kombine res.
156
Stikkord til kapittel 18 Grounded Theory gruppesamtalen metodetriangulering
Øvingsoppgave til kapittel 18 Diskuter hvordan øvingsoppgaven til forrige kapittel (om studenters moral) kan gjennomføres som kvalitativ undersøkelse. Drøft noen konsekvenser av et slikt undersøkelsesopplegg sammenliknet med et kvantitativt. Se også på mulighetene for å kombinere de to oppleggene.
Litteratur å gå videre med Repstad, R: Mellom nærhet og distanse, Universitetsforlaget 1993. Dale, B., M. Jones og W. Martinussen: Metodepd tvers, Tapir, 1984.
Kapittel 19
Dataanalyse Innledningsvis kan det slås fast at all dataanalyse - enten vi nå kaller den kvantitativ eller kvalitativ - tjener samme formål, nemlig å skaffe orden og oversikt i datamaterialet vårt. Men mens den kvantitative analysen benytter seg av matematiske og statistiske teknikker for å oppnå denne, nøyer den kvalitative seg med å kategorisere og klassifisere datamaterialet. (Det er rett nok en viss utvikling i retning av å underlegge et kvalitativt datamateriale statistisk bearbeiding, men vi holder likevel, i vår sammenheng, fast ved det ovennevnte delingskriteriet.) Vi har tidligere viet fenomenet «måling» ganske mye oppmerksomhet. Utgangspunktet for oppmerksomheten var naturlig nok vår forskningsmes sige streben etter å måle virkeligheten så nøyaktig som mulig. Vi redegjor de dessuten for det vi kalte ulike «målenivåer» der det laveste, nominalnivdet, strengt tatt ikke kunne betraktes som målenivå, fordi vi her egentlig ikke gjorde annet enn å klassifisere fenomenene etter (gjensidig utelukken de) kjennetegn som for eksempel kjennetegnet «mann» og kjennetegnet «kvinne», og der bruken av tall bare erstatter bruken av navn (nomen). Det er derfor all grunn til å reise spørsmålet om klassifikasjon er det sam me som måling. Svaret vil avhenge av hvordan vi definerer måling. Dersom vi for eksempel definerer måling som den prosess som fastslår likheter og ulikheter mellom fenomener, så er klassifikasjon måling. Men dersom vi de finerer måling som den prosess som fastslår gradsforskjeller mellom feno mener og mengder, er klassifikasjon ikke måling. Som vi også understreket over, så er kvalitative undersøkelser og også kvalitativ analyse først og fremst opptatt av kvalitative forskjeller og likheter, mens kvantitative undersøkelser og analyse er fokusert på kvantitative for skjeller mellom to fenomener som er like «av natur», det vil si tilhører sam me klasse. Men de har begge det til felles at de ønsker å «måle» virkelighe ten - om vi altså aksepterer at måling ikke nødvendigvis bare har med tall størrelser å gjøre.
158
Kvantitativ dataanalyse Grunntanken bak antakelsen om at systematiske analysemetoder er å fore trekke fremfor ren intuisjon eller «Fingerspitzgefiihl», er at disse sannsyn ligvis øker sjansen for å kunne trekke riktige konklusjoner fra våre data. For mange undersøkelser vil ikke grove sammenfatninger eller sammen likninger av de data vi har samlet inn være tilstrekkelig. Ofte vil vi stå over for spørsmål som ikke lar seg besvare ved enkle håndgrep. Kvantitativ da taanalyse er nødvendig for å kunne besvare komplekse spørsmål gjennom å trenge igjennom og fa oversikt over store datamengder. De spørsmålene vi ønsker å besvare gjennom å samle inn data og analy sere disse, kan grovt sett sies å være av to typer. Den første typen spørsmål er de som dreier seg om hvordan ulike egen skaper fordeler seg i datamaterialet vårt. Det kan for eksempel være spørs mål av typen:
- Hvor stor del av Oslos bilpark passerer bomringen mellom klokka 0700 og 0900 hver dag?
- Hvor mange kvinnelige jusstudenter er det ved Universitetet i Bergen? - Hvilket reisemål er mest populært blant nordmenn på Sydenferie? - Hvor stor er oppslutningen om partiet Høyre i mars 1997?
Det analysemessige svaret på denne typen spørsmål får vi gjennom å gjen nomføre såkalte univariate analyser, det vil si analysemetoder som brukes når bare en variabel (andelen av Oslos bilpark, reisemål, kvinnelige jusstu denter) er i fokus. Grunnlaget for denne type analyse er vanligvis rene frekvensfordelinger, det vil si en tallmessig oversikt over fordelingen rundt den variabelen som inngår i undersøkelsen. I eksemplet med valg av reisemål kunne en frekvensfordeling for eksempel se slik ut: Spania
21 %
Kanariøyene
16%
Hellas
17%
Tyrkia
9%
Mallorca
20%
Kypros
10%
Italia
4%
Frankrike
3%
159
Fordi vi her opererer med prosent og ikke absolutte tall, har vi å gjøre med en relativ (i motsetning til en absolutt) ffekvensfordeling. Allerede i det lig ger en forenkling i forhold til om vi hadde benyttet antall individet (som inngikk i undersøkelsen) i oversikten vår. Den andre typen spørsmål tar oss et skritt videre, idet vi ikke lenger bare er interessert i hva som er de mest populære feriemålene, men også om det er noen form for sammenheng mellom valg av feriemål og andre egenskaper, eksempelvis alder. Er det for eksempel noen gjennomgående aldersforskjell mellom de som foretrekker å feriere på Mallorca og de som foretrekker Tyr kia? Eller hva med kjønn? Er det først og fremst menn som foretrekker Spa nia, mens kvinner har en forkjærlighet for Hellas? Ved å kunne gi noenlunde sikre svar på slike spørsmål, sitter vi tilbake med langt mer nyansert (og antakelig også nyttig) informasjon, enn om vi utelukkende konsentrerte oss om univariate fordelinger. Men som vi skjøn ner, så fordrer dette at vi i tillegg til å spørre om foretrukket reisemål må stille respondentene våre minst ett spørsmål i tillegg. Hva vi altså da far mu lighet til, er å undersøke sammenhengen mellom to eller flere variabler. For å fa mål på slike sammenhenger gjennomfører vi såkalt bi- eller multivariat analyse. Fordi det å komme til klarhet om sammenhenger mellom variabler er et så sentralt forskningsmål for kvantitative undersøkelser (jf. vår definisjon av hva forskning dreier seg om i innledningen til denne delen av boka), span derer vi på oss å forsøke å definere hva vi egentlig mener med begrepet sam menheng. La oss ta utgangspunkt i variablene «utdanning» og «inntekt». Dersom vi gjennomførte en undersøkelse hvor vi blant flere ting også spurte om respondentenes utdanning og inntekt, og der analysen viste at det gjen nomgående var slik at de med høyest utdanning også hadde den høyeste inntekten, så ville vi altså kunne påstå at det var en sammenheng mellom variablene. Og fordi de med høyest utdanning også hadde høyest inntekt, ville vi i tillegg kunne si at sammenhengen går i en bestemt retning, som vi kaller positiv. Den motsatte type sammenheng ville være en negativ sam menheng. Med utsagnet «sammenheng mellom to variabler» forstår vi altså noe i retning av en relasjon mellom to variabler som er slik at sammen med stadig økende verdier på den ene variabelen opptrer, i det store og hele, enten sta dig økende eller stadig minkende verdier på den andre variabelen. Dette svarer da til henholdsvis positiv og negativ sammenheng. I mange tilfeller er de kvantitative relasjonene som vi er ute etter å bely se, enkle. Men når vi skal sammenholde slike mengdesforhold på en slik måte at de enten angår mange enheter (antallet individer som inngår i un-
160
dersøkelsen er stort) eller flere saksforhold på en gang (mange kjennetegn eller egenskaper ved enhetene ønskes undersøkt), eller slik at vi ønsker å kunne trekke slutninger om et større univers basert på en begrenset meng de observasjoner, trenger vi en formalisert metode. Det grunnleggende spørsmålet i denne forbindelse er: Når en enhet har egenskapen x (høy utdanning), hvor stor er da sannsynligheten for at den også har egenskapen y (høy inntekt)? Ulike statistiske metoder er utviklet og brukes til å gi oss mål på slike sammenhenger {om de finnes, og i tilfelle hvor sterke de er). Metodene er til passet forskjellige forutsetninger eller kjennetegn ved de variablene som inngår i datamaterialet vårt, eksempelvis hva slags målenivå variablene be finner seg på (nominal eller forholdstall), eller antallet variabler som inngår i analysen (to eller mange).
Men er sammenhengen reell?
Uansett hva slags statistiske metoder vi benytter oss av i våre forsøk på å ut lede sammenhenger mellom variabler, trenger et helt grunnleggende spørs mål seg alltid på og fordrer et svar, nemlig hvorvidt de forskjeller vi har kun net identifisere (eksempelvis mellom inntektsnivået for dem med høy og de med lav utdanning) er uttrykk for virkelige forskjeller, eller er resultat av til feldigheter. Bakgrunnen for denne problemstillingen er at våre konklusjo ner så å si alltid baserer seg på resultatene fra en utvalgsundersøkelse. Vi vet strengt tatt ikke hva slags resultat vi ville ha fatt dersom vi hadde undersøkt et annet utvalg (eller for den saks skyld et tredje eller et fjerde). For å se om de resultater vi har kommet fram til gir uttrykk for virkelige forskjeller, og altså ikke er resultat av tilfeldigheter, kan vi gjennomføre en statistisk test av datamaterialet vårt som kan hjelpe oss med å vurdere om de observerte forskjellene er reelle (signifikante) eller ikke. Vi skal ikke her gi en detaljert anvisning på hvordan en slik test gjen nomføres, men det grunnleggende prinsippet er at den forteller oss at der som vi hadde gjennomført undersøkelsen på mange utvalg, ville vi i for ek sempel 95 av 100 tilfeller finne de samme forskjeller. (Vi kaller dette testens signifikansnivå, her altså 95 %.) For øvrig henvises til innføringsbøker i sta tistikk for nærmere forklaring av disse forholdene, se eksempel bakerst i ka pitlet. Vi er imidlertid ikke ferdige med saken, selv om vi har gjennomført en signifikanstest som viser at det med høy grad av sannsynlighet er sammen heng mellom utdanningsnivå og inntekt. Det påligger i tillegg oss som for skere å forklare hvorfor det synes å være en slik sammenheng. Vi må altså prøve å se nærmere på hva slags mekanismer som er virksomme og som 161
skaper relasjoner der vi kan gi tallmessige uttrykk for styrkeforholdet mel lom variabler. Sånn sett har også kvantitative analyser islett av «kvalitative» elementer. Dette er ikke minst viktig med tanke på å unngå såkalte «feilslutninger». Det innebærer at vi for eksempel tar «for gitt» at en observert sammenheng mellom to variabler er reell, mens det faktisk kan vise seg at denne sammen heng forsvinner, eller svekkes kraftig, dersom vi undersøker saksforholdet litt nærmere. Anta at en undersøkelse viser at det er en signifikant sammen heng mellom kjønn og jobbtilfredshet i den forstand at resultatene viser at menn er mer tilfredse med jobben enn kvinner. Før vi imidlertid utbasune rer dette, bør vi tenke oss om. Er det noen rimelig grunn til at det skal være kjønnsforskjeller forbundet med grad av tilfredshet med egen jobb? Eller kan forklaringen skyldes andre forhold? Kan det for eksempel tenkes at type jobb som vanligvis holdes av menn og kvinner kan ha noe med saken å gjø re? (Jf. diskusjonen under Aksjonsforskning på side 48, der vi også var inne på slike problemstillinger.) Slike overveiinger (fortsatte analyser), som medfører at vi kontrollerer for en tredje variabel (her: jobbtype) kan hjelpe oss med å unngå å trekke slutninger som kan vise seg å være falske (spuriøse). Mange analyser (kvan titative og kvalitative) stopper for tidlig fordi sammenhengene kan se «opp lagte» ut.
Sammenheng og årsakssammenheng Vi har vært inne på det tidligere, men det tåler å gjentas: En sammenheng er ikke nødvendigvis det samme som en årsakssammenheng! Faktisk er det slik at for alle andre forskningsdesign enn det kausale far vi ikke resultater om årsakssammenhenger, men om statistiske sammenhenger. Det betyr ikke at statistiske sammenhenger ikke kan fortelle oss noe om årsak og virk ning. Det er selvfølgelig både mulig og rimelig å argumentere for at det er utdanningsnivå som forårsaker forskjeller i lønnsnivå og ikke omvendt. Men resultatet av analysen, som forteller oss at disse variablene henger sammen, er ikke alene nok til å utsi noe om årsak og virkning. At det for eksempel er påvist en sammenheng mellom på den ene side at norske kvinner far færre barn nå enn tidligere og på den andre side at antal let norske kvinner som tar universitetsutdanning er høyere nå enn tidligere, forteller oss ikke umiddelbart hva som er årsak og hva som er virkning. Te oretisk kan jo «årsakspilen» her gå begge veier: Det er godt mulig å tenke seg at grunnen til at flere kvinner tar universitetsutdanning er at de har fær re barn (og således bedre tid), samtidig som det motsatte argument, nemlig
162
at fordi norske kvinner velger å ta universitetsutdanning (for å realisere egne muligheter og konkurrere om attraktive jobber), så har dette som virkning at de også ønsker seg færre barn.
Styrken av sammenhenger Vi antydet over at kvantitativ analyse gir oss mulighet til å utsi noe om hvor sterk en sammenheng mellom to eller flere variabler er. Denne regner vi ut, og prinsippet er gjennomgående at jo mer av variansen rundt en variabel (variasjonene i for eksempel inntekt) som kan forklares av en eller flere an dre variabler (i vårt tidligere eksempel: utdanning), jo sterkere er sammen hengen mellom variablene. Dersom det altså er slik at inntektsvariasjoner helt og holdent er resultat av utdanningsvariasjoner, ville vi ha det vi kaller en perfekt sammenheng mellom variablene utdanning og inntekt. Eller sagt på en annen måte: Da kunne vi, med kjennskap til en persons utdannings nivå (eksempelvis høyt, middels, lavt) alltid kunne forutsi personens inn tektsnivå. Men sånn er det ikke. Det er flere årsaker til dette. Den viktigste er at det aldri er slik at «virke ligheten» kan forklares med referanse til en eneste variabel. Dermed blir det i beste fall et spørsmål om å trekke inn så mange variabler som vi synes er nødvendig for å forklare variansen. Dernest er det også slik at vi aldri kan forvente å få forklart hele variansen, nær sagt uansett hvor mange «forklaringsvariabler» vi trekker inn. Poenget blir derfor å lete seg fram til et håndterbart antall variabler som samlet forklarer en akseptabel andel av variansen i atferd eller holdninger eller hva det er vi undersøker. La oss se på et eksempel. Utdanningsinstitusjoner er blant flere ting også opptatt av studentenes tilfredshet. Det antas videre at studenters tilfredshet er resultat av kvaliteten på de produkter eller tjenester institusjonen tilbyr studentene. Forsøk på å måle grad av tilfredshet innebærer følgelig at det blir om å gjøre å plukke ut de kvalitetsområder man antar har størst innvirkning på tilfredsheten. Den ne jobben kan for eksempel gjennomføres som en kvalitativ forundersøkel se, eksempelvis i form av gruppesamtaler med studentene. Selve undersø kelsen kan gjennomføres som en tradisjonell surveyundersøkelse der de en kelte kvalitetsområder, for eksempel «læringsforhold» operasjonaliseres ved hjelp av et sett av spørsmål. Resultatet av undersøkelsen kan så analyseres gjennom bruk av metoder som gjør oss i stand til å identifisere:
163
a) variablenes samlede forklaring av variansen i tilfredshet blant studente ne. (Dersom vi for eksempel er i stand til å forklare 70 % av variansen ved hjelp av for eksempel åtte kvalitetsvariabler, skal vi være godt fornøyd. Det kan da se ut som om vi har fatt tak i det viktigste.)
b) variablenes andelsmessige (relative) forklaringskraft. For eksempel kan det vise seg at alle de åtte variablene vi trakk inn i undersøkelsen betyr noe for studentenes tilfredshet, men at «kvaliteten på forelesningene» betyr mest. Det innebærer at dersom institusjonen ønsker å høyne til fredsheten blant studentene, vil det mest effektive tiltaket være å gjøre noe med forelesningskvaliteten.
Vi startet opp dette kapitlet med å understreke at hensikten med all data analyse er å skape oversikt og orden i materialet vårt. «Datareduksjon» kan stå som et annet stikkord felles for både kvantitativ og kvalitativ dataanalyse. 0 A redusere mengden av informasjon gjennom kategorisering eller annen behandling av data er maktpåliggende dersom vi vil ha oversikt over og kunnskap om materialet vårt. Innenfor kvantitativ analyse finnes det mange teknikker som nettopp tar sikte på å redusere omfanget av og mangfoldet i datamaterialet. Her skal vi avslutningsvis bare nevne en slik metode. Faktoranalyse kalles en statistisk teknikk som hjelper oss med å oppdage mønstre i datamaterialet vårt som vi ikke selv umiddelbart er oppmerksom me på. La oss si at vi har gjennomført en spørreundersøkelse bestående av et stort antall ulike spørsmål. Det en faktoranalyse av svarene kan hjelpe oss med her, er å identifisere ulike grupper eller «klynger» av spørsmål som henger sammen, og som kan gi opphav til forklaringer som ellers ville være vanskelige å «se». En etter hvert berømt spørreundersøkelse om nasjonale kulturforskjeller gjennomført av nederlenderen Gert Hofstede (1980) er ett eksempel på en undersøkelse der bruk av faktoranalyse kunne påvise at svarene på en rekke spørsmål «hang sammen» og dannet grupper som på en meningsfull måte hjalp forskeren med å sette navn på faktorer som indikerte kulturelle for skjeller mellom ulike nasjoner. For eksempel kalte han en slik faktor for «grad av individualisme», og han kunne, basert på svarene på de spørsmåle ne som dannet utgangspunkt for denne bestemte faktoren, fastslå at USA har langt større grad av individualistiske trekk enn for eksempel Norge. La oss helt til slutt, før vi ser litt nærmere på kvalitativ dataanalyse, fastslå at kvantitativ dataanalyse er et uunnværlig hjelpemiddel i vår omgang med store datamengder. Samtidig er det ikke mer enn et hjelpemiddel. Faren lig ger i at kvantitativ analyse far status av noe mer enn det det faktisk er, med 164
fare for noe vi kan kalle for «oppmerksomhetsforvrengning». Det kan nep pe sterkt nok understrekes at de logiske tankeoperasjoner og det intellektu elle herredømme fortsatt bør ligge hos forskeren selv!
Kvalitativ analyse Som vi understreket i innledningen til analysekapitlet, så har kvantitativ og kvalitativ dataanalyse samme siktemål: orden og oversikt. Det er imidlertid ikke til å komme bort fra at det hefter seg noen nokså grunnleggende ulik heter ved de to måtene å analysere data på. Den mest fremtredende er na turligvis bruk/ikke-bruk av tallstørrelser. Dette har vi alt diskutert. En annen forskjell har med rekkefølgen av de ulike operasjonene som inngår i forsk ningsprosessen å gjøre. Mens kvantitativ analyse alltid skjer etter at dataene er samlet inn, skjer den kvalitative analysen oftest parallelt med datainnsam lingen. Dette henger delvis sammen med tankegangen fra «Grounded Theory» om at teorien (dvs. kunnskapen) blir til under prosessen, og delvis med rent praktiske begrunnelser. En kvalitativ undersøkelse i form av for eksem pel en rekke dybdeintervjuer tar lang tid, innebærer mange sider med nota ter, og krever nesten at man renskriver og bearbeider stoffet fortløpende. Uansett, også data innhentet ved hjelp av kvalitative metoder må analy seres. Data taler ikke for seg selv, dataanalysen utgjør - på samme måte som for kvantitative undersøkelser - den prosess hvorved vi prøver å ordne data ene slik at de far struktur og dermed blir lettere tilgjengelig for tolkning. Litt forenklet kan vi kanskje påstå at mens analysearbeidet i kvantitative un dersøkelser dreier seg om å arbeide med på forhånd gitte kategorier som vi prøver å beskrive gjennom ulike målingsprosedyrer, så dreier analysearbei det i de kvalitative undersøkelsene seg om å finne fram til de kategorier som best beskriver de fenomen vi undersøker. En gjennomgang av kvalitativ metodelitteratur forteller oss at det nok er skrevet mer om hvordan vi bør drive kvalitativ datainnsamling om hvordan vi beveger oss fra kvalitative «rådata» til ferdig rapport. Noe av årsaken til dette er antakelig at når det gjelder bruk av kvalitative metoder, så er analy se, tolkning og rapportskriving til dels spørsmål om personlig stil og indivi duelle løsninger. Det er likevel et krav at analysearbeidet også for kvalitative undersøkelser krever systematikk, og det vil under enhver omstendighet være fornuftig å nyttiggjøre seg erfaringer andre har gjort på dette området. Så hvilke råd gis? De fleste som skriver om dette, understreker viktigheten av fortløpende å gå igjennom notatene fra det ustrukturerte intervjuet, gruppesamtalen eller for den saks skyld observasjonene. (Vi har ikke drøftet observasjonsmeto 165
den i denne boka. Det skal imidlertid ikke unnslås at for mange er nettopp observasjon synonymt med kvalitativ metode.) Deretter begynner arbeidet med å systematisere stoffet, eksempelvis gjennom stikkordmessig å klassifi sere stoffet i overensstemmelse med kategorier eller temaer som synes å gå igjen i materialet. Som eksempel kan vi holde fram en (tenkt) kvalitativ stu die av en bedriftsorganisasjon, der vi etter hvert som arbeidet går fremover identifiserer følgende temaer som grunnlag for klassifikasjon: -
lederstil samarbeidsproblemer karriere holdning til egen arbeidsplass
En slik sorterings- og klassifikasjonsprosess vil vanligvis bli gjennomført ma nuelt, men det utvikles stadig mer brukervennlige EDB-programmer som for eksempel gjør det mulig å forsyne hvert avsnitt i teksten med en eller fle re koder, og dermed gi muligheten for samlede utkjøringer av alle tekstav snitt under samme kode. Selv om vi også her benytter begrepet «klassifisering», gjelder ikke nød vendigvis den kvantitative metoderegelen om at klassifiseringer skal være uttømmende og gjensidig utelukkende. Det er tvert imot slik at nærheten mellom forskeren og dem han undersøker har som metodisk konsekvens glidende overganger mellom kategoriene. Som et forsøk på å få fram en mer strukturert og kanskje også mer over siktlig kategorisering av datamaterialet, kan vi for eksempel - etter å ha gått igjennom notatene fra intervjuene - tegne opp en datamatrise inneholden de aktører og temaer. Hvis vi igjen tenker på vår kvalitative bedriftsunder søkelse og tenker oss at vi blant annet intervjuet en del kvinnelige ansatte om hvordan det er å være kvinnelig ansatt i denne bedriften, kunne matri sen eksempelvis se slik ut:
166
Generelt syn på kvinners situasjon
Opplevd at menn har gått foran karrieremessig
Alder
Stilling
frk. Hansen
ca. 60
adm. sekr
synes dette får for mye opp merksomhet
frk. Jensen
ca. 20
kontor, ass.
har ikke tenkt på vet ikke, tror ikke det det
fru Hagen
ca. 30
data. kons.
dette er viktig
overhodet ikke
ikke grove over tramp, men er blitt forbigått
En slik matrise vil åpenbart kunne lette søkingen etter mønstre og sammen henger i datamaterialet, og logikken er den samme som i kvantitativ analy se, idet vi ser etter om det er bestemte kombinasjoner av egenskaper som opptrer ofte. I matrisen over kan det for eksempel være interessant å under søke effekten av variabelen alder på egenskapen «opplevd forbigåelse». Når vi på denne måten nærmer oss analyseprosedyrer som vanligvis for beholdes kvantitative analyser, er det viktig å huske på én ting: I kvalitative undersøkelser er utvalget vanligvis relativt lite. Det er heller ikke trukket med statistisk representativitet som mål. Vi må derfor i kvalitativ dataanaly se være varsomme med å sette fram generelle påstander om sammenhenger mellom variabler. Men hvis det viser seg at det er klare mønstre i materialet, eksempelvis store forskjeller mellom eldre og yngre kvinnelige arbeidstake re med hensyn til bestemte forhold, må vi selvsagt kunne gjøre oppmerk som på dette og diskutere det. Som vi har understreket flere ganger, tar kvalitative og kvantitative analy semetoder sikte på å fa fram grunnleggende forskjellige egenskaper ved da tamaterialet - på den ene side antall, størrelser og mengder, på den andre side egenskaper og kvaliteter. Videre tar de kvalitative metoder heller ikke sikte på å teste hypoteser, men å utvikle dem. Uansett - i diskusjonen rundt bruken av kvantitative eller kvalitative me toder må hovedpoenget alltid være at vi velger den metode som er best eg net til å fremskaffe kunnskap om den problemstilling vi ønsker å undersøke.
Strategi for egen forskning Som en ikke usannsynlig konsekvens av det som har blitt pekt på i metode delen i denne boka, vil enkelte muligens føle at de nå er enda mer usikre enn før. Og, ja, å skrive om forskningsmetode på en slik måte at leseren «ser lyset», er - vil mange mene bortimot umulig. A lage gode undersøkelser er antakelig mer enn mye annet en «learning by doing»- prosess. Det er likevel forhåpentligvis ikke unyttig tidsbruk verken å skrive eller lese bøker om forskningsmetode. Om ikke annet viser metodebøker nokså klart de mange veivalg vi kan gjøre mens vi beveger oss fra start mot mål i en undersøkelsesprosess. Forskningsmetode byr på mange spennende muligheter, men samtidig atskillige fallgruber - spesielt for den som tar mål av seg til å utfø re forskningsmessige «kvantesprang». Ikke sjelden ser vi - spesielt når det gjelder studenter - eksempler på at den forskningsmessige dristigheten er omvendt proporsjonal med erfaring og metodekunnskaper, og ikke sjelden med knall og fall som resultat av forskningsforsøket. 167
En fornuftig strategi, spesielt for dem som ikke er drevne forskere, er nok å holde seg til regelen om at det er lurt å lære seg å krype før en forsøker å gå. Sammenfattet i en firefeltstabell (vi har ikke skrevet noe om tabeller, men bruk av firefeltstabeller er en utmerket fremstillingsform av fortettet og systematisert informasjon) kan forholdet mellom problem og metode valg se slik ut: Metode Problem Tradisjonelt
Nytt
Tradisjonell
Ny
Best og sikrest
Risikabel
Nest best
Farlig
Resepten blir med andre ord: Velg en akseptert og godkjent problemstilling og benytt aksepterte og velprøvde metoder. Unngå for all del kombinasjo nen av nye metoder på nye problemstillinger. Resultatet av slik dristighet vil oftere bli vurdert som spekulativt enn som innovativt.
Stikkord til kapittel 19 univariat - bivariat - multivariat analyse datareduksjon spuriøse sammenhenger signifikante sammenhenger
Øvingsoppgave til kapittel 19 Tenk igjennom hvordan du kan gå fram for å gjennomføre en kvalitativ analyse av resultatene fra en gruppesamtale omkring «opplevd motepress» blant skoleelever. Prøv å sette opp en tabellarisk oversikt på bakgrunn av hva du mener er de antatt mest relevante datakategorier.
Litteratur å gå videre med Dale, B., M. Jones og W. Martinussen: Metode på tvers, Tapir, 1984. Krokan, A.: Forstå statistikk, Statistiske metoder for samfunnsfag og huma niora, Kolle forlag, 1995. Wenstøp, F.: Statistikk og dataanalyse, TANO, 1991. 168
Kapittel 20
Sluttord om vitenskapsteori og forskningsmetode Innsikt i vitenskapsteoretiske problemstillinger skal gi grunnlag for kritisk bevissthet og refleksjon rundt egen og andres forskning. Vi skal vite at ver ken problemstillinger eller metodevalg kommer «rekende på fjøler», men oftest er bestemt av bestemte vitenskapelige «paradigmer». Vi har tidligere berørt noe vi kan kalle to ulike «kunnskapsparadigmer». Avhengig av hvor dan vi definerer kunnskap (vårt epistemologiske grunnsyn) vil vi velge ulike metoder for innhenting av slik kunnskap. Dersom vi betrakter kunnskap som noe «faktisk» noe, som det finnes bestemte mengder av «der ute», vil vi naturligvis også velge helt andre metoder for innhenting av denne kunn skapen enn dersom vi mente at kunnskap alltid er uløselig knyttet til for ek sempel individ og situasjon. I det første tilfellet vil vi hevde at mengden kunnskap kan kvantifiseres og måles. I det andre tilfellet vil vi nok være mer skeptiske til en slik strategi. Nedenstående eksempel vitner om at «måletradisjonen» stadig står sterkt i norsk og internasjonal samfunnsforskning. La oss derfor bruke et par mi nutter til å se nærmere på hva dette kan innebære. Nylig fikk resultatene fra en internasjonal undersøkelse om matematik kunnskapene blant 6. klassinger stor oppmerksomhet i norsk presse. De norske elevene kom forholdsvis dårlig ut, og straks ble det (ikke minst fra enkelte politiske hold) slått alarm om kvaliteten i norsk skole. I dette tilfel let har man altså brukt resultatet fra en undersøkelse om matematikkunn skaper til å trekke konklusjoner om kvaliteten i den norske enhetsskolen, uten - synes det - i det hele tatt å ha tatt seg tid til å drøfte et par temmelig vesentlige forhold med klar konsekvens for holdbarheten av dette resonne mentet: For det første-. Hva slags grunnleggende kunnskapssyn ligger til grunn for valg av dette undersøkelsesopplegget? Er undersøkelsesopplegget valgt fra strategiske eller prinsipielle betraktninger? Søkes det etter analytisk beskri velse hvor vi jakter på relevans, eller statistisk generalisering basert på presi sjon? Hva skal resultatene av undersøkelsen brukes til? For det andre-. Hva slags grunnleggende kunnskapssyn er dominerende i
169
de land som sammenliknes? Fra sammenliknende kulturstudier vet vi at må let med kunnskapsformidling varierer rundt om i verden. Mens man i noen land er opptatt av å formidle faktisk, målbar kunnskap innenfor klart av grensede kunnskapsområder, er man i andre land langt mer opptatt av å gjøre elevene til selvstendig tenkende individer. Resultater av kunnskapstes ter på tvers av slike tradisjoner må bli vanskelige å evaluere. Ved å gå inn i drøftinger av denne typen, er det iallfall mulig at resultate ne av denne bestemte undersøkelsen ville få en noe mer nyansert behand ling enn tilfellet faktisk har vært. Metodeutfordringene er i det hele tatt mange, og metodiske og strate giske dilemmaer oppstår stadig. Det finnes, som vi skjønner, ikke noe som kan kalles «the one best way» innenfor samfunns-, markeds- eller organisasjonsforskning. Likevel, kravet om sammenheng mellom teori, problem og valgt fremgangsmåte for å belyse problemet, kan vi vanskelig komme unna. Spørsmål om valg har naturligvis en praktisk side. Det er nå en gang slik at bestemte rammebetingelser, eksempelvis i form av tidspress eller begren sede økonomiske ressurser, kan «tvinge» oss til å velge bort visse strategier eller metoder. Men spørsmålet har - slik vi har forsøkt å understreke i den ne fremstillingen - også en vitenskapsteoretisk side. Viktigst av alt, og la dette være vårt avsluttende budskap, er at vi (overfor oss selv og andre) redegjør for og begrunner de valg vi gjør! Forskning er kumulativ virksomhet, der sten legges på sten. Det er derfor viktig for forsk ningens kvalitet og kunnskapsfeltets utvikling at våre strategiske valg blir re degjort for og begrunnet. Først da blir det mulig for andre å evaluere vårt bidrag på en ordentlig måte. Både de mer tradisjonelle samfunnsfagene og de økonomisk-administra tive fagområdene er i sitt vesen tverrvitenskapelige. Den kunnskap som frembringes, bygger på så vel naturvitenskapelige som samfunnsvitenskape lige og humanistiske forskningsmetoder. Dette understreker ytterligere vik tigheten av å kunne se og forstå helheten og sammenhengen. Vitenskapste oretisk kunnskap er et nødvendig virkemiddel i denne sammenheng.
170
Vedlegg
Eksempel på spørreskjema 1
Hva heter skolen?
2 Hvilken kommune ligger skolen i?
3 Hvilken holdning har skolen generelt til bruk av edb i ordinær under visning? Positiv Nøytral Negativ 4 Til hvilke formål bruker skolen edb-utstyr i dag?
0 0 0 0 0 ø ø
Administrasjonen Lærerne Spesialundervisning Spesielle elever Valgfag Ordinær undervisning Ingen
5 Hvilken eller hvilke maskiner er i bruk i undervisningen nå?
0 Amiga 0 IBM 0 Macintosh 0 Tiki ø Andre 171
6 Ved spesialundervisning, hvilken eller hvilke maskiner er da i bruk?
□ Amiga □ IBM 0 Macintosh □ Tiki □ Andre 7 Hvilken eller hvilke maskiner bruker administrasjonen/lærerne på sko len?
□ Amiga □ IBM □ Macintosh □ Tiki □ Andre
8 Rent generelt: Hvor tilfreds er skolen med dagens utstyr mht. følgende faktorer?
Bruk følgende skala, sett ring rundt passende alternativ: Lite tilfreds Svært tilfreds 1 ................ 2.................. 3.................. 4.................. 5
172
Pris
1 —2 —3 —4 —5
Brukervennlighet
1-2-3-4-5
Opplæring fra leverandør
1-2-3-4-5
Oppfølging fra leverandør
1-2-3-4-5
Tilleggsytelser/service
1-2-3-4-5
Produktets pålitelighet
1-2-3-4-5
Oppdatering av programvare
1-2-3-4-5
Totalløsningen
1-2-3-4-5
9 Planlegger skolen å anskaffe edb-utstyr i forbindelse med undervisning en?
0 Planlegger kjøp i 19... 0 Aktuelt på et senere tidspunkt 0 Nei Hvis nei, gå til spørsmål 11.
10 Hvilken maskin er det mest aktuelt å kjøpe til bruk i undervisningen?
0 Amiga 0 IBM 0 Macintosh 0 Tiki 0 Andre 11 Hvorfor bestemte din skole å kjøpe edb-utstyr?
0 Større fleksibilitet i undervisningssituasjonen 0 Følge med i utviklingen 0 Ønske fra lærerne 0 Ønske fra elevene ø Ønske fra foreldrene 0 Annet 12 Disponerer skolen egne midler til kjøp av edb-utstyr i undervisningen?
0 Ja 0 Nei 13 Hvis ja, hvor mye disponerer skolen? ................... kr pr. år.
173
14 Hvem på din skole var/er involvert i kjøpsprosessen av edb-utstyr til un dervisningen? Sett kryss i de ruter som passer. Inititiativ/ idé kom fra
Disse deltok i analyse/vurdering
Godkjenning/ endelig valg
Iverksettelse
Rektor Lærerne
Øk. ansvarlig (skolen) Øk. ansvarlig (kommunen) Edb-ansvarlig (skolen) Edb-ansvarlig (kommunen)
Foreldre Tillitsvalgte Administrasjonen
Myndigheter Skolesjefen
Elever Andre
15 Ranger betydningen av hver av de følgende egenskaper ved vurdering av kjøp av edb-utstyr for bruk i undervisningen
Bruk følgende skala, sett ring rundt passende alternativ:
Uten betydning Svært viktig 1 ................ 2.................. 3..................4.................. 5
174
Pris
1-2-3-4-5
Brukervennlighet
1-2-3-4-5
Opplæring fra leverandør
1-2-3-4-5
Oppfølging fra leverandør
1-2-3-4-5
Tilleggsytelser/service
1-2-3-4-5
Produktets pålitelighet
1-2-3-4-5
Oppdatering av programvare
1-2-3-4-5
Totalløsningen
1-2-3-4-5
16 Hvilken maskin egner seg best for bruk i undervisning ifølge skolemyn dighetene?
0 Amiga □ IBM 0 Macintosh 0 Tiki ø Andre 0 Vet ikke
17 Hvilken maskin tror du det er lettest å bruke?
0 IBM 0 Machintosh 0 Vet ikke 18 Hvilken maskin tror du har best programtilgang og fremtidsmuligheter?
0 IBM 0 Machintosh 0 Vet ikke 19 Hvilken av disse maskinene tro du er dyrest i innkjøp?
0 IBM 0 Machintosh 0 Vet ikke
Ordforklaringer Aksjonsforskning: Forskningsmessig virksomhet som forutsetter at forskeren avviser kraver om å være objektiv, men tvert om åpent bekjenner at forsk ningen aktivt tar sikte på å endre på forhold / løse praktiske problemer. Ofte basert på aktiv medvirkning av dem forskningen angår, f.eks. ansatte i en bedrift.
Analytiske teorier: Teorier som forutsetter at vi kan beskrive virkeligheten ved systematisk å analysere (beskrive) dens enkelte deler.
Anomali: Ikke-normal begivenhet, dvs. et fenomen som ikke synes å stem me med oppleste og vedtatte ideer om hvordan verden ser ut. Inngår i Tho mas Kuhns beskrivelse av prosessen fram mot et såkalt paradigmeskifte (se paradigme). Antakelse: Se hypotese. Avhengig variabel: Se variabel.
Bivariat sammenheng: Sammenheng mellom to variabler, f.eks. mellom ut danning og yrke, der variabelen utdanning antas å ha betydning for yrkes valg. Yrke er altså langt på vei resultat av utdanning. Case: Et tenkt tilfelle som så realistisk som mulig brukes til å illustrere et problem eller et fenomen. Data: I vår sammenheng, det samme som informasjon. Databehandling: Behandling, oftest analysering av de data eller den infor masjon en undersøkelse har frembrakt. Slik analyse kan enten foretas kvan titativt eller kvalitativt (se kap. 19). Demarkasjonsprinsippet: Prinsipp for grensedragning mellom f.eks. viten skap og kunst.
Eksperiment (eksperimentell metode): Brukes for å studere effekten av en va riabel på én eller flere forsøksobjekter.
176
Empiri: Erfaring, dvs. informasjon som er samlet gjennom å observere og gjøre erfaringer. Grunnlag for de såkalte erfaringsvitenskaper.
Enquete: Annen betegnelse for spørreskjema. Epistemologi: Antakelser om hvordan sann kunnskap kan erverves. Henger sammen med såkalte ontologiske forutstninger (se ontologi).
Falsifiseringskriteriet: Det kriterium som brukes for å kunne fastslå hvorvidt en hypotese er falsk (ikke holdbar) eller ikke. Se kapitlet om kritisk rasjona lisme (kap. 4). Foreliggende data: Se sekundærdata.
Fruktbarhet: Krav (ett blant flere) til en problemstilling. Se problemstilling.
Generalisering: Går på muligheten til på bakgrunn av opplysninger fra fa (et utvalg) å utsi noe om mange (en populasjon eller et univers). Er omtalt un der utvalgsproblematikk. Hermeneutisk metode: Baserer seg på fortolkning/forståelse av fenomener eller situasjoner. Krever i allmennhet bruk av kvalitative undersøkelsesmeto der. Sentrale stikkord er: forforståelse, forståelseshorisont, den hermeneu tiske sirkel. Se ellers kapidene om hermeneutikk (kap. 5) og kvalitative me toder (kap. 18).
Hypotese: Antakelse om virkeligheten som undersøkelsen er ment å skulle bekrefte, eventuelt avkrefte. Hypotetisk-deduktiv metode: En vitenskapelig metode som forutsetter at vi på grunnlag av foreløpige observasjoner utformer en hypotese. Fra hypote sen utleder (deduserer) vi så andre konsekvenser som det er mulig å obser vere. Hvis disse observasjonene stemmer, er vi på vei mot en teori som har støtte i observasjoner.
Ikke-sannsynlighetsutvelging: Det motsatte av sannsynlighetsutvelging, dvs. metoder for utvei geise av et utvalg som ikke gir alle medlemmer i popula sjonen en kjent sannsynlighet for å komme med i utvalget. Se ellers om ut valgsproblematikk i kapittel 16.
177
Induksjon: Det å resonnere seg fram til generell lovmessighet ut fra enkelt observasjoner, i motsetning til deduksjon, der vi resonnerer oss fram til enkeltkonsekvenser fra en generell antakelse (teori). Intersubjektivitet: Det som flere subjekter (personer) kan observere uav hengig av hverandre. Kravet til intersubjektivitet benyttes ofte som ett av de bærende prinsipper for vitenskapelig virksomhet. Intervju: Metode for å innhente verbal informasjon. Intervjumetoden er re lativt grundig omtalt flere steder i boka.
Klassifisering: Henger sammen med dataanalysefasen og dreier seg om ord ning av data (variabler) etter spesielle kjennetegn (f.eks. bosted, kjønn). Klyngeutvalg: Teknikk for trekking av utvalg fra univers. Kontrollgruppe: Omtales under eksperiment.
Korrelasjon: Sammenheng mellom variabler som kan uttrykkes ved retning og styrke. Oftest gjøres dette vha. en såkalt korrelasjonskoeffisient som gir sammenhengen tallmessig mål innenfor grensen +1 og -1. Eksempelvis vil en korrelasjon mellom to variabler uttrykt som r = 0,78, fortelle om en sterk positiv sammenheng mellom disse to variablene (kap. 19).
Kritisk rasjonalisme: En vitenskapsteori som bl.a. fremhever at rasjonell tan kevirksomhet alene ikke kan gi sann kunnskap. Se ellers omtalen av Popper i kap. 4. Kritisk teori: Vitenskapsteoretisk retning som understreker vitenskapens iboende interesser. Avviser at vitenskap kan/skal fungere objektivt. Se verdifrihet/aksjonsforskn ing. Metaproblemer: Problemer som nettopp er knyttet til vitenskapsteoretisk grunnlag for de problemstillinger vi er opptatt av i praktisk forskning. Se epistemologi og ontologi.
Modell: Forenklet bilde av virkeligheten der vi forsøker å skaffe oss oversikt gjennom å utelate mange av de variablene som inngår i en virkelige situa sjon.
178
Eksempel: Høy
Stort
Lav
Lite
Denne modellen forsøker å studere salg som resultat av reklameinnsats. Vir keligheten forenkles, og faren ved modellen er at avstanden til virkeligheten blir for stor. Mulitivariat analyse: Analyse av effekten av flere enn én uavhengig variabel (i motsetning til bivariat analyse, der vi bare opererer med én uavhengig va riabel) (kap. 19).
Ontologi: Dreier seg om vår virkelighetsoppfatning. Et vanlig skille går mel lom det å oppfatte verden som noe faktisk noe utenfor oss selv (realisme), og det å oppfatte veren som en uatskillelig del av enkeltindividets opplevel ser av den (konstruktivisme). Får i neste omgang epistemologiske og metodemessige konsekvenser. Se kapitlet om paradigmer (kap. 5). Paradigme: I vår sammenheng, en allment godtatt oppfatning blant viten skapsfolk av hva som er et fagområdes problemer/begreper, og hva det er akseptert å forske på.
Positivisme: Vitenskapsteoretisk retning som mener at all vitenskap må byg ge på hva som positivt kan observeres. Fenomener som ikke lar seg obser vere, blir av positivister avvist som metafysikk. Positivismekritikk: Kritikk mot positivistenes forsøk på å begrense gyldig vi tenskap til den kunnskap som bygger på positive observasjoner. Problemsituasjon: Henger sammen med problem, og kan enklest forklares som en tilstand der det er avvik mellom forventning og situasjon.
Problemstilling: Utgår fra et problem, dvs. «noe som det bør gjøres noe med». For eksempel kan «høyt sykefravær» være et problem for en bedrift, men for at det skal kunne gjøres noe med dette, må det settes inn i en sam menheng, eksempelvis gjennom å studere det i lys av arbeidsmiljøfaktorer.
179
Reliabilitet: Uttrykk for i hvilken grad vi kan stole på resultatene av under søkelsen, altså om den er nøyaktig nok. Høy reliabilitet er en forutsetning for validitet (kap. 13).
Respondent: Den som f.eks. mottar et spørreskjema. Omtales i intervjubeskrivelsen i kap. 17. Standardavvik: Mål for spredning. Enhetens gjennomsnittlige avstand fra en fordelings gjennomsnitt. Strukturert spørreskjema: Spørreskjema med faste svaralternativer.
Teori: En overgripende antakelse om virkeligheten. Vi benytter gjerne teo rien som grunnlag for å avlede hypoteser. Se omtale i boka.
Uavhengig variabel: se variabel. Utvalgsproblematikk: Alle de problemer som det må tas stilling til og som eventuelt må løses ved utvalgsundersøkelser. Det dreier seg kort om hvem vi skal ha med i utvalget, hvordan vi skal fa fatt i dem, og hvor mange vi skal ha tak i (kap. 16). Validitet: Uttrykk for i hvilken grad undersøkelsen har gitt svar på pro blemstillingen (kap. 13).
Variabel: En målbar egenskap ved et menneske eller noe annet som kan innta to eller flere verdier. Eksempel på en variabel er egenskapen «vekt». Denne kan måles, resultatet kan registreres, og variabelen kan åpenbart inn ta mange verdier (73 kg, 74 kg, 90 kg, 93 kg, osv.). Verdifrihet: Baserer seg på oppfatningen om vitenskapens krav til objektivi tet, at det altså skal gå et skarpt skille mellom vitenskap og vurdering. Ideal fra naturvitenskapene, som er blitt kritisert av blant andre Skjervheim og Habermas. Se kritisk teori og aksjonsforskning.
Åpne spørsmål: Det vil si spørsmål i f.eks. et spørreskjema uten faste svaral ternativer.
180
Litteratur Andersen, H.: «Vitenskapsteori og metodelære», Erhvervsøkonomi, Samfundslitteratur 1990. Arbnor og Bjerke: Foretaksekonomisk metodlåra, Studentlitteratur, 1977. Blalock, H.M.: «The measurement problem», i Blalock og Blalock Methodology in social research, Mc Graw-Hill, 1971. Blumer, H.: Symbolic Interactionism, Prentice-Hall, 1969. Burrel, G. og G. Morgan: Sociological Paradigms and Organizational Analysis: Elements of the Sociology of Corporate Life, Heineman, 1979. Christiansen, P. og Vold, H.: Kampen om universet, Pax, 1969. Churchill, G.A. jr.: Marketing Research, 1991. Dale, B., M. Jones og W. Martinussen: Metodepd tvers, Tapir, 1984. Eikeland, O. og Dons Finsrud: Forskning og handling. Søkelys på aksjons forskningen, Arbeidsforskningsinstituttet, 1995. Elster, J.: Forklaring og dialektikk, UniPax, 1979. Elster, J.: Vitenskap og politikk, Universitetsforlaget, 1989. Evensmo: Kvantitative metoder. Analyse og simulering av økonomiskadministrative modeller, TANO, 1991. FAFOs Prosjektoversikt, 1995. FAFOs Årsrapport, 1994:8. Galtung, J.: Theory and methodes of social research, Universitetsforlaget, 1969. Glaser B.G. og A.L. Strauss: The Discovery of Grounded Theory: Strategies for Qualitative Research, Weidenfeld and Nicolson, 1970. Gustavsen og Sørensen: «Aksjonsforsking», i O. Eikeland og Dons Finsrud: Forskning og handling. Søkelys på aksjonsforskningen, Arbeids forskningsinstituttet, 1995. Halvorsen, K.: A forske på samfunnet, 1993. Hellevik, O.: Forskningsmetode for sosiologi og statsvitenskap. Universitets forlaget, 1993. Hernes, G. og W. Martinussen: Demokrati og politiske ressurser. Forbrukerog administrasjonsdepartementet, 1980. Hildebrand, S.: Om å studere bedriftsøkonomi i foranderlige omgivelser, i Hennestad, B. og F. Wenstøp (red.), Bedriftsøkonomi og vitenskap - utvalgte tekster, Universitetsforlaget, 1983. Hofstede, G.: Cultures Concequenses, Sage Publications, 1980.
181
Holme, I.M. og B.K. Solvang: Metodevalg og/ metodebruk, Tano, 1995. Høivik, T: Mål og metode. Universitetsforlaget, 1974. Ilstad, S., T. Paasche og J. Hovden: Surveymetoden, Tapir, 1981. Kalleberg, R.: Konstruktiv samfunnsvitenskap, ISO-rapport nr. 24, 1992. Kanter, Rosabeth Moss: «Why bosses turn bitchy», Psychology Today, May 1976. Krokan, A.: Forstå statistikk. Statistiske metoder for samfunnsfag og humaniora, Kolle Forlag, 1995. Lekvall og Wahlbin: Information for marknadsforingsbeslut, IHM Låromedel, 1987. Næss, A. og J. Galtung: Innføring i logikk og metodelære, Universitets forlaget, 1960. Phillips: Knowledge from what? Theories and Methods in Social Research, Rand McNally, 1971. Repstad, P.: Mellom nærhet og distanse, Universitetsforlaget 1993. Riley: Sociological Research. A case approach, Harcourt, Brace & World, 1963. Roos, J. og G. von Krogh: Organizational Ephistemology, St. Martins Press, 1994. Rossvær, T.: Organisasjonsteori i sosiologisk belysning, TANO, 1987. Runkel, P.J. og McGrath, J.E.: Research on human behaviour: A systematic guide to method. Holt, Rinehart, and Winston, 1972. Seines, F.: Markedsundersøkelser, TANO, 1973. Skjervheim: «Sosiologien som vitenskap: positiv eller kritisk disiplin?» i R. Slagstad Positivisme, dialektikk, materialisme, Universitetsforlaget, 1976. Slagstad, R.: Positivisme, dialektikk, materialisme, Universitetsforlaget, 1976. Sudman, S. og N.M. Bradburn: Improving Interview Method and Questionaire Design, Joey Bass, 1979. Sørensen: «Arbeidskvinner og verdighet», i O. Eikeland og Dons Finsrud Forskning og handling. Søkelys på aksjonsforskning. Arbeidsforsknings instituttet, 1995. Ugelvik-Larsen: Problemer i samfunnsvitenskapelig metode, Universitetsfor laget, 1976. Wenstøp, F.: Statistikk og dataanalyse, TANO, 1991. Wiedersheim-Paul, F. og L.T. Eriksson: Att utreda, forska och rapportera, Liber, 1991. Wormnæs, O.: Vitenskapsfilosofi, Gyldendal, 1987. Waaler, T.: «Jagland og homøopatiens plass i Helse-Norge.» Kronikk i Aftenposten, 05.01.1997. 182
Zaltman: Metatheory and Consumer Research. Holt, Reinehart and Winston, 1973. Zetterberg: Om teori belegg i sosiologien, Argos, 1967.