Ist keine Antwort auch eine Antwort?: Die Teilnahme an politischen Umfragen 3531178296, 9783531178295 [PDF]

170 50 1MB

German Pages 360 Year 2011

Report DMCA / Copyright

DOWNLOAD PDF FILE

Ist keine Antwort auch eine Antwort?: Die Teilnahme an politischen Umfragen
3531178296, 9783531178295 [PDF]

Author / Uploaded
Hanna Proner

0 0 0
Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden

Datei wird geladen, bitte warten...

Zitiervorschau

Hanna Proner Ist keine Antwort auch eine Antwort?

Hanna Proner

Ist keine Antwort auch eine Antwort? Die Teilnahme an politischen Umfragen

Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.

Die vorliegende Arbeit wurde vom Fachbereich 02 – Sozialwissenschaften, Medien und Sport der Johannes Gutenberg-Universität Mainz im Jahr 2010 als Dissertation zur Erlangung des akademischen Grades eines Doktors der Philosophie (Dr. phil.) angenommen.

1. Auflage 2011 Alle Rechte vorbehalten © VS Verlag für Sozialwissenschaften | Springer Fachmedien Wiesbaden GmbH 2011 Lektorat: Frank Schindler / Verena Metzger VS Verlag für Sozialwissenschaften ist eine Marke von Springer Fachmedien. Springer Fachmedien ist Teil der Fachverlagsgruppe Springer Science+Business Media. www.vs-verlag.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung: KünkelLopka Medienentwicklung, Heidelberg Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Printed in Germany ISBN 978-3-531-17829-5

Inhaltsverzeichnis

Inhaltsverzeichnis........................................................................ 5 Tabellen- und Abbildungsverzeichnis ....................................... 9 Tabellen ............................................................................................................... 9 Abbildungen ...................................................................................................... 10

Vorwort ...................................................................................... 13 I Theoretischer Teil 1 Einleitung ................................................................................ 17 1.1 Umfragen und ihre Rolle im politischen System ....................................... 18 1.1.1 Funktionen von Umfragen.................................................................. 18 1.1.2 Die Qualität von Umfragen ................................................................ 21 1.2 Der Umgang mit Nonresponse in der empirischen Forschung .................. 24 1.3 Erkenntnisinteresse und zentrale Fragestellung ......................................... 27 1.4 Vorgehensweise ......................................................................................... 30

2 Nonresponse als Untersuchungsgegenstand ........................ 33 2.1 Definition ................................................................................................... 33 2.1.1 Die Unterscheidung von Item- und Unit-Nonresponse ...................... 33 2.1.2 Typologisierung von Unit-Nonresponse ............................................ 35 2.1.3 Systematische und unsystematische Ausfälle .................................... 36 2.1.4 Nicht-Erreichte, Nicht-Befragbare, Verweigerer ............................... 37 2.2 Die empirische Analyse von Nonrespondenten ......................................... 40 2.2.1 Das Paradoxon der Befragung von Verweigerern .............................. 40 2.2.2 Nonresponse im ALLBUS ................................................................. 41

6

Inhaltsverzeichnis

3 Der Forschungsstand: Von theoretischem Vakuum zu komplexen Analysen ............................................................. 44 3.1 Problemwahrnehmung und bivariate Einzelerkenntnisse .......................... 44 3.1.1 Erste Schritte der Nonresponse-Forschung ........................................ 44 3.1.2 Das Ausmaß von Nonresponse und die Diskussion um Ausschöpfungen ................................................................................. 47 3.1.3 Der Weg zu inhaltlichen Modellen..................................................... 50 3.2 Komplexe Modellierungen zur Erklärung von Kooperation...................... 52 3.2.1 Ein allgemeines Konzept der Kooperation bei Umfragen .................. 53 3.2.1.1 Gesellschaftliche Faktoren ............................................................ 54 3.2.1.2 Design- und Interviewerfaktoren .................................................. 58 3.2.1.3 Die Interaktion zwischen Interviewer und Zielperson .................. 61 3.2.1.4 Leverage-Salience-Theorie ........................................................... 65 3.2.2 Erklärungsmodelle auf der Ebene der Zielperson .............................. 67 3.2.2.1 Die Erklärung bei Groves/Couper auf der Individualebene .......... 68 3.2.2.2 Das Vier-Ebenen-Modell von Brehm............................................ 74 3.2.2.3 „Social involvement” und „Attachment to society” bei Voogt ..... 77 3.2.2.4 Die handlungstheoretische Fundierung des Teilnahmeverhaltens bei Schnell .................................................. 79 3.3 Zwischenfazit ............................................................................................. 81

4 Die Teilnahme an politischen Umfragen: Ein handlungstheoretisch fundiertes Erklärungsmodell und seine Konsequenzen ........................................................................ 84 4.1 Handlungstheoretische Fundierung ............................................................ 84 4.1.1 Methodologischer Individualismus und Wert-Erwartungstheorie ..... 84 4.1.2 Menschenbild und Rationalitätsbegriff .............................................. 86 4.2 Duales Prozessieren ................................................................................... 88 4.2.1 Der Einstellungsbegriff ...................................................................... 88 4.2.2 Heuristisches und reflektiert-rationales Entscheiden ......................... 90 4.2.3 Die Wahl des Entscheidungsmodus ................................................... 93 4.2.4 Die Teilnahme an Umfragen im Kontinuum zwischen Heuristiken und bewussten Kosten-Nutzen-Abwägungen..................................... 94 4.3 Die Theorie geplanten Verhaltens und die Kompatibilität zu den bisherigen Annahmen ................................................................................ 96 4.3.1 Die Theorie geplanten Verhaltens ...................................................... 96 4.3.2 Die Kompatibilität der Theorie geplanten Verhaltens und der SEUTheorie ............................................................................................. 100 4.4 Zwischenfazit ........................................................................................... 103

Inhaltsverzeichnis

7

4.5 Die Modellierung ..................................................................................... 107 4.5.1 Determinanten von Verweigerungen in politischen Umfragen ........ 108 4.5.1.1 Objektive und subjektive Kontrollmöglichkeiten als Determinanten der Teilnahmeentscheidung ................................ 109 4.5.1.2 Einstellungen zur Handlung als Determinanten der Teilnahmeentscheidung ............................................................... 114 4.5.1.3 Normative Orientierungen als Determinanten der Teilnahmeentscheidung ............................................................... 119 4.5.2 Kooperation und Verweigerung bei politischen Umfragen .............. 121 4.6 Zusammenfassung und Integration des Common Cause-Modells ........... 124 4.6.1 Zusammenfassung ............................................................................ 124 4.6.2 Das Common Cause-Modell ............................................................ 125 4.7 Hypothesenübersicht ................................................................................ 131

II Empirischer Teil 5 Das Design der Studie .......................................................... 139 5.1 Rahmenbedingungen: Stichprobenziehung und Feldzeit ......................... 143 5.1.1 Stichprobenziehung .......................................................................... 143 5.1.2 Feldzeit ............................................................................................. 147 5.2 Ausschöpfungssteigernde Maßnahmen .................................................... 149 5.2.1 Kontaktmodalitäten .......................................................................... 149 5.2.2 Der Einsatz von Incentives ............................................................... 152 5.2.3 Interviewereinsatz ............................................................................ 157 5.2.4 Aufwand / Länge der Befragung ...................................................... 157 5.2.5 Die Salienz des Themas der Befragung............................................ 159 5.2.6 Die Nennung des Sponsors der Befragung ....................................... 160 5.3 Zwischenfazit: Das Design des ALLBUS+ ............................................. 161 5.4 Anmerkungen zur Analyse ....................................................................... 163 5.4.1 Analysestrategien ............................................................................. 163 5.4.2 Umgang mit fehlenden Werten ........................................................ 165

6 Operationalisierung ............................................................. 167 6.1 Die Indikatoren zur Messung der objektiven Kontrollmöglichkeiten ...... 168 6.2 Die Indikatoren zur Messung der subjektiv wahrgenommenen Verhaltenskontrolle .................................................................................. 170 6.3 Die Indikatoren zur Messung der Einstellung gegenüber der Teilnahme an einer politischen Befragung .............................................. 171

8

Inhaltsverzeichnis 6.4 Die Indikatoren zur Messung der subjektiven Norm ............................... 177 6.5 Die Messung des politischen Partizipationsniveaus................................. 179

7 Empirische Analyse ............................................................. 185 7.1 Die Ausschöpfung in beiden Studien ....................................................... 187 7.2 Bivariate Unterschiede zwischen ALLBUS und ALLBUS+ ................... 194 7.2.1 Überblick: Analyse über alle Merkmale........................................... 194 7.2.2 Inhaltliche Analyse der Unterschiede ............................................... 196 7.2.2.1 Objektive Kontrollmöglichkeiten ................................................ 197 7.2.2.2 Subjektive Kontrollmöglichkeiten .............................................. 201 7.2.2.3 Die Einstellung gegenüber der Teilnahme an einer politischen Befragung .................................................................................... 203 7.2.2.4 Die subjektive Norm ................................................................... 209 7.2.2.5 Politische Partizipation ................................................................ 212 7.2.3 Zwischenfazit zum bivariaten Vergleich von ALLBUS und ALLBUS+ ........................................................................................ 215 7.3 Multivariate Analyse: ALLBUS und ALLBUS+ im Vergleich............... 219 7.4 Der Vergleich von Kooperativen und Verweigerern im ALLBUS+ ....... 226 7.4.1 Überblick: Analyse über alle Merkmale........................................... 229 7.4.2 Inhaltliche Analyse der Unterschiede ............................................... 231 7.4.2.1 Objektive Kontrollmöglichkeiten ................................................ 231 7.4.2.2 Subjektive Kontrollmöglichkeiten .............................................. 234 7.4.2.3 Die Einstellung gegenüber der Teilnahme an einer politischen Befragung .................................................................................... 236 7.4.2.4 Die subjektive Norm ................................................................... 243 7.4.2.5 Politische Partizipation der Verweigerer ..................................... 246 7.4.3 Zwischenfazit zum bivariaten Vergleich von Kooperativen und Verweigerern .................................................................................... 252 7.5 Multivariate Analyse: Kooperation und Verweigerung des Interviews ... 254 7.6 Die Nachfassaktionen: Annäherung an den harten Kern?........................ 267 7.6.1 Die telefonische Nachbefragung ...................................................... 270 7.6.2 Die schriftliche Nachbefragung ........................................................ 273 7.7 Zwischenfazit: Die empirischen Ergebnisse ............................................ 275

8 Schlussbemerkung und Forschungsausblick .................... 282 Literatur .................................................................................. 291 Anhang .................................................................................... 321

Tabellen- und Abbildungsverzeichnis

Tabellen Tabelle 1: Die Indikatoren zur Messung der objektiven Kontrollmöglichkeiten....................................................................... 170 Tabelle 2: Die Indikatoren zur Messung der subjektiven Kontrollmöglichkeiten....................................................................... 171 Tabelle 3: Die Indikatoren zur Messung der Einstellung gegenüber dem Verhalten ........................................................................................... 176 Tabelle 4: Die Indikatoren zur Messung der subjektiven Norm......................... 179 Tabelle 5: Hauptkomponentenanalyse zur Intention Politischer Partizipation ... 183 Tabelle 6: Die Ausschöpfung nach einzelnen Nonresponse-Typen ................... 192 Tabelle 7: Signifikante Verteilungsunterschiede in ALLBUS und ALLBUS+ . 196 Tabelle 8: Soziale Integration in ALLBUS und ALLBUS+ .............................. 198 Tabelle 9: Soziale Integration in ALLBUS und ALLBUS+, Haupt-/ Nachbearbeitung ................................................................................ 200 Tabelle 10: Items zur Messung der internen Efficacy in ALLBUS und ALLBUS+ ......................................................................................... 202 Tabelle 11: Politisches Interesse in ALLBUS und ALLBUS+ ............................ 205 Tabelle 12: Institutionenvertrauen (metrisch) bei ALLBUS und ALLBUS+ im Vergleich ...................................................................................... 206 Tabelle 13: Institutionenvertrauen (ordinal) in ALLBUS und ALLBUS+ .......... 208 Tabelle 14: Wahlnorm in ALLBUS und ALLBUS+............................................ 222 Tabelle 15: Die berichtete Wahlbeteiligung bei der Bundestagswahl 2005 in ALLBUS und ALLBUS+ .................................................................. 212 Tabelle 16: Die Verteilung der Wahlabsicht in ALLBUS und ALLBUS+ .......... 213 Tabelle 17: Logistische Regressionsmodelle zum Einfluss der Merkmale aus den Bereichen der objektiven und wahrgenommenen Kontrolle, Einstellung gegenüber der Teilnahme und subjektiver Norm auf die Unterscheidung von ALLBUS und ALLBUS+ .......... 222 Tabelle 18: Logistische Regressionsmodelle zum Einfluss der Merkmale auf die Unterscheidung von ALLBUS und ALLBUS+: Politische Partizipation und Gesamtmodelle...................................................... 223 Tabelle 19: Verteilungsunterschiede zwischen Kooperativen und Verweigerern im ALLBUS+ ............................................................. 230

10

Tabellen und Abbildungsverzeichnis

Tabelle 20: Soziale Integration bei Kooperativen und Verweigerern im ALLBUS+ ......................................................................................... 233 Tabelle 21: Subjektives politisches Wissen bei Kooperativen und Verweigerern im ALLBUS+ ............................................................. 235 Tabelle 22: Recht auf freie Meinungsäußerung als wichtigstes Politikziel im ALLBUS+ ......................................................................................... 237 Tabelle 23: Politisches Interesse bei Kooperativen und Verweigerern im ALLBUS+ ......................................................................................... 238 Tabelle 24: Institutionenvertrauen bei Kooperativen und Verweigerern im ALLBUS+ ......................................................................................... 240 Tabelle 25: Vertrauen in Mitmenschen bei Kooperativen und Verweigerern im ALLBUS+ .................................................................................... 242 Tabelle 26: Wahlnorm bei Kooperativen und Verweigerern im ALLBUS+ ....... 244 Tabelle 27: Anomie bei Kooperativen und Verweigerern im ALLBUS+ ............ 245 Tabelle 28: Berichtete Wahlbeteiligung bei der Bundestagswahl 2005 bei Kooperativen und Verweigerern im ALLBUS+ ............................... 247 Tabelle 29: Die Verteilung der Sonntagsfrage bei Kooperativen und Verweigerern im ALLBUS+ ............................................................. 248 Tabelle 30: Einstellung gegenüber verschiedenen Formen politischer Partizipation bei Kooperativen und Verweigerern im ALLBUS+ .... 251 Tabelle 31: Logistische Regressionsmodelle zum Einfluss der Merkmale aus den Bereichen der objektiven und wahrgenommenen Verhaltenskontrolle, der Einstellung ggü. der Teilnahme und der subjektiven Norm auf die Teilnahmeverweigerung in der Hauptbearbeitung im ALLBUS+ ...................................................... 256 Tabelle 32: Survey Variable Cause-Modell zur Erklärung der Teilnahmeverweigerung in der Hauptbearbeitung des ALLBUS+ ... 259 Tabelle 33: Erweiterte logistische Regressionsmodelle ....................................... 262 Tabelle 34: Politisches Interesse im telefonischen Nachfass ............................... 271 Tabelle 35: Rechtsextreme Einstellungen im telefonischen Nachfass ................. 272 Tabelle 36: Wahlabsicht und Sonntagsfrage im schriftlichen Nachfass .............. 274 Tabelle 37: Ergebnisse der Hypothesenprüfung ................................................... 276

Abbildungen Abbildung 1: Forschungsfragen ........................................................................... 28 Abbildung 2: Modelle zur Erklärung von Unterschieden zwischen Teilnehmern und Nicht-Teilnehmern ............................................. 29 Abbildung 3: Nonresponse als mehrstufiger Prozess ........................................... 37 Abbildung 4: Das Ausmaß von Nonresponse im ALLBUS von 1992 bis 2006 .. 39 Abbildung 5: Der Nonresponse-Fehler ................................................................ 46

Tabellen und Abbildungsverzeichnis Abbildung 6: Abbildung 7: Abbildung 8: Abbildung 9: Abbildung 10: Abbildung 11: Abbildung 12: Abbildung 13: Abbildung 14: Abbildung 15: Abbildung 16:

11

Die Grundidee der Leverage-Salience-Theorie .............................. 66 Die Lücke in den theoretischen Annahmen von Groves/Couper ... 70 Die Theorie geplanten Verhaltens .................................................. 97 Das Erklärungsmodell auf der Ebene des Individuums ............... 123 Das Common Cause-Modell ........................................................ 125 Die Integration des Common Cause-Modells .............................. 126 Das Design von ALLBUS und ALLBUS+ im Überblick ............ 162 Analysestrategien ......................................................................... 165 Das modifizierte Gesamtmodell ................................................... 184 Ausschöpfung der Studie auf den einzelnen Erhebungsstufen..... 189 Der Einfluss der Anomie auf die Verweigerungswahrscheinlichkeit (Punktschätzung) ........................................... 261

Vorwort

Die vorliegende Arbeit wurde von mir im Mai 2010 als Dissertationsschrift eingereicht und schließt damit ein spannendes, intensives, oft auch sehr herausforderndes, dennoch lieb gewonnenes und letztlich erfolgreiches Kapitel meines Lebens ab. Am Anfang stand eine fixe Idee. Nach der Bundestagswahl im Jahr 2005, als viele Wahlprognosen den Wahlausgang nur wenig präzise vorhersagten, stand die ganz praktische Frage: Woher kommen diese Verzerrungen? Verschiedene Erklärungen sind plausibel: Sowohl unentschlossene Wähler als auch Nicht-Wähler oder auch diejenigen, die kurz vor der Wahl ihre Meinung noch einmal ändern, können dazu beitragen, dass die Prognosen vor einer Wahl daneben liegen. Neben den genannten Aspekten haben Umfragen aber auch immer stärker mit einem anderen gravierenden Problem zu kämpfen, nämlich der Teilnahmeverweigerung einzelner Zielpersonen. Viele Bürger nehmen nicht mehr an Umfragen teil. Wenn sich diese systematisch von den Teilnehmern unterscheiden, sind die Ergebnisse der Umfragen verzerrt. Dieses Problem betrifft dabei aber nicht nur Wahlprognosen (bei denen man ja am Wahltag sieht, ob sie daneben lagen), sondern auch alle anderen empirischen politikwissenschaftlichen Umfragestudien, die auf die Kooperationsbereitschaft der Zielpersonen angewiesen sind, um ein möglichst vollständiges Bild der Bevölkerung zu zeichnen. Damit war die Fragestellung gegeben: Wer sind diejenigen, die eine Teilnahme an Umfragen verweigern? Unterscheiden sie sich von den Teilnehmern? Und wenn ja, wie? Auf diese Weise ergab sich ein ambitioniertes - manche nannten es auch paradoxes - Projekt: Die Befragung von Personen, die sich (unter Normalbedingungen) nicht befragen lassen. Viele Menschen haben mich dabei unterstützt und so wesentlich dazu beigetragen, dass dieses Promotionsprojekt nun zu einem Abschluss gekommen ist. Ihnen möchte ich an dieser Stelle ganz ausdrücklich danken. Zuerst ist dabei mein Doktorvater Professor Dr. Jürgen W. Falter zu nennen. Er hat mich mit einem Vortrag im Oktober 2005 überhaupt erst auf die Idee gebracht, mich mit den Nichtteilnehmern an Umfragen zu beschäftigen. Während der gesamten Arbeit hat er mich zudem als Mentor begleitet. Hervorzuheben ist, dass er mir neben wichtigen Impulsen gleichzeitig alle Freiräume bot, die man sich für die eigenständige wissenschaftliche Arbeit nur wünschen kann. Er beschäftigte mich als wissenschaftliche Mitarbeiterin und ermöglichte es, die gemeinsamen Ideen mithilfe eines großen DFG-Projekts auch tatsächlich in die Praxis umzusetzen. An dieser Stelle geht der Dank damit auch an die DFG, die dieses Projekt finanziell unterstützt und getragen

14

Vorwort

hat. Daneben existierten weitere Kooperationen, von denen ich profitieren konnte. Hierbei sind insbesondere Michael Blohm und Achim Koch von GESIS in Mannheim zu nennen, die für den ALLBUS das DFG-Projekt mit umgesetzt haben sowie Herr Schneekloth und Herr Leven von Infratest München. Sie haben das Projekt auch zu ihrem Projekt gemacht und boten mir die Gelegenheit, in zahlreichen Treffen und Telefonaten verschiedene Aspekte der Studie durchaus kritisch zu diskutieren und von ihrem enormen Sachverstand zu profitieren. Zugleich ist auch Richard Hilmer von Infratest dimap zu nennen, der es ermöglichte, die Ergebnisse der Studie früh in Berlin vorzustellen und damit ein direktes Feedback und hilfreiche Anmerkungen aus der Praxis zu erhalten. Große Unterstützung hatte ich auch in zwei meiner Kollegen, die ich besonders hervorheben möchte: Prof. Dr. Harald Schoen hat mir in jeder Situation quer über den Flur mit hilfreichen, pragmatischen, immer konstruktiven und punktgenauen Ratschlägen zur Seite gestanden und geholfen, so manches Problem zu meistern. Und auch Dr. Cornelia Frings hat besonders am Ende der Arbeit mit präzisen und wertvollen Vorschlägen und Anmerkungen dazu beigetragen, dass sich der Wald lichtete, den man vor lauter Bäumen nicht mehr zu sehen vermochte. Darüber hinaus haben mir weitere Personen mit Anregungen, Korrektur- und Formatierungshilfe zur Seite gestanden. Stellvertretend für all diejenigen möchte ich insbesondere Daniel Weber, Marlene Mauk, Sarah Kirschmann, Janina Fortmann und Marco Pecht nennen. Der größte Dank gilt jedoch meiner Familie. Meinen Eltern, die mit ihrem Glauben an mich jederzeit hinter mir stehen, meinem Bruder und meiner guten Freundin Nele Schüller. Sie alle haben mir auch immer wieder gezeigt, dass es anderes gibt, als nur die Wissenschaft. Ganz besonders danke ich meinem Mann Patrick. Ohne ihn gäbe es diese Arbeit sicher nicht. Er hat mich und diese Arbeit durch alle Höhen und Tiefen der letzten Jahre begleitet und sich immer wieder mit mir und meinen Ideen auseinander gesetzt. Sein anhaltendes Interesse, sein Antrieb, seine Kreativität und seine klugen Kommentare waren mir die wertvollsten Anregungen. Selten habe ich soviel über mich selbst gelernt, wie in der Zeit der Promotion. Jetzt freue ich mich auf alles, was an neuen Projekten kommen wird.

Mainz, im September 2010

I Theoretischer Teil

1 Einleitung „Keine Antwort ist auch eine Antwort!“ - Sprichwort -

Umfragen beeinflussen unsere Vorstellung von der Welt. In vielen Bereichen, wenn man beispielsweise etwas über das Denken der Bevölkerung erfahren möchte, sind sie eine der wenigen Möglichkeiten, Einstellungen, Werte und Normen überhaupt messbar zu machen. Umfragen können jedoch nur dann ein realistisches Abbild liefern, wenn sie gewissen Qualitätskriterien unterliegen und systematische Verzerrungen vermieden werden. Mit diesem Problem systematischer Verzerrungen bei Umfragen beschäftigt sich diese Arbeit und fokussiert dabei eine ganz bestimmte potenzielle Fehlerquelle: Diejenigen Personen, die eine Teilnahme an Umfragen bewusst verweigern. Es soll dabei verschiedenen Fragen nachgegangen werden: Wer sind diejenigen, die eine Teilnahme verweigern? Unterscheiden sie sich von den Kooperativen und können sie damit zu systematischen Verzerrungen führen? Jeder, der schon einmal mit Umfragen gearbeitet hat, gerade im Bereich der politikwissenschaftlichen Wahl- und Einstellungsforschung, kennt Indizien, die für derartige systematische Ausfälle sprechen. In der Regel fehlen in den Befragungen gerade die „interessanten Fälle“, z.B. Nichtwähler, Extremwähler, Menschen mit extremistischem Gedankengut oder auch Uninteressierte. Dennoch treten genau diese Fälle an manch anderen Stellen auf der politischen Bühne auf, beispielsweise bei Wahlen. Wie kommt es dazu? Sind Teilnahmeverweigerungen eine Ursache dafür, dass es einen Unterschied zwischen der Realität und der Wahrnehmung der Realität gibt? Warum verweigern Menschen die Teilnahme an derartigen Befragungen? Und welche Konsequenzen hätten diese systematischen Ausfälle? Führt das verzerrte Bild, das uns die Umfragen liefern, dazu, dass Krisenindikatoren eventuell nicht erkannt werden und man die Stabilität des politischen Systems überschätzt? Werden in Anbetracht der Umfragen Policy-Entscheidungen gefällt, die an den tatsächlichen Bedürfnissen der Bevölkerung vorbeizielen? Dieser Fragen nimmt sich die vorliegende Arbeit an. Dazu wird nun in der Einleitung die zentrale Funktion von Umfragen in repräsentativen Demokratien herausgearbeitet. Es wird gezeigt, dass Präzision eine der Voraussetzungen ist, damit Umfragen ihre Funktionen auch tatsächlich erfüllen können und wie Nonrespondenten diese Präzision von Umfragen beeinträchtigen können. Im Anschluss wird diskutiert, wie mit dem Problem der Nonrespondenten in der Forschung umgegangen wird. Daraus lässt sich schließlich das Erkenntnisinteresse ableiten, welches wiederum das weitere Vorgehen der Arbeit determiniert.

H. Proner, Ist keine Antwort auch eine Antwort?, DOI 10.1007/978-3-531-92721-3_1, © VS Verlag für Sozialwissenschaften | Springer Fachmedien Wiesbaden GmbH 2011

18

1 Einleitung

1.1 Umfragen und ihre Rolle im politischen System 1.1.1 Funktionen von Umfragen Umfragen haben sowohl für die empirische Politikforschung als auch aus demokratietheoretischer Perspektive für das politische System eine große Bedeutung. Zunächst sind sie für die empirische Politikforschung eine der wichtigsten Formen der Datenerhebung und wurden bereits in den 1960er Jahren als der „Königsweg der praktischen Sozialforschung“ (König 1969: 27) beschrieben. Sie ermöglichen es, Informationen über politische Einstellungen und politisches Verhalten der Bevölkerung zu erheben (vgl. Diekmann 1995: 371; siehe auch Atteslander/Kneubühler 1975; Bortz/Döring 2002: 237; Groves et al. 2004; Schnell 1997: 11).1 Nur mithilfe von Befragungen können bestimmte politikwissenschaftliche Konstrukte – bspw. Einstellungen, die nicht direkt beobachtbar sind – überhaupt erhoben werden. Auf diese Weise können auf der Individualebene Aussagen über Zusammenhänge zwischen verschiedenen Merkmalen getroffen werden. Dies ist eine Vorausetzung, um bestimmte politikwissenschaftliche Phänomene zu erklären und auf dieser Grundlage Prognosen aufstellen zu können. Umfragen erfüllen aber nicht nur für die politikwissenschaftliche Forschung, sondern auch im politischen System wichtige Funktionen. Sie ermöglichen einerseits der politischen Elite2, sich über die Bürger zu informieren (vgl. Kaase 1999: 4).3 Andererseits bieten sie den Bürgern die Möglichkeit, ihre Interessen zu artikulieren, die damit eine Chance haben, in den politischen Prozess integriert zu werden (vgl. Schuh 2009: 29ff.; Shaiko et al. 1991: 86). Insgesamt haben sie damit eine Feedback-Funktion, die maßgeblich zur Systemstabilität beitragen kann. Ein kurzer systemtheoretischer Exkurs soll dies verdeutlichen: In einem politischen System werden für alle Mitglieder der Gesellschaft verbindliche Entscheidungen getroffen (vgl. z.B. Easton 1953: 96ff.; 1965b: 57). In der Bundesrepublik Deutschland, die als repräsentative Demokratie ausgestaltet ist, werden dabei die meisten Sachfragen nicht durch das gesamte Volk, sondern durch gewählte Abgeordnete entschieden. Wenn derartige repräsentative Demokratien einerseits wandelbar und an aktuelle Herausforderungen angepasst, andererseits aber auch in sich stabil und wenig krisenanfällig bleiben wollen, dürfen sich die Eliten auch zwischen den Wahlen nicht zu sehr von den Interessen der Bürger ent1 So zeigt eine Inhaltsanalyse von vier für die empirische Politikwissenschaft relevanten deutschsprachigen Fachzeitschriften (Politische Vierteljahresschrift, Zeitschrift für Parlamentsfragen, Kölner Zeitschrift für Soziologie und Sozialpsychologie und die Zeitschrift für Soziologie), dass im Zeitraum von 2003 bis 2007 von 221 Beiträgen, die quantitative Daten aus einer Befragung, einer Inhaltsanalyse oder einer Beobachtung analysierten, 80,5% der Beiträge (n=178) auf Befragungsdaten, 15,8% auf Daten aus Inhaltsanalysen und nur 3,7% auf Beobachtungsdaten basierten. 2 Zum Begriff der politischen Elite siehe Herzog/Bürklin 2003: 509ff. 3 Schon in den 50er Jahren konstatiert (obgleich mit einer negativen Konnotation) Hennis: „Solange es politische Herrschaft gibt, haben die Herrschenden ein Interesse daran gehabt, zu wissen, was in den Köpfen ihrer Untertanen vorgeht“ (Hennis 1957: 16).

1.1 Umfragen und ihre Rolle im politischen System

19

fernen.4 Daher ist es wichtig, dass sich die Entscheidungen der Eliten durch Responsivität auszeichnen. Unter „responsiv“ ist in Anlehnung an Pennock „reflecting and giving expression to the will of the people“ (Pennock 1952: 790) zu verstehen, oder- anders formuliert- die weitgehende Übereinstimmung des Abstimmungsverhaltens der Repräsentanten mit den Einstellungen und Interessen der Wähler (vgl. Miller/Stokes 1963: 45ff.). Dabei wird angenommen, dass dem System, den Parteien oder auch den Politikern die Unterstützung des Volkes nur dann auf Dauer erhalten bleibt, wenn weitestgehend akzeptierte Entscheidungen getroffen werden. Fehlende Responsivität kann zu einem Graben zwischen politischer Elite und Bürgern führen, was zunächst direkte Folgen für den einzelnen Abgeordneten hat, etwa weil er nicht wiedergewählt wird. Aus der Makroperspektive betrachtet kann fehlende Responsivität aber auch weitreichende Folgen für die Systemstabilität haben (vgl. Easton 1965b: 381f.; Gabriel 2000; Miller/Stokes 1963; Putnam 1993; Völkl 2005: 249ff.).5 Aus diesem Grund gibt es sowohl für die einzelnen Politiker als auch für das System als Ganzes ein großes Informationsbedürfnis. Aus Sicht der Politiker lässt sich folglich konstatieren: Wer eine Wiederwahl anstrebt, sollte sich nicht zu weit von den Wählerpräferenzen entfernen. Aus diesem Grund ist die politische Elite auf Informationen über eben diese Präferenzen, Einstellungen, Interessen und Forderungen der Bevölkerung angewiesen. Nur wenn die Bürger die Entscheidungen der Regierung wahrnehmen, sie bewerten und über das Ergebnis der Bewertung wieder mit den politischen Eliten kommunizieren, sind responsive Entscheidungen möglich (vgl. Schlozman 2002: 437f.). Nun kommt die Umfrage als Instrument ins Spiel: Die Ergebnisse aus Umfragen sind ein wichtiger, vielleicht sogar der wichtigste und verlässlichste Feedback-Kanal, um Reaktionen und Bewertungen der Gesellschaft an die Eliten weiterzuleiten (vgl. 4 Easton (1965a: 77ff.) bezeichnete die Stabilität von demokratischen Systemen als „Persistenz“. In der neueren politischen Kulturforschung ist neben der Persistenz auch die Leistungsfähigkeit (=Performanz) der Demokratien als Kriterium für deren Überlebensfähigkeit hinzugekommen (vgl. etwa Putnam 1993; auch Gabriel 2000, 2007). 5 In Eastons (1957: 384, 1965b: 364ff.) populärer, vereinfachter, modellhafter Vorstellung des politischen Prozesses wird die Responsivität des Systems über eine Feedbackschleife innerhalb des Modells ermöglicht: (Konkrete) politische Forderungen sowie die politische Unterstützung der Gemeinschaft, des Regimes und der Autoritäten gehen in das politische System ein, werden gefiltert, verdichtet, zusammengeführt, bearbeitet und in kollektiv verbindliche Policy-Entscheidungen (also Outputs) umgewandelt. Dabei versuchen die Autoritäten solche Outputs zu produzieren, die zu einer Zunahme der Unterstützung führen. Die Verbindung von den Outputs zurück zu den Inputs wird im Modell als „Feedback“ bezeichnet. Policy-Entscheidungen beeinflussen demnach wieder die Forderungen und die Systemunterstützung der Bürger, je nachdem wie die Bürger die Entscheidungen bewerten. Das Feedback ermöglicht für die politische Elite einen Lerneffekt, da sie eine Rückmeldung über die Reaktionen der Bürger erhält. Die Feedback-Schleife funktioniert jedoch nur dann, wenn die Outputs erstens von den Bürgern tatsächlich wahrgenommen werden, die Bürger zweitens über neue Forderungen und/oder Unterstützung reagieren, diese Reaktionen drittens die Autoritäten erreichen, bevor die Autoritäten viertens darauf wieder reagieren und neue Outputs produzieren können. Funktioniert das Feedback, so argumentiert Easton, sind moderne Staaten prinzipiell anpassungsfähig und damit weniger krisenanfällig, da das System auf einen sich andeutenden Entzug der Unterstützung reagieren kann (vgl. Easton 1965b: 381f.). Die Unterstützung der Bürger kann sich dabei auf verschiedene Ebenen beziehen, etwa auf die politische Gemeinschaft, das Regime und die damit verbundenen Werte, die Systemperformanz, die Institutionen und die politischen Akteure selbst (vgl. Norris 1999: 10).

20

1 Einleitung

Brettschneider 2000: 500; Kaase 1999: 4).6 Eine kontinuierliche direkte Kommunikation zwischen Bürgern und politischer Elite, etwa in Form regelmäßiger Gespräche, wäre normativ vielleicht wünschenswert, ist aber praktisch aus verschiedenen Gründen nicht möglich.7 Die Wahlkreise sind viel zu groß, als dass der Abgeordnete die Möglichkeit hätte, mit allen Bürgern im Wahlkreis zu kommunizieren.8 Hinzu kommt, dass der direkte Kontakt der Abgeordneten meist nur mit einigen wenigen interessierten, aktiven Bürgern zustande kommt und das daraus resultierende Bild verzerrt ist (vgl. Miller/Stokes 1963: 54f.). In Umfragen auf der Grundlage von Zufallsstichproben können hingegen (im Idealfall) in einem überschaubaren Zeitrahmen nicht nur Einzelmeinungen, sondern die Verteilung der Einstellungen der Gesamtbevölkerung abgebildet werden: „Surveys produce just what democracy is supposed to produce – equal representation of all citizens. The sample survey is rigorously egalitarian; it is designed so that each citizen has an equal chance to participate and an equal voice when participating” (Verba 1996: 3). Aus der Sicht der Bürger sind Umfragen auch dann eine Möglichkeit des Feedbacks, wenn sie nicht direkt von der politischen Elite mit dem Ziel der Informationsgewinnung durchgeführt werden. Umfragen werden beispielsweise auch von Medien in Auftrag gegeben, um Interessen der Bürger zu artikulieren. Diese werden in der Regel dann auch öffentlich besprochen. Beispiele hierfür sind das ZDF-Politbarometer oder der ARD-Deutschlandtrend, deren Ergebnisse regelmäßig in den Nachrichtensendungen und in den übrigen Leitmedien aufbereitet werden. Auch Ergebnisse wissenschaftlicher Umfragen werden medial aufbereitet und als Nachricht verbreitet.9 Auf diese Weise können Themen in den öffentlichen Diskurs eingebracht werden (vgl. Roth 2009: 241). Zusammenfassend kann man konstatieren, dass Umfragen damit sowohl eine politikwissenschaftliche als auch eine genuin demokratietheoretische Relevanz haben. Sie erfüllen für die empirisch arbeitende Wissenschaft, für die Gesellschaft und für das politische System eine wichtige Funktion: Umfragen bilden Einstellungen, Meinungen und (beabsichtigtes bzw. berichtetes) Verhalten ab. „Gerade die Erhebung subjektiver Phänomene macht die Umfrageforschung für bestimmte Forschungszwecke unentbehrlich“ (Kaase 1999: 13) und macht sie damit zu einer der wichtigsten Grundlagen der empirischen politischen Verhaltens- und Einstellungsforschung. Auf der Basis von Umfragedaten werden Themen auf die politische, 6

Schon Easton verweist bereits explizit auf die Feedback-Möglichkeit durch Umfragen. Zugleich stellt er jedoch fest, dass die Methode der Umfrage (zu dieser Zeit) noch nicht weit genug entwickelt ist (vgl. Easton 1965b: 414). 7 Ein Versuch, den direkten Kontakt zwischen Abgeordneten und Bürgern herzustellen, sind die Wahlkreisbüros und die dort stattfindenden Bürgersprechstunden. Diese können jedoch nur einen kleinen exemplarischen Einblick in die Bedürfnisse der Bevölkerung geben und werden auch nur von einem Bruchteil der Bürger genutzt. Der Aufwand für den Bürger, den Abgeordneten direkt anzusprechen, ist deutlich höher als die (anonyme) Teilnahme an einer Umfrage. 8 Ein Wahlkreis für die Bundestagswahl umfasst zzt. etwa 180.000 bis 250.000 Wahlberechtigte (vgl. www.bundeswahlleiter.de). 9 Schuh (2009: 24ff.) zeigt, dass die Ergebnisse von Umfragen einen hohen Nachrichtenwert haben und daher eine hohe Publikationswahrscheinlichkeit aufweisen.

1.1 Umfragen und ihre Rolle im politischen System

21

wissenschaftliche, mediale und gesellschaftliche Agenda gesetzt und bearbeitet. Sie bilden über ihre Informationsfunktion eine Entscheidungshilfe für Politiker, die darauf reagieren können, wenn sie vor Policyentscheidungen stehen (vgl. Brehm 1993: 3). So können responsive Entscheidungen getroffen werden, die kurzfristig für die Wiederwahl der Repräsentanten wichtig sind. Langfristig bleibt damit dem System die Unterstützung der Bevölkerung erhalten.10 Umfragen können Trends, Probleme oder Krisensymptome ankündigen, ohne dass es erst zu schwerwiegenden Systemkrisen kommen muss. Umfragen haben zusätzlich aus der Perspektive der Bevölkerung eine Artikulations- und Repräsentationsfunktion (vgl. Dran/Hildreth 1995: 128). Für die Bürger sind Umfragen damit eine Möglichkeit, die eigene Meinung zu äußern und zu veröffentlichen.11

1.1.2 Die Qualität von Umfragen Damit die Ergebnisse aus Umfragen aussagekräftig sind und auch tatsächlich ein Abbild der Realität liefern – eine zentrale Voraussetzung, damit die Entscheidungen des politischen Systems von den Bürgern akzeptiert werden – müssen bei der Datenerhebung gewisse Regeln und Qualitätskriterien eingehalten werden (vgl. Kaase 1999; König 1969; Mohler et al. 2003). Zunächst hat man bei der Durchführung einer Umfrage die Wahl zwischen einer Vollerhebung, d.h. der Befragung aller Objekte bzw. Personen, über die man etwas aussagen möchte, und der Befragung einer Stichprobe, d.h. eines bestimmten Teils, der stellvertretend für die Grundgesamtheit steht. In der empirischen Wahl- und Einstellungsforschung sind Vollerhebungen aus den verschiedensten Gründen nur selten durchführbar. So ist es z.B. kaum möglich, 62 Mio. Wahlberechtigte am Tag vor der Wahl zu ihrer Wahlabsicht zu befragen, um eine kurzfristige Prognose zur Wahlentscheidung abzugeben. Ebenso wenig lassen sich über 80 Mio. Deutsche zu ihrem Vertrauen in die Demokratie zu einem bestimmten Zeitpunkt (etwa nach einem politischen Skandal) befragen. Bis der letzte Bürger befragt wäre, hätten sich die Einstellungen 10

Es existieren auch gegenteilige Meinungen, die diese deliberative Dimension der Umfrageforschung sehr kritisch bewerten. So kritisiert etwa Hennis bereits in den 1950er Jahren, dass die Qualität des demokratischen Prozesses nicht gesteigert werde und spricht von einer „Abwertung des Bürgers“ (Hennis 1957: 36) durch die Umfrageforschung. 11 Außer Acht gelassen wurde hier bewusst die – in Wissenschaft und Politik durchaus populäre – Diskussion zur Wirkung von Umfragen auf die Bürger, die ein weiteres Argument für die Relevanz von Umfragen bilden kann (eine gute Zusammenfassung der Diskussion findet sich bei Schuh 2009: 48ff.). Dabei wird angenommen, dass Umfragen nicht nur die Meinungen der Bevölkerung abbilden, sondern diese auch beeinflussen können. Besonders in der kommunikationswissenschaftlichen Forschung werden verschiedene Formen der Wirkung von Umfragen diskutiert. Für die politikwissenschaftliche Diskussion sind besonders die Effekte von Umfragen auf das Stimmverhalten und die Wahlbeteiligung von Bedeutung, wie etwa Bandwagon- und Underdog-Effekte, Defätismus- und Lethargie-Effekte. Auch die „wissenschaftlich und politisch einflussreiche“ (Schoen 2002: 183) Theorie der Schweigespirale von Noelle-Neumann bezieht sich auf die Wirkungen von Umfragen (siehe auch NoelleNeumann 2001). Da jedoch eindeutige Forschungserkenntnisse ebenso wie Belege für die Wirkung von Umfragen auf die Bürger fehlen, wird dieses Argument an dieser Stelle nicht weiter ausgeführt.

22

1 Einleitung

vieler bereits wieder verändert. Daher werden Stichprobenverfahren eingesetzt, deren Vorteile vielfältig sind. Stichproben sind meist günstiger und schneller in ihrer Erhebung und Auswertung. Zudem sind sie in der Regel auch valider und reliabler als Vollerhebungen, weil man besseres Befragungspersonal einsetzen und die Datenerhebung stärker kontrollieren kann (vgl. etwa Cochran 1972: 16f.; Kaase 1999: 16f.; Schnell et al. 2008: 268f.).12 Aus diesem Grund werden für empirische Studien meist Zufallsstichproben aus einer zuvor festgelegten Grundgesamtheit gezogen. Die derart ausgewählten Zielpersonen versucht man anschließend vollständig zu befragen. Auf der Grundlage der so gewonnenen Daten können dann mittels inferenzstatistischer Verfahren Rückschlüsse auf die Grundgesamtheit gezogen werden. Voraussetzung zur Anwendung der Methoden der schließenden Statistik ist das Vorliegen einer Zufallsstichprobe, da nur in diesem Fall die mathematischen Grundlagen der Stichprobentheorie gelten.13 In einem ein- oder mehrstufigen Prozess werden dabei zufällig Elemente aus der Grundgesamtheit so ausgewählt, dass für jedes Element die Wahrscheinlichkeit angegeben werden kann, in die Stichprobe zu gelangen. Auf diese Weise erhält man die Brutto-Ausgangsstichprobe, die im idealen Fall ein verkleinertes Abbild der Grundgesamtheit, „ein Miniaturbild der Gesamtheit“ (Kaase 1999: 16) darstellt.14 Die (unsystematischen) Fehler, die man bei diesem Inferenzschluss macht, lassen sich genau berechnen und angeben, so dass Hypothesen über die Grundgesamtheit getestet werden können (vgl. zur Theorie der Inferenzstatistik bereits Pearson 1903; Neyman 1934; zur Anwendung Bortz 2005: 85ff.; Mosler/Schmid 2009; Schumann 2006). Bevölkerungsumfragen sind aber nur dann „repräsentativ“, wenn keine systematischen Fehler auftreten. Systematische Verzerrungen von Umfragedaten können verschiedene Ursachen haben, die z.B. in den Instrumenten, den Interviewern, aber auch in der Auswahl der Stichprobe begründet sein können. Eine der Ursachen systematischer Verzerrungen von Daten soll in dieser Arbeit einer genaueren Betrachtung unterzogen werden: Unit-Nonresponse, d.h. der Ausfall einzelner Zielpersonen der Stichprobe. In der Praxis der sozialwissenschaftlichen Umfrageforschung ist es – im Gegensatz zur theoretischen Konzeption einer Zufallsstichprobe – kaum möglich, von allen zuvor ausgewählten Personen Daten zu erheben. Dieses Ausfallen einzelner zuvor ausgewählter Stichprobenelemente (UnitNonresponse) ist eines der zentralen methodischen Probleme der Umfragefor-

12 Dadurch, dass man bei einer Erhebung auf der Grundlage einer Stichprobe weniger Interviewer einsetzen muss, kann man diese besser schulen. 13 Im Gegensatz zu bewussten oder willkürlichen Auswahlverfahren, wie etwa bei der Quotenauswahl (siehe zur Zusammenfassung der Diskussion zur Aussagekraft von Quotenverfahren etwa Schnell et al. 2008: 303f.). 14 Bei disproportionalen Auswahlverfahren kann man dieses verkleinerte Abbild mittels Designgewichtung herstellen.

1.1 Umfragen und ihre Rolle im politischen System

23

schung, weil es die Repräsentativität der Ergebnisse gefährdet (vgl. neben vielen anderen etwa Kish 1967: 532ff.).15 Schlussfolgerungen von Stichproben auf die Grundgesamtheit können ungenau und durch Nonresponse verzerrt sein, vor allem, wenn die Nonresponse-Quote hoch ist und sich Respondenten und Nonrespondenten systematisch unterscheiden (vgl. Schnell et al. 2008: 310ff.; Singer 2006: 637; Stocké/Stark 2005: 3f.). Zugleich erscheint es durchaus plausibel, dass systematische Unterschiede zwischen Teilnehmern und Nicht-Teilnehmern existieren. Häufig wird dabei angenommen, dass Umfragen ein tendenziell zu positives Bild der Gesellschaft liefern („a slightly improved version of reality“ Lindström 1983: 81, zitiert nach Schnell 1991: 148), da sich eher die zufriedenen, aktiven, interessierten Bürger daran beteiligten. Daher könnten die Erkenntnisse über Verteilungen, über Anteils- und Mittelwerte sowie über Zusammenhänge politischer Einstellungen und Verhaltensweisen, die auf der Grundlage von Befragungsdaten gewonnen wurden, verzerrt sein. Dies hätte, kommt man noch einmal zurück auf die Relevanz von Umfragen (Kap. 1.1.1), nicht nur Auswirkungen auf die Genauigkeit von Umfragen und die Ergebnisse politikwissenschaftlicher Forschung, sondern auch demokratietheoretische Konsequenzen. Wenn in Umfragen bestimmte Gruppen nicht repräsentiert sind, können ihre Einstellungen von den politischen Eliten auch nicht berücksichtigt werden. Eine dauerhafte Unterrepräsentation bestimmter Gruppen im Feedbackprozess führt damit zu deren politischer Unterrepräsentation, da diese Bedürfnisse nicht im politischen Exkurs erscheinen und daher auch nicht bearbeitet werden können (vgl. Brehm 1993: 23). Werden im Gegensatz dazu dauerhaft nur die Bedürfnisse und Forderungen eines Teils der Gesellschaft in Umfragen repräsentiert, können Outputs resultieren, die auf Dauer auch nur von einem Teil der Bevölkerung unterstützt werden. Kritik und Forderungen kommen nur noch bedingt bei den politischen Eliten an. Die Vernachlässigung der Interessen dieser Bürger kann zur Instabilität und zur Krise des gesamten Systems führen, insbesondere wenn es sich um einen relevanten Anteil der Bevölkerung handelt, der nicht repräsentiert wird und diese Vernachlässigung über einen längeren Zeitraum stattfindet. Um Krisensymptome wie Teilnahmslosigkeit, Extremismus oder Unzufriedenheit frühzeitig zu erkennen und ein hohes Maß an Responsivität des Systems aufrecht zu erhalten, ist es daher essentiell, inhaltliche Aussagen über diejenigen treffen zu können, die in Umfragen als zentralem Feedback-Instrumentarium nicht erfasst werden: die Nonrespondenten und dabei insbesondere die aktiven Verweigerer. Um einschätzen zu können, inwiefern sich durch die Ausfälle tatsächlich Verzerrungen ergeben, sind theoretisch fundierte Nonresponse-Modelle notwendig, die 15 Der Fehler aufgrund von Nonresponse ist nur eine von mehreren möglichen Fehlerquellen, neben Stichprobenfehlern, Messfehlern und Coverage-Fehlern (siehe dazu die Übersicht Abb. A1 im Anhang, vgl. Engel/Reinecke 1994: 254; Kalton et al. 1989: 249; siehe auch zum „Total Survey Error“ Biemer/Lyberg 2003: 34ff.; Weisberg 2005). Er ist jedoch derjenige, der (anders als der Stichprobenfehler) nicht zu berechnen ist, am wahrscheinlichsten zu systematischen Unterschieden zwischen Teilnehmern und Nicht-Teilnehmern führt und vom Forscher am wenigsten kontrolliert werden kann.

24

1 Einleitung

Aussagen über den Unterschied zwischen Respondenten und Nonrespondenten treffen (vgl. Groves 2006: 651; Groves/Peytcheva 2008: 167f.; Hox et al. 1996: 101ff.). Die mögliche Verzerrung aufgrund von Nonresponse16 ist dabei – wie bereits erwähnt – von zwei Faktoren abhängig: sowohl von der Höhe der Nonresponse-Quote als auch vom Ausmaß des Unterschiedes zwischen Teilnehmern und Nicht-Teilnehmern. Gleichzeitig kann die Verzerrung je nach Merkmal variieren und tritt weder „pauschal“ auf, noch ist sie für alle Merkmale linear (vgl. Cochran 1972: 415ff.; Deming 1960: 66f.; Kish 1967: 532ff.; Koch 1998: 67ff.; Moser 1959: 127ff., 178ff.; Schnell et al. 2008: 310; Tourangeau et al. 2000: 320). Die Angabe der Höhe der Ausschöpfung einer Studie ist – bei eindeutigen Definitionen von Nonresponse – möglich, hat jedoch für die Interpretation der Verzerrung alleine nur wenig Aussagekraft (vgl. Groves 2006: 646ff.; Groves/Peytcheva 2008: 168). Relevanter ist die Frage nach dem Unterschied zwischen Respondenten und Nonrespondenten, wozu jedoch meist kaum inhaltliche Informationen vorliegen (vgl. O'Neil 1979: 219; siehe auch Daniel 1975). Die Nicht-Teilnahme einzelner zuvor ausgewählter Zielpersonen an Umfragen ist demnach genau dann problematisch für die Umfrageforschung sowie die empirische politikwissenschaftliche Einstellungs- und Verhaltensforschung, wenn sich die Nicht-Teilnehmer von den Teilnehmern systematisch unterscheiden und damit in Kombination mit geringen Responseraten nicht repräsentative Ergebnisse resultieren. Daher ist die sorgfältige Analyse der Nonrespondenten und der Ursachen ihrer Nicht-Teilnahme ein zentrales Qualitätskriterium für Umfragen. „As political scientists, too many of us trust survey research as the indicator of how people think of politics. We are in a rather vulnerable position if something threatens survey research” (Brehm 1993: 16).

1.2 Der Umgang mit Nonresponse in der empirischen Forschung Wenn es sich, wie gerade ausgeführt, bei Nonresponse um eines der zentralen Probleme der Umfrageforschung handelt, könnte man annehmen, es würde in zahlreichen Studien thematisiert. Der Umgang mit dem Auftreten von Nonresponse ist jedoch sehr unterschiedlich (vgl. etwa Neller 2005; Smith 1983). Zum Teil wird das Problem in der Praxis beim Arbeiten mit Umfragedaten schlicht ignoriert und davon ausgegangen, dass sich diejenigen, die aus der Ausgangsstichprobe herausfallen, nicht von den übrigen Befragten unterscheiden. Damit werden alle Ausfälle als zufällig und unsystematisch deklariert (vgl. King et al. 2001; Montgomery et al. 2008). Ein Indiz für dieses Verhalten zeigt sich darin, dass bei der Präsentation von Forschungsergebnissen nur selten Aussagen über Ausschöpfungsquoten oder ver16 Andere mögliche Fehlerquellen, wie z.B. Messfehler, Spezifikationsfehler oder Prozessfehler (vgl. Biemer/Lyberg 2003: 39) werden dabei nicht betrachtet.

1.2 Der Umgang mit Nonresponse in der empirischen Forschung

25

schiedene Ursachen von Nonresponse gemacht werden (vgl. exemplarisch Dalton 1985). Eine Inhaltsanalyse der Artikel, die in den vier wichtigsten deutschsprachigen Fachzeitschriften aus dem Bereich der empirischen Sozialforschung17 im Zeitraum von 2003 bis 2007 erschienen sind, zeigt, dass von 24 Beiträgen, die mit Daten aus persönlichen Befragungen arbeiten, lediglich ein Beitrag explizit auf die Ausschöpfungsquote bzw. auf inhaltliche Ursachen von Nonresponse und die damit verbundenen Konsequenzen eingegangen ist (siehe Anhang, Tab. A1). Ein ähnliches Ergebnis zeigt die Analyse der acht wichtigsten internationalen sozialwissenschaftlichen Fachzeitschriften18 zwischen 1998 und 2001: In über 60 Prozent der Aufsätze gibt es überhaupt keine Informationen über Ausschöpfungsquoten, bei den Publikationen in den explizit politikwissenschaftlichen Zeitschriften lag der Anteil mit über 73 Prozent sogar noch höher (vgl. Smith 2002b: 470). Andere Autoren erkennen hingegen das Problem, das sich durch die fehlenden Fälle ergeben könnte, und vergleichen aus diesem Grund einzelne, meist soziodemographische Merkmale aus (Quasi-)Vollerhebungen mit den Randverteilungen ihrer Daten (vgl. Schnell et al. 2008: 306; siehe auch Abraham et al. 2006; Montgomery et al. 2008). In der Bundesrepublik Deutschland wird dazu in der Regel der Mikrozensus herangezogen. Bei diesem handelt es sich um die amtliche Repräsentativstatistik, bei der die Teilnahme verpflichtend ist, weswegen auch Rücklaufquoten von über 95 Prozent erreicht werden (vgl. Koch 1997). Alternativ stehen der wissenschaftlichen Forschung auch Strukturdaten der Einwohnermeldeämter als Kontrolle zur Verfügung. Wenn es beim Vergleich der soziodemographischen Struktur keine allzu großen Abweichungen gibt, wird Nonresponse auf der Basis dieses Arguments in der Regel ebenfalls nicht weiter thematisiert. Eine weitere Strategie im Umgang mit Nonresponse ist die Verwendung von mehr oder weniger geeigneten Gewichtungsprozeduren. Diese Strategie wird oft auch in Kombination mit der zuvor genannten Strategie des Vergleichs gewählt, als Reaktion auf Differenzen zwischen einzelnen Merkmalen in der Stichprobe und den Daten aus der Grundgesamtheit.19 Dabei werden die eigenen Daten auf der Grundlage einiger weniger Merkmale gewichtet, um sie der „Realität“ möglichst gut anzupassen (vgl. Schnell 1997: 245ff.).20 Alle drei Strategien, das Ignorieren des Ausfalls, der Vergleich mit amtlichen Daten und die Gewichtung nach bestimmten Merkmalen, sind jedoch mit gravie17

Politische Vierteljahresschrift, Zeitschrift für Parlamentsfragen, Kölner Zeitschrift für Soziologie und Sozialpsychologie und die Zeitschrift für Soziologie. 18 Untersucht wurden: American Journal of Political Science, American Political Science Review, American Journal of Sociology, American Sociological Review, Social Forces, International Journal of Public Opinion Research, Journal of Official Statistics, Public Opinion Quarterly. 19 Diese drei Strategien sind die gebräuchlichsten. Für eine Aufzählung anderer Möglichkeiten des Umgangs mit Nonresponse siehe Smith (1983). 20 Dies geschieht meist, wenn die zweite Strategie, der Abgleich mit Vollerhebungen, zeigt, dass es deutliche Abweichungen bezüglich einzelner soziodemographischer Merkmale gibt.

26

1 Einleitung

renden Problemen behaftet. Wenn man die Nonresponse-Problematik ignoriert und ein systematischer Unterschied zwischen Respondenten und Nonrespondenten existiert, sind sowohl Mittelwerte als auch Anteilswerte, Verteilungen und Zusammenhänge systematisch verzerrt. „We usually do not know how biased nonresponse is, but it is seldom a good assumption that nonresponse is unbiased” (Fowler 1984: 51f.). In der Wahlforschung bieten sich vereinzelt Indizien für derartige Verzerrungen: Die Wahlbeteiligung wird in Umfragen meist überschätzt (vgl. z.B. Bolstein 1991; Brehm 1993: 138; Clausen 1968; Kleinhenz 1995)21, die Wechselwahlanteile werden unterschätzt (vgl. z.B. Schoen 2003)22 und auch im Bereich der Wahlprognosen treten klare Fehleinschätzungen auf (vgl. z.B. Curtice/Sparrow 1997; Durand et al. 2001; Jowell et al. 1993; Martin et al. 2005; Mitofsky 1998, 2002; Squire 1988; Traugott/Price 1992; Traugott 2001)23. Wahlstudien sind im Vergleich zu Studien aus dem Bereich der Einstellungsforschung deshalb gut geeignet um Verzerrungen zu erkennen, weil das tatsächliche Ergebnis am Wahltag die Möglichkeit bietet, zumindest für die Wahlbeteiligung und die Parteiwahl die Prognosegüte durch einen Abgleich von prognostizierten und wahren Werten retrospektiv festzustellen (vgl. Kohut 1986: 1).24 Bei der Analyse politischer Einstellungen gibt es diese Möglichkeit nicht. Dennoch werden auch hierbei Verzerrungen angenommen: „Bei Befragungen fehlen (aus unterschiedlichen Gründen) üblicherweise marginale, ‚extreme‘ und ‚abweichende‘ bzw. ‚unkonventionelle‘ Populationsteile“ (Esser 1986: 38). Die zweite Strategie im Umgang mit Nonresponse, der Vergleich zwischen den Randverteilungen der Soziodemographie in der Stichprobe und in der Grundgesamtheit, postuliert, dass sich alle unterschiedlichen politischen Einstellungen und Verhaltensweisen in diesen Merkmalen (meist: Alter, Geschlecht, Bildung) widerspiegeln.25 Diese Annahme erscheint jedoch sehr gewagt (vgl. Daniel 1975). Problematisch ist zunächst, dass meist nur einige wenige demographische Merkma21 Natürlich sind für diese Fehlangaben nicht nur Nonresponse-Effekte ursächlich: Bei der Angabe der Wahlbeteiligung spielt neben Nonresponse auch Overreporting eine wichtige Rolle. Damit ist gemeint, dass Personen aufgrund einer subjektiv empfundenen Wahlnorm angeben, dass sie gewählt haben, obwohl sie zur Gruppe der Nichtwähler gehören (vgl. z.B. Hardmeier/Fontana 2006). Unklar ist dabei, wie stark beide Effekte in Relation zueinander sind. 22 Für die Wechselwahl gilt, dass Underreporting neben dem Nonresponse einen Einfluss auf die Verzerrung haben kann. Menschen könnten dem Interviewer gegenüber wechselndes Wahlverhalten nicht zugeben, um kognitive Dissonanzen zu vermeiden. 23 Auch bei der Bundestagswahl 2005 war zu beobachten, dass die Wahlprognosen deutlich das spätere Endergebnis verfehlten. Wenn man die Prognosen in der Woche vor der Wahl berücksichtigt und den Mittelwert der Schätzungen der sechs größten deutschen Institute berechnet, wurde z.B. das Ergebnis für die CDU um mehr als 6 Prozentpunkte überschätzt. Eine Quelle für diese Fehleinschätzung könnten beispielsweise neben denjenigen, die sich umentscheiden („Last-minute-swing“) und denjenigen, die zum Zeitpunkt der Befragung noch unentschlossen waren, ebenfalls die Nonrespondenten darstellen. 24 Dies wäre die Prüfung der Validität durch ein externes Kriterium, im Sinne von Kriteriumsvalidität („predictive validity“, vgl. Schnell et al. 2008: 155). Jedoch muss auch hier mit Hilfsannahmen operiert werden, etwa dass zwischen dem Zeitpunkt der Prognose und der Erhebung des Kriteriums keine Veränderung stattgefunden hat. 25 Auch Befürworter von Quotenstichproben gehen häufig von diesen Annahmen aus (vgl. Bausch 1990; Kaplitza 1982: 168; Noelle-Neumann/Piel 1983: 223ff.; siehe zur Kritik daran auch Schnell 1993).

1.3 Erkenntnisinteresse und zentrale Fragestellung

27

le der Grundgesamtheit bekannt sind (vgl. Kruskal/Mosteller 1979: 16ff.; Schnell 1997: 137). Außerdem nimmt man auf der theoretischen Ebene stillschweigend an, dass die „bekannten“ Daten, etwa aus dem Mikrozensus, die wahren Werte angeben (vgl. Schnell et al. 2008: 306). Unklar ist schließlich, wie groß Abweichungen sein dürfen, bevor man annimmt, mit den Daten nicht adäquat arbeiten zu können. Wenn der Vergleich der Randverteilungen nicht im Sinne des Forschers ausfällt, sind verschiedene Konsequenzen möglich: Gewichtet man dann pauschal anhand einzelner Merkmale? Welche Folgen ergeben sich daraus für die nicht untersuchten Merkmale? Unternimmt man nichts? Oder verwirft man die Daten? Gewichtungsfaktoren werden verwendet, um bereits bekannte Verzerrungen (zumeist soziodemographischer Merkmale) auszugleichen. Dabei lassen sich grundsätzlich zwei verschiedene Formen von Gewichtungen unterscheiden: Designgewichte und Anpassungsgewichte (vgl. Faas/Schoen 2009: 148). Für zuvor klar definierte Stichprobendesigns, wie etwa bei einer disproportional geschichteten Stichprobe, existieren Designgewichtungen. Diese sind in ihrer Anwendung weitgehend unproblematisch, da lediglich bewusst getroffene Unterschiede in den Auswahlwahrscheinlichkeiten zurückgerechnet und damit korrigiert werden (vgl. Diekmann 2004: 365; Häder 2006: 179ff.; Schumann 2006: 94ff.). Problematischer ist die Verwendung von Anpassungsgewichten. Deren Anwendung setzt ebenfalls inhaltliche Kenntnisse über die Grundgesamtheit voraus, die jedoch im Hinblick auf Einstellungen kaum zur Verfügung stehen (vgl. Montgomery et al. 2008: 494; O’Neil 1979: 219; Rösch 1994; Schnell 1997). Zudem muss beachtet werden, dass eine Gewichtung anhand einiger weniger Merkmale zu neuen Verzerrungen bei anderen Merkmalen führen kann (vgl. Alt/Bien 1994; Diekmann 2004: 366; Kish 1990: 127; Rothe/Wiedenbeck 1987; Schnell 1993). Als am erfolgversprechendsten, was die mathematisch-statistischen Korrekturverfahren für den Fehler durch die Nicht-Teilnahme von Zielpersonen angeht, gelten derzeit die so genannten „Response Propensity“-Modelle. Dabei wird die individuelle Teilnahmewahrscheinlichkeit einer Person auf der Basis von inhaltlichen Modellen geschätzt und die Daten anschließend gewichtet (vgl. Eltinge 2002; Engel et al. 2004; Rosenbaum/Rubin 1984; Schnell 1997: 249f.; Särndal 1981; Tourangeau et al. 2000: 321). Das grundlegende Problem lässt sich jedoch dadurch nicht lösen. Der gewinnbringende Einsatz dieses Verfahrens zur Gewichtung setzt das Vorliegen weitergehender, substanzieller inhaltlicher Informationen über die Nicht-Teilnehmer und den Ausfallprozess voraus.

1.3 Erkenntnisinteresse und zentrale Fragestellung Man kann demnach konstatieren: Die theoretische und methodische Diskussion über den Umgang mit Nonresponse gewinnt in der empirischen Sozialforschung zunehmend an Bedeutung und es werden immer bessere, komplexere mathema-

28

1 Einleitung

tisch-statistische Korrektur- und Gewichtungsprozeduren entwickelt. Gleichzeitig fehlt bisher gerade in der politischen Wahl- und Einstellungsforschung in der Bundesrepublik Deutschland eine intensive Beschäftigung mit den inhaltlichen Fragen, was Nonrespondenten in Studien mit politikwissenschaftlichen Fragestellungen charakterisiert und warum manche Personen an politischen Befragungen teilnehmen und andere nicht. Daraus resultieren verschiedene Teilfragen, denen in dieser Arbeit auf den Grund gegangen werden soll: Wie verhalten sich diejenigen, die nicht an Befragungen teilnehmen, im politischen System? Welche politischen und gesellschaftlichen Einstellungen haben sie? Unterscheiden sie sich signifikant von den kooperativen Zielpersonen? Wenn ja, warum? Was sind die Determinanten einer Umfrageteilnahme? Haben politische und soziale Einstellungen einen Einfluss auf die Teilnahmeentscheidung? Welche politikwissenschaftlich relevanten Konzepte könnten systematische Verzerrungen aufweisen, weil ihnen die gleichen Determinanten wie der Teilnahmeentscheidung zugrunde liegen? Und schließlich: Welche Konsequenzen ergeben sich daraus für die Umfrageforschung und aus demokratietheoretischer Perspektive für das politische System? Abbildung 1 visualisiert die zentralen Forschungsfragen, die in der Arbeit beantwortet werden sollen. Abbildung 1:

Forschungsfragen

WARUM: Ursachen?

Existieren Unterschiede zwischen Respondenten und Nonrespondenten?

Konsequenzen?

Quelle: Eigene Darstellung.

Diese Arbeit verfolgt damit das inhaltliche Ziel, die politischen Einstellungen und Verhaltensweisen derjenigen Personen zu untersuchen, die in „normalen“ politikwissenschaftlichen face-to-face-Befragungen Nonrespondenten wären. Es geht dabei nicht um eine rein methodische Auseinandersetzung mit den NichtTeilnehmern, sondern um die Frage, ob, und wenn ja, wie und warum, sich Teilnehmer und Nicht-Teilnehmer (und dabei insbesondere die Verweigerer) bei Umfragen zu politikwissenschaftlich relevanten Themenkomplexen in ihren politischen Einstellungen und Verhaltensweisen unterscheiden. Anschließend soll daraus abgeleitet werden, welche Konsequenzen sich daraus für das politische System ergeben. Grundsätzlich können Unterschiede zwischen den Teilnehmern und NichtTeilnehmern einer Befragung auf zwei verschiedene Mechanismen zurückgeführt werden. Es kann sich um direkte oder indirekte Effekte handeln. Beide werden nun etwas genauer erläutert. Verzerrungen aufgrund direkter Effekte sind bei denjenigen Merkmalen anzunehmen, die einen direkten Einfluss auf die Teilnahmebereit-

1.3 Erkenntnisinteresse und zentrale Fragestellung

29

schaft haben („Survey Variable Cause-Modell“). So könnte man bspw. annehmen, dass politisches Interesse (X1) die Teilnahmebereitschaft (TN) direkt positiv beeinflusst. Dann wären politisch interessierte Personen in der Stichprobe überrepräsentiert, der Anteil politisch Interessierter würde somit überschätzt. Es wäre aber auch möglich, dass die Teilnahme an Umfragen und bestimmte andere Merkmale lediglich die gleichen Ursachen haben, beide also von den gleichen Hintergrundvariablen beeinflusst werden („Common Cause-Modell“). Sie sind daher nur indirekt in Form einer Scheinkorrelation miteinander verbunden. Dennoch würden sie verzerrt geschätzt, wenn man die direkten Einflussfaktoren nicht kontrolliert (vgl. Groves 2006: 651; Groves/Peytcheva 2008: 168, siehe Abb. 2).26 Abbildung 2:

Modell 1: X1

Modelle zur Erklärung von Unterschieden zwischen Teilnehmern und Nicht-Teilnehmern Survey Variable Cause-Modell TN

Modell 2:

Common CauseModell

X1

TN

X2 Quelle: Eigene Darstellung nach Groves/Peytcheva (2008: 168).

Beispielsweise könnte man annehmen, dass politisches Interesse (X1) im Sinne des zuerst ausgeführten Modells direkter Effekte die Teilnahme an einer politischen Befragung (TN) beeinflusst, zugleich aber auch Determinante der Wahlbeteiligung (X2) ist. Für die Wahlbeteiligung (X2) würden nun die erläuterten indirekten Effekte auftreten: Personen, die sich nicht an Wahlen beteiligen (X2), wären seltener in Umfragen vertreten (TN). Dies liegt aber nicht daran, dass es eine direkte Kausalverbindung zwischen der Umfrageteilnahme (TN) und der Wahlteilnahme (X2) gibt, sondern dass beiden Konstrukten das politische Interesse (X1) zu Grunde liegt. Auf diese Weise ließe sich erklären, warum der Anteil der Nichtwähler in Befragungen meist unterschätzt wird (vgl. Brehm 1993: 138; Clausen 1968; Kleinhenz 1995). Um entscheiden zu können, auf welche Konstellation ein aufgetretener Unterschied bei einem Merkmal zurückzuführen ist, sind inhaltliche Modelle des Aus26

Daneben könnten auch andere, komplexere Variablenkonstellationen, wie etwa Interventionen, Multikausalität oder Interaktionseffekte, vorliegen (vgl. Schumann 2006: 122). Zudem lässt sich bei Groves (2006: 651) nachlesen, wie andere Kausalmodelle neben dem Nonresponsefehler auch noch die Messfehler mit einbeziehen. Um die zu untersuchenden Modelle nicht zu komplex werden zu lassen und um zunächst sparsame Theorien zu entwickeln, werden derartige Effekte in dieser Arbeit jedoch ausgeklammert und nur die Basismodelle untersucht. Damit wird der Frage nachgegangen, welche Merkmale die Teilnahmebereitschaft direkt beeinflussen und welche Merkmale gemeinsame Determinanten mit der Teilnahmebereitschaft haben.

30

1 Einleitung

fallprozesses notwendig (vgl. Groves 2006; Groves/Peytcheva 2008). Zunächst kann ein Erklärungsmodell, das sich auf die Gründe einer Person, eine Teilnahme zu verweigern, bezieht, Merkmale (wie X1) aufzeigen, für die eine Verzerrung im Sinne des Modells 1 angenommen wird. Im Anschluss daran kann man untersuchen, für welche anderen verwandten Konzepte ähnliche Erklärungsmodelle existieren. Auf diese Weise lassen sich theoretische Annahmen aufstellen, bei welchen Merkmalen (wie X2) Unterschiede zwischen Teilnehmern und Nicht-Teilnehmern auftreten, obwohl sie die Teilnahmeentscheidung selbst nicht direkt beeinflussen.

1.4 Vorgehensweise Auf den ersten Blick erscheint das zentrale Ziel der Arbeit paradox. Man möchte diejenigen befragen, die sich nicht befragen lassen, um etwas über ihre politischen Einstellungen und ihr Verhalten zu erfahren. Naturgemäß muss dieses Vorhaben präzisiert werden, um es nicht von vorneherein zum Scheitern zu verurteilen. Daher werden zunächst einige Grundannahmen expliziert. Zuerst wird daher im zweiten Kapitel der Arbeit der Untersuchungsgegenstand „Nonresponse“ definiert, wichtige Begriffe werden voneinander abgegrenzt und präzisiert. Diese Arbeit richtet den Fokus gezielt auf politische Einstellungen und politisches Verhalten derjenigen, von denen in regulären face-to-face-Designs einer allgemeinen Bevölkerungsumfrage unter Standardbedingungen keine Daten erhoben werden können. Nonresponse als Untersuchungsgegenstand ist gerade im deutschsprachigen Raum noch vergleichsweise unbearbeitet. Zum einen gibt es keine konsistente, bewährte Theorie, die sich mit politikwissenschaftlich relevanten Determinanten der Kooperation bei Umfragen beschäftigt. Vielmehr zeichnet sich der Forschungsstand dadurch aus, dass meist einzelne theoretische Annahmen und empirische Forschungserkenntnisse unverbunden nebeneinander stehen. Zum anderen sind empirische Erkenntnisse zu Nonrespondenten in der Bundesrepublik Deutschland ebenfalls rar.27 Hinzu kommt, dass die wenigen existierenden Modelle zur Erklärung der Kooperation bei Umfragen nicht mit anderen Erklärungsmodellen, z.B. zu politischem Verhalten, zusammengeführt werden. Daher sind sie auch nicht in einen umfassenderen theoretischen Rahmen eingebettet. Diese Integration soll (und muss) aber geleistet werden, um die demokratietheoretischen Folgen von Nonresponse umfassender bewerten zu können. Dazu wird im dritten Kapitel ein Überblick über relevante Erkenntnisse der nationalen und internationalen Forschung zu Nicht-Teilnehmern bei Umfragen gegeben. Es werden sowohl theoretische Ansätze als auch empirische Befunde zu Ausmaß, Ursachen und Konsequenzen von Nonresponse dargestellt, zusammengeführt und verdichtet. Insbesondere 27 Ausnahmen sind die Studien von Neller (2005) zum ESS, die Erkenntnisse von Schnell (1997) und Schnauber/Daschmann (2008).

1.4 Vorgehensweise

31

bei den empirischen Erkenntnissen muss beachtet werden, dass sich die Studien auf verschiedene Formen von Befragungen (schriftliche, persönlich-mündliche, telefonische) beziehen und ihnen unterschiedliche Grundgesamtheiten (allgemeine Bevölkerung oder Spezialpopulationen) sowie vor allem unterschiedliche Stichprobenverfahren (Random Walk, Quoten) zugrunde liegen. Die Variationen in den Forschungsdesigns erschweren die Vergleichbarkeit der Erkenntnisse. Außerdem stammen sie aus unterschiedlichen politischen und gesellschaftlichen Kontexten wie beispielsweise den USA, den Niederlanden oder Großbritannien, und man kann noch nicht abschätzen, inwieweit politisch-kulturelle Unterschiede zwischen den Ländern eine Übertragbarkeit von Befunden gefährden.28 Im letzten Teil des dritten Kapitels werden die innovativsten und für die vorliegende Fragestellung interessantesten komplexeren Modelle aufgezeigt und die daraus resultierenden Annahmen expliziert (vgl. Brehm 1993; Groves/Couper 1998; Hox et al. 1996; Schnell 1997; Voogt/Saris 2003; Voogt 2004). Nach dem Überblick über den Forschungsstand wird im vierten Kapitel die Entscheidung zu Verweigerung oder Kooperation aus verschiedenen bewährten Annahmen und metatheoretischen Überlegungen modelliert. Dazu wird ein handlungstheoretisches Modell zur Erklärung von Kooperation bzw. Verweigerung bei Befragungen entwickelt, die Teilnahme an Umfragen dabei als „rationale“ Entscheidung verstanden. Dies kann noch weiter präzisiert werden: In Anlehnung an allgemeine Handlungstheorien, wie die subjektive Werterwartungstheorie und die Überlegungen zur Frame-Selektion (vgl. Esser 1986a, 1990, 1991, 1993, 1996), sowie in Anlehnung an die Theorie geplanten Verhaltens, die einen starken Fokus auf die Relevanz von Einstellungen für das Handeln von Individuen legt (vgl. Ajzen 1991; Ajzen/Fishbein 2000; Ajzen/Gilbert Cote 2008; Hox et al. 1996), wird die Entscheidung zur Kooperation als subjektive Kosten-Nutzen-Abwägung eines begrenzt rationalen Individuums angesehen, die in ein soziales Umfeld eingebettet ist. Schließlich werden aus dem theoretischen Modell konkrete Hypothesen abgeleitet. Es werden Annahmen formuliert, wie und warum sich Respondenten und Nonrespondenten von politikwissenschaftlichen Untersuchungen in Bezug auf relevante inhaltliche Variablen systematisch unterscheiden sollten. Anschließend wird im Sinne des Common Cause-Modells dargelegt, für welche Konstrukte Verzerrungen aufgrund gemeinsamer Hintergrundvariablen angenommen werden. Hierbei ist die zentrale Annahme forschungsleitend, dass politische Partizipation und die Beteiligung an Umfragen ähnlichen Mechanismen folgen und daher gerade bei den Kernkonstrukten politischer Beteiligung systematische Unterschiede zwischen Teilnehmern und Nicht-Teilnehmern auftreten sollten. 28

Die vergleichende Forschung zeigt, dass Kontexteffekte bei der Erklärung von Nonresponse wirken und damit verschiedene Merkmale in unterschiedlichen Kontexten die Teilnahmebereitschaft mehr oder weniger beeinflussen (vgl. Billiet et al. 2007: 143; siehe auch Couper/de Leeuw 2003; de Heer 1999; de Heer/Israels 1992; de Leeuw/de Heer 2002; Groves/Couper 1998; Johnson et al. 2002; Stoop 2005; Smith 2007). Auch zeitliche Effekte wären denkbar, die eine Übertragbarkeit der Ergebnisse in Frage stellen.

32

1 Einleitung

Das fünfte Kapitel der Arbeit beschäftigt sich mit der Beschreibung der Datengrundlage der Studie. Als Basis der Untersuchung dienen Daten aus einer Nonresponse-Studie („ALLBUS+“), die im Jahr 2008 parallel zum ALLBUS durchgeführt und von der DFG finanziert wurde. Um eine Vorstellung von der Datengewinnung und der Datenqualität zu bekommen, wird zunächst das Forschungsdesign vorgestellt, in das bereits theoretische Erkenntnisse aus den zuvor erörterten Forschungskonzepten (etwa zum Einsatz von Interviewern und Incentives) mit eingeflossen sind. Gleichzeitig werden an dieser Stelle aufgetretene Probleme und Restriktionen bei der Entwicklung des Forschungsdesigns sowie die damit verbundenen Implikationen dargestellt und diskutiert. Das methodische Kapitel ist umfangreicher als bei den meisten Studien zur Wahl- und Einstellungsforschung, was jedoch durch die Positionierung der Arbeit an der Schnittstelle zwischen Einstellungs- und Methodenforschung begründet ist. Methodische Probleme und Entscheidungen für oder gegen bestimmte Aspekte innerhalb des Studiendesigns haben eine große Wirkung auf die Interpretation der Ergebnisse und sind relevant für das Verständnis der gewonnenen Erkenntnisse. Das (scheinbare) Paradoxon einer „Befragung von Nonrespondenten“ wird aufgezeigt, die Lösung des Problems dargestellt und argumentiert, warum diese Arbeit dennoch einen Einblick in die „Black Box“ der Nonrespondenten geben kann. Im Anschluss daran wird im sechsten Kapitel die Operationalisierung der zentralen Konstrukte diskutiert. Im siebten Kapitel werden die empirischen Ergebnisse präsentiert. Dazu werden zunächst zwei Studien mit unterschiedlichen Ausschöpfungen untersucht und analysiert, wie sich die unterschiedlichen Nonresponse-Quoten auswirken. Anschließend werden explizit kooperative und verweigernde Zielpersonen miteinander verglichen. Das bedeutet, dass die Nicht-Erreichten und die Nicht-Befragbaren sowie all diejenigen, bei denen die Ausfallgründe nicht auf eine aktive Verweigerung schließen lassen, ausgeklammert werden und der Fokus auf die tatsächliche Handlungsentscheidung gelegt wird. Zunächst erfolgen die Analysen bivariat, damit man eine Vorstellung hat, wie sich die Aussagen über Verteilungen tatsächlich unterscheiden, je nachdem auf der Basis welcher Befragtengruppe (ALLBUS/ ALLBUS+, Kooperative/Verweigerer) man Schätzungen abgibt. Im Anschluss daran werden multivariate Modelle gerechnet, um die Erklärungsmodelle und die davon abgeleiteten Hypothesen unter Kontrolle möglicher Drittvariablen zu überprüfen. Im letzten Kapitel werden die wichtigsten Erkenntnisse noch einmal zusammengefasst und die zentralen Forschungsfragen beantwortet. Gleichzeitig sollen Schlussfolgerungen für den Bereich der empirischen Wahl- und Einstellungsforschung sowie für die Umfrageforschung gezogen werden. Dazu wird zunächst erläutert, welche demokratietheoretischen Konsequenzen sich aus den Erkenntnissen für das politische System ableiten lassen. Abschließend werden ein Ausblick auf offene Fragen und damit Hinweise für zukünftige Forschungsprojekte auf dem Gebiet gegeben.

2 Nonresponse als Untersuchungsgegenstand

2.1 Definition 2.1.1 Die Unterscheidung von Item- und Unit-Nonresponse Bei der Durchführung von Umfragen gelingt es in aller Regel nicht, von allen zuvor ausgewählten Personen einer Stichprobe Messwerte zu allen Items des Fragebogens zu erhalten. Dieses Problem unvollständiger Daten wird unter dem Begriff „Nonresponse“ zusammengefasst. Nonresponse ist demnach als „das Fehlen von Daten eines Teils oder aller Variablen für die ausgewählten Einheiten einer Stichprobe“ (Schnell 1997: 17; vgl. auch Lessler/Kalsbeek 1992: 103) definiert. Dabei kann man, je nach Ausmaß der fehlenden Information, zwischen Item- und UnitNonresponse unterscheiden (vgl. etwa Dillman et al. 2002: 3; Groves et al. 2004b: 169; Schnell 1997: 17). Beim Phänomen des Item-Nonresponse beantwortet eine Person zwar einen Teil der Fragen, einzelne Items bleiben jedoch unbeantwortet. Klassische Beispiele für Fragen mit hohen Item-Nonresponse-Quoten sind die Sonntagsfrage nach der Wahlabsicht, Fragen nach dem Haushaltseinkommen oder Vermögen, aber auch inhaltliche Fragen wie beispielsweise die nach rechts- oder linksextremen Einstellungen (vgl. Stöss 2009). Diese werden von vielen Befragten als Eingriff in ihre Privatsphäre betrachtet, daher wird eine Beantwortung verweigert („keine Angabe“) oder es wird angegeben, man wisse keine Antwort („weiß nicht“). Bei Fragen nach sichtbaren Merkmalen, wie z.B. dem Geschlecht, gibt es – selbstverständlich – weniger Item-Nonresponse-Probleme.29 Für den Umgang mit Item-Nonresponse und der damit verbundenen Missing Data-Problematik gibt es in der Forschungspraxis verschiedene Lösungsstrategien und statistische Korrekturverfahren. Meist werden die fehlenden Angaben aus bereits bekannten Informationen der Zielperson geschätzt (vgl. dazu Allison 2002; Little/Schlenker 1995; Little/Rubin 2002; Schnell 1986; aber auch Kroh 2006).30

29

Item-Nonresponse muss jedoch nicht allein auf den Befragten zurückzuführen sein. Auch Fehler in der Filterführung oder des Interviewers können dazu führen, dass für einen Teil der Merkmale Angaben eines Befragten fehlen. 30 Für eine ausführliche Bibliographie und exemplarische Analysen zu diesem Gebiet siehe auch www.missingdata.org.uk. Bei allen Modellen zur Schätzung fehlender Werte gilt aber ebenso, dass sie inhaltliche Modelle zum Ausfallprozess voraussetzen.

H. Proner, Ist keine Antwort auch eine Antwort?, DOI 10.1007/978-3-531-92721-3_2, © VS Verlag für Sozialwissenschaften | Springer Fachmedien Wiesbaden GmbH 2011

34

2 Nonresponse als Untersuchungsgegenstand

Unit-Nonresponse bedeutet hingegen, dass von einer zuvor ausgewählten Person überhaupt keine Daten direkt erfragt werden können. Da von diesen Zielpersonen in der Regel kaum Informationen vorliegen31, ist das Ersetzen der fehlenden Daten deutlich schwieriger bzw. nicht möglich. Der Fokus der vorliegenden Untersuchung liegt auf dieser Problematik des Ausfallens von Zielpersonen, weshalb im Folgenden auch immer Unit-Nonresponse gemeint ist, wenn vereinfachend von „Nonresponse“ gesprochen wird. Bereits die – scheinbar eindeutige – Unterscheidung zwischen Unit- und Item-Nonresponse ist jedoch nicht unproblematisch. Der Übergang zwischen beiden Kategorien ist fließend und es gibt keine festgelegte „Grenze“, wie groß der Anteil an nicht-beantworteten Fragen einer Person sein muss, damit der Befragte als Totalausfall, also als „Unit-Nonrespondent“, gewertet wird. Wenn das Interview beispielsweise vom Befragten an irgendeiner Stelle abgebrochen wird, steht der Forscher vor dem Problem, ob er die bis dahin erhobenen Daten verwenden kann oder nicht. Für die hier vorliegende Untersuchung wird definiert, dass es sich nur dann um Unit-Nonresponse handelt, wenn das Interview gar nicht erst beginnt und damit keine Daten aus Auskünften des Befragten existieren. Damit werden angefangene und dann abgebrochene Interviews ausgeschlossen und die Trennung zwischen Item- und Unit-Nonresponse am Extremwert eines (gedachten) Kontinuums angesetzt. Diese konservative Definition bietet die notwendige Trennschärfe für eine präzise Analyse der Ausfallgründe. Zugleich ermöglicht die Definition, die potenziellen Einflussfaktoren auf die Phase vor dem Interviewbeginn zu begrenzen. Sobald das Interview startet (auch wenn es später im Verlauf abgebrochen wird), wird von einer zunächst vorhandenen grundsätzlichen Kooperationsbereitschaft des Befragten ausgegangen, so dass dieser nicht als Nonrespondent erfasst wird.32 Von Unit-Nonresponse zu unterscheiden ist schließlich noch das Phänomen des Undercoverage. Darunter versteht man diejenigen Personen, über die man als Forscher zwar Aussagen treffen möchte, d.h. die zur Grundgesamtheit gehören, die jedoch schon aufgrund des Stichprobenverfahrens keine Chance haben, befragt zu werden. Das heißt, sie gehören zwar der Grund-, nicht aber der Auswahlgesamtheit an (vgl. Behnke et al. 2006: 136; Gehring/Weins 2004: 162f.; Schumann 2006: 85). So existieren beispielsweise Personen, die nicht im Einwohnermelderegister eingetragen sind, obwohl sie zur bundesdeutschen Bevölkerung gehören. Dazu gehören sowohl Personen, die zur so genannten „Anstaltsbevölkerung“ zählen (Gefängnisinsassen, Bewohner von Wohnheimen, Langzeitpatienten in Kliniken, etc.), aber auch z.B. Obdachlose (siehe für einen Überblick über die verschiedenen Bevölkerungsgruppen und eine Schätzung der jeweiligen Gruppengröße Schnell 1991: 106ff.). Zieht man nun eine Einwohnermeldeamtsstichprobe, um etwas über die 31

Ausnahmen sind bspw. das Geschlecht oder der Wohnort, die man bei Registerstichproben der Einwohnermeldeämter an den Namen und Adressen ablesen kann. 32 Empirisch zeigt sich, dass nur wenige Zielpersonen die Interviews abbrechen. Die meisten Interviews, die begonnen werden, können auch bis zum Ende durchgeführt werden (vgl. Schnell 1997: 123, 144, 168).

2.1 Definition

35

deutsche Bevölkerung auszusagen, werden diese Personen nicht erfasst. Das Phänomen des Undercoverage wird in dieser Arbeit jedoch nicht berücksichtigt, da es sich nach der oben angegebenen Definition nicht um Nonresponse im eigentlichen Sinn handelt. Voraussetzung dafür, dass eine Person als Nicht-Teilnehmer angesehen wird, ist im Folgenden also die grundsätzliche Chance, befragt zu werden.

2.1.2 Typologisierung von Unit-Nonresponse Unit-Nonresponse wird in der Umfrageforschung meist noch weiter kategorisiert bzw. typologisiert (vgl. Goyder 1987: 80; Swensson 1982). Die Typenbildung kann sowohl aufgrund empirischer als auch aufgrund theoretischer Annahmen erfolgen. Zunächst lassen sich empirisch unechte und echte Ausfälle differenzieren (vgl. etwa Statistisches Bundesamt 2009: 6). Als unechte Ausfälle werden dabei all diejenigen Ausfälle bezeichnet, die auftreten, weil Personen zwar in der Auswahlgesamtheit und damit in der Stichprobe sind, in der Feldzeit aber nicht mehr im Befragungsgebiet existieren, weil sie bspw. verstorben, ausgewandert oder unbekannt verzogen sind, weil es sich bei der Adresse nicht um einen Privathaushalt handelt oder weil die Adresse schlicht falsch ist und nicht existiert. Das bedeutet, dass es sich um Fälle handelt, die zum Zeitpunkt der Datenerhebung nicht mehr zur Grundgesamtheit gehören. Diese unechten Ausfälle werden auch als „qualitätsneutrale Ausfälle“ bezeichnet und es wird angenommen, dass sie bei der Feldarbeit (meist) gut erkannt werden können.33 Je kürzer der zeitliche Abstand zwischen der Stichprobenziehung und der Durchführung der Befragung ist, desto weniger unechte Ausfälle treten auf. Als echte Ausfälle werden hingegen all diejenigen Personen bezeichnet, die zwar existieren, von denen aber aus den unterschiedlichsten Gründen keine Daten erhoben werden können (siehe hierzu auch Esser et al. 1989: 96).34

33

Das Design der ALLBUS-Erhebung sieht beispielsweise vor, dass für qualitätsneutrale Ausfälle zuvor im Institut Ersatzadressen definiert werden, durch die diese Ausfälle dann substituiert werden können. Die Ersatzadressen werden eingesetzt, damit – wie es das gewählte mehrstufige Stichprobenverfahren fordert – in allen Primäreinheiten der Stichprobe die gleiche Anzahl an Bruttoadressen zum Einsatz kommt (vgl. etwa Wasmer et al. 2007; TNSInfratest Sozialforschung 2008: 28). 34 An dieser Stelle muss angemerkt werden, dass bereits diese Unterscheidung zwischen echten und unechten Ausfällen (und damit die Annahme „qualitätsneutraler Ausfälle“) eine empirische Einschränkung der theoretischen Annahmen ist. Streng genommen kann man nicht nachweisen, dass diese Ausfälle wirklich qualitätsneutral sind und damit nicht bereits selbst zu Verzerrungen führen. Es lassen sich Argumente finden, warum ein Teil der so genannten qualitätsneutralen Ausfälle nicht qualitätsneutral ist: Man kann bspw. annehmen, dass diejenigen, die häufig unbekannt verziehen, keine Chance haben, befragt zu werden. Diese unterscheiden sich aber inhaltlich von denjenigen, die befragt werden können, weil es sich in der Regel um mobilere, berufstätige, jüngere Menschen handelt.

36

2 Nonresponse als Untersuchungsgegenstand

2.1.3 Systematische und unsystematische Ausfälle Eine ähnliche, obgleich stärker theoretische Unterscheidung differenziert zwischen systematischen und unsystematischen Ausfällen. Unsystematische Ausfälle sind zufällige Ausfälle, die nicht mit den interessierenden Variablen zusammenhängen. In Bezug auf die Zielpersonen wird angenommen, dass ihre Teilnahmewahrscheinlichkeit völlig unabhängig von den interessierenden Merkmalen einer bestimmten Studie ist. Diese werden auch als „missing completely at random“ (MCAR) bzw. „missing at random“ (MAR) bezeichnet (vgl. Little/Rubin 2002; Rubin 1976, 1987; Stoop 2005: 35). Die daraus resultierenden Verzerrungen werden insgesamt als unproblematisch gewertet, da sie im ersten Fall (MCAR) mathematisch zufällig verteilt und damit berechenbar sind (vgl. das „Seperate Cause-Modell“, Groves 2006: 651; Groves/Peytcheva 2008: 168). Im zweiten Fall (MAR) sind die Ausfälle zwar nicht rein zufällig, aber zumindest die Mechanismen des Ausfalls sind (vollständig) bekannt. Aus diesem Grund können die Verzerrungen ebenfalls korrigiert werden, obgleich auch dabei bereits ein Verlust an Präzision auftritt (vgl. Lynn 1996: 211). Systematische Ausfälle („not missing at random“ = NMAR) hängen hingegen mit dem Thema der Befragung und/oder den interessierenden Merkmalen zusammen und führen zu systematischen Verzerrungen (vgl. Stoop 2005: 35; Bethlehem 2002). Für die empirische inhaltliche Analyse von Nonresponse in allgemeinen Bevölkerungsumfragen erscheint diese theoretische Differenzierung in systematische und unsystematische Ausfälle jedoch wenig nützlich. Aus verschiedenen Gründen lassen sich in den seltensten Fällen tatsächlich unsystematische Ausfälle annehmen. Zunächst handelt es sich bei allgemeinen Bevölkerungsumfragen meist um Mehrthemen-Umfragen, bei denen nur schwer differenziert werden kann, wie die Beziehung zwischen den einzelnen Themen und dem Ausfall ist. Hinzu kommt, dass selbst bei Einthemen-Befragungen die Determinanten und Wirkungszusammenhänge rund um das Thema höchst komplex und zudem meist unbekannt sind. Daher ist bei einem Ausfall nicht a priori einzuschätzen, ob es sich um einen systematischen oder einen unsystematischen Ausfall handelt. Prinzipiell sollte man daher bei allen Total-Ausfällen annehmen, dass sie zu Verzerrungen führen könnten, und sie aus diesem Grund einer genaueren Betrachtung unterziehen. Longford et al. konstatieren bereits: „The assumption that the process acts like simple random sampling (observations missing completely at random) is in most contexts rather optimistic“ (Longford et al. 2006: 509). Hinzufügen könnte man für die MAR-Fälle, dass es ebenso optimistisch erscheint anzunehmen, bereits alle Mechanismen der Ausfälle zu kennen.

2.1 Definition

37

2.1.4 Nicht-Erreichte, Nicht-Befragbare, Verweigerer Die nun fokussierten echten, potenziell systematischen Ausfälle können weiter kategorisiert werden. Am gebräuchlichsten ist dabei die empirische Unterscheidung von Nicht-Erreichten, Nicht-Befragbaren und Verweigerern. Nicht-Erreichte sind diejenigen Personen, die innerhalb der Feldzeit vom Interviewer nicht kontaktiert werden können. Zu den Nicht-Befragbaren werden diejenigen Personen gezählt, mit denen z.B. aufgrund von Sprachbarrieren keine Kommunikation möglich ist oder die aufgrund einer schweren Krankheit nicht interviewt werden können. Zu den Verweigerern gehören schließlich all jene, die zwar angetroffen werden, aber eine Teilnahme an der Befragung ablehnen und nicht kooperativ sind (vgl. etwa Brehm 1993: 40; Esser et al. 1989: 96; Groves/Couper 1998: 12; Koch 1997; Lievesley 1983; Scheuch 1974: 59f.; Schumann 2006: 104; siehe aber auch für z.T. abweichende Kategorisierungen Blom 2008: 22; Cochran 1972: 420f.; Kreutz 1970/71: 253; Leverkus-Brüning 1966). Wenn man diese Unterscheidung auf den zeitlichen Ablauf bei einer face-toface-Befragung anwendet, ist ein Typ von Unit-Nonresponse jeweils das Ausschluss-Kriterium für den nächsten (vgl. Brehm 1993: 40, siehe Abb. 3). Das bedeutet, wenn jemand nicht erreicht wird, ist eine weitere Differenzierung, ob die Zielperson befragbar oder kooperativ gewesen wäre, empirisch in der Regel nicht möglich. Abbildung 3:

Nonresponse als mehrstufiger Prozess Erreichbarkeit?

nein

ja nein

ja

ja

nein

Verweigerung

Kooperationsbereitschaft?

Interview Quelle: Eigene Darstellung nach Brehm (1993: 40) und Schnell (1997).

Nonresponse

Befragbarkeit?

38

2 Nonresponse als Untersuchungsgegenstand

Nur wenn die Zielperson (bzw. eine Auskunftsperson) erreicht wird, stellt sich die Frage, ob sie befragungsfähig ist. Und nur wenn jemand erreicht wurde und prinzipiell befragbar wäre, ist die Entscheidung relevant, ob diese Person auch kooperiert oder nicht. Auf dieser letzten Stufe steht die Handlungsentscheidung „Verweigerung“ oder „Kooperation“, die den Kern der Untersuchung darstellen soll. Dabei muss beachtet werden, dass diese Kategorienbildung eine empirische und keine systematisch-theoretische ist (vgl. Schnell 1997: 18ff.). Die Grenzen zwischen den Typen sind auch hier fließend. Gleichzeitig sind die Gründe für Nonresponse je nach Datenerhebungsmethode unterschiedlich und für die Interviewer und Forscher häufig nur schwer einzuschätzen. Das zeigt die Situationsschilderung eines durchaus prototypischen Falls bei einer persönlichen Befragung: „Ein Interviewer klingelt bei einer zuvor ausgewählten Adresse und möchte eine Umfrage durchführen. Ein Türspion existiert, der es der Zielperson ermöglicht, von innen zu sehen, wer vor der Tür steht. Keiner öffnet.“ Eine eindeutige Zuordnung durch den Interviewer, ob die Zielperson nun tatsächlich nicht zu Hause und damit nicht erreichbar ist, ob sie nicht an die Tür geht, weil sie schwer krank und daher nicht befragbar ist, oder ob sie die Teilnahme verweigert, ist in diesem Fall nicht möglich.35 Wahrscheinlich wird die Zielperson zunächst als „nicht erreicht“ klassifiziert. Empirisch werden in den meisten Studien nur diejenigen als Verweigerer bezeichnet, die explizit eine Verweigerungshaltung ausdrücken (vgl. Kreutz 1970/71: 243ff.). Es gibt jedoch auch Studien, die Personen auch dann als Verweigerer einordnen, wenn sie ein Interview aus Zeitgründen mehrfach aufschieben oder über einen längeren Zeitraum trotz häufiger Kontaktversuche nicht erreichbar sind (vgl. z.B. Schräpler 2000: 123; Steeh 1981: 41; Steeh et al. 2001). Gerade weil es sich bei der Einordnung der Fälle eher um eine empirische als um eine theoretische Kategorisierung handelt, sind präzise Intervieweranweisungen zur Einordnung jedes einzelnen Falls sowie die genaue Einzelfallkontrolle durch den Forscher für das Ergebnis einer Studie ausschlaggebend. Die Ausfallgründe müssen in der Feldphase möglichst detailliert protokolliert werden, wofür standardisierte Raster meist ungeeignet sind. Vielmehr ist ein flexibler und intensiver Kontakt zwischen Feldabteilung und Forscher notwendig. Ein Kritikpunkt an den gängigen Typologisierungen von Nonresponse zielt daher auch auf die fehlende Präzision und Nähe zur Umfragepraxis ab. Schnell konstatiert etwa, dass die Typologisierungen „dem tatsächlichen Geschehen bei Erhebungen […] kaum gerecht“ (Schnell 1997: 18) werden und fordert eine präzisere Analyse der Ausfallursachen je nach Forschungsdesign und Fragestellung (vgl. Schnell 1997: 18). Grundsätzlich werden aufgrund der genannten Schwierigkeiten bei der Differenzierung im weiteren Verlauf dieser Arbeit zunächst alle Personen untersucht, die in der Ausgangsstichprobe sind und von denen Informationen fehlen. D.h. es 35

Ähnlich verhält es sich, wenn bei einem telefonischen Kontaktversuch nur der Anrufbeantworter erreicht wird.

2.1 Definition

39

werden zunächst alle Unit-Nonrespondenten analysiert: Nicht-Erreichte, NichtBefragbare und Verweigerer. Die expliziten Verweigerer stehen jedoch bei den empirischen Analysen im Fokus des Interesses (vgl. Schnell 1997: 84). Für diese Entscheidung spricht sowohl ein theoretisches als auch ein empirisches Argument: Theoretisch ist bei diesen Zielpersonen am ehesten eine inhaltliche Verzerrung zu erwarten, da sie sich aktiv gegen eine Teilnahme an der politischen Umfrage entscheiden. Gründe dafür könnten z.B. Aversionen gegenüber dem Thema der Befragung sein. Das empirische Argument ist ein quantitatives: Die Verweigerer bilden in den meisten Studien36 die größte Gruppe unter den Nonrespondenten (siehe exemplarisch für den ALLBUS Abb. 4). Abbildung 4:

Das Ausmaß von Nonresponse im ALLBUS von 1992 bis 2006

50

40

30

20

10

0 1992

1994

1996

1998

nicht-erreicht West Verweigerer West nicht-befragbar West

2000

2002

2004

2006

nicht-erreicht Ost Verweigerer Ost nicht-befragbar Ost

Quelle: Eigene Darstellung, nach den Methodenberichten des ALLBUS 1992 -2006.

Aus diesem Grund würden bereits geringe Unterschiede zwischen Verweigerern und Teilnehmern zu deutlichen Verzerrungen führen. Da die Entscheidung zu kooperieren oder die Teilnahme zu verweigern damit im Vordergrund steht, liegt der Arbeit im weiteren Verlauf auch ein handlungstheoretisches Modell zugrunde, das von einer aktiven Entscheidung des potenziellen Befragten für oder gegen das Interview und damit für oder gegen eine Kooperation ausgeht.

36 Eine Ausnahme sind dabei Spezialstudien. So ist es plausibel, dass z.B. im medizinischen Bereich die Befragbarkeit von Teilnehmern ein Problem darstellt, bei Mobilitätsstudien die Erreichbarkeit.

40

2 Nonresponse als Untersuchungsgegenstand

2.2 Die empirische Analyse von Nonrespondenten 2.2.1 Das Paradoxon der Befragung von Verweigerern Das Grundproblem, dass es nicht befragungsbereite Personengruppen gibt, lässt sich nicht vollständig lösen. Von denjenigen, die sich weigern, Auskunft zu geben oder die Tür zu öffnen, lassen sich keine Informationen über politische Einstellungen und politisches Verhalten erheben. Wer soll daher im Folgenden tatsächlich untersucht werden? In der empirischen Analyse wird versucht, durch verschiedene ausschöpfungssteigernde Maßnahmen die Nonresponse-Quote einer Studie deutlich zu reduzieren und so stufenweise diejenigen zu erreichen, die unter Standardbedingungen nicht teilnehmen würden (vgl. ein ähnliches Design für eine Telefonstudie bei Keeter et al. 2000). Es wird angenommen, dass man von denjenigen, die zunächst nicht an der Befragung teilnehmen wollen, dann aber durch verschiedene ausschöpfungssteigernde Mittel doch noch überzeugt werden können und schließlich auf einer späteren Stufe innerhalb des Forschungsdesigns bereit sind, Auskunft zu geben, etwas über die endgültigen Verweigerer erfahren kann. Wenn man auf der Grundlage dieser spät überzeugten Zielpersonen Prognosen über die Nicht-Teilnehmer abgibt, steht dahinter eine kontinuierliche Vorstellung der Teilnahmeentscheidung. Es wird angenommen, dass am einen Ende des Kontinuums diejenigen stehen, die unter Normalbedingungen sofort teilnehmen (Kooperative). Dann folgen diejenigen, die eine Teilnahme zunächst ablehnen oder nicht erreicht werden und daher bei „Normalstudien“ zu den Nonrespondenten zählen würden, und die lediglich durch bestimmte Maßnahmen dazu bewogen werden können, doch noch teilzunehmen (Konvertierte). Und schließlich bilden diejenigen, die eine Teilnahme verweigern, das andere Ende des Kontinuums (Nonrespondenten). Von den Konvertierten wird schließlich angenommen, dass sie den endgültigen Nonrespondenten ähnlicher sind als den Kooperativen. Diese kontinuierliche Vorstellung von Nonresponse ist in der Forschung nicht unumstritten. Einige Kritiker zeigen empirisch, dass sich eine Verzerrung durch Nonresponse nicht exakt auf der Basis der von den Konvertierten erhaltenen Informationen schätzen lässt. Sie konstatieren jedoch gleichzeitig, dass durch die Vorgehensweise eine inhaltliche Annäherung an die Richtung der Verzerrung möglich ist (vgl. etwa bereits Pace 1939; auch Andersen et al. 1979; DeMaio 1980; Ellis et al. 1970; Smith 1984; Stinchcombe et al. 1981). Das würde bedeuten, man könnte über die Konvertierten eine Vorstellung davon erhalten, in welche Richtung die Verzerrung verläuft, ohne konkret schätzen zu können, wie groß die Verzerrung für einzelne Merkmale letztendlich ist. Dieses Argument spricht dafür, die Konvertierten als Annäherung an die endgültigen Nonrespondenten zumindest zu untersuchen. Gleichzeitig muss man einschränkend erwähnen, dass sich auf dieser Grundlage keine genauen Prognosen über die Gesamtverteilungen abgeben lassen.

2.2 Die empirische Analyse von Nonrespondenten

41

Stoop (2004: 44) und Neller (2005: 28) stellen in ihren Nonresponse-Studien für einzelne – allerdings soziodemographische – Merkmale fest, dass sich die konvertierten Verweigerer deutlich von den Nicht-Konvertierbaren unterscheiden und den Kooperativen, die man bereits ohne verstärkte Maßnahmen erreicht, ähnlicher sind. Sie folgern, dass Konvertierungsmaßnahmen daher sogar zu einer Verstärkung des Problems systematischer Verzerrungen führen. Allerdings existieren auch gegenteilige Ergebnisse, die darauf hinweisen, dass Konvertierungsmaßnahmen zur Reduzierung von Stichprobenfehlern geeignet sind. Für die Merkmale Geschlecht, Bildung sowie für das Politikinteresse zeigen Studien zum European Social Survey (ESS) etwa, dass die Konvertierten den Nonrespondenten ähnlicher sind als den Kooperativen und eine Konvertierung tendenziell zur Reduktion des NonresponseBias beiträgt (vgl. Phillippens/Billiet 2004). Keeter et al. (2000) weisen nach, dass kaum Unterschiede zwischen Respondenten und Konvertierten existieren. Zudem zeigen sie, dass es von den untersuchten Merkmalen abhängt, ob man die Verzerrungen reduzieren kann oder nicht. Letztlich muss man feststellen, dass in dieser Frage kein eindeutiger Forschungsbefund existiert. Die empirische Analyse kann für einen Teil der Merkmale jeweils zeigen, inwiefern eine kontinuierliche Vorstellung von Nonresponse gerechtfertigt ist. Die bisherigen, sehr heterogenen Forschungsergebnisse lassen vermuten, dass es sich um eine Frage des Ausschöpfungsniveaus handelt. Wahrscheinlich erreicht man durch Konvertierungsmaßnahmen zunächst diejenigen, die auch in der Hauptbearbeitung erreicht wurden („more of the same“). Man kann jedoch annehmen, dass man mit steigender Ausschöpfung auch die extremeren Fälle erreicht, die im Datensatz unterrepräsentiert sind. Ob es damit insgesamt zu einer „Verbesserung“ der Datenqualität kommt, hängt in einem solchen Fall davon ab, wie hoch das Konvertierungsniveau ist und um welche Merkmale es sich handelt. Da man bei bestimmten Merkmalen die tatsächlichen Verteilungen in der Grundgesamtheit weder weiß noch schätzen kann, kann man auch keine Bewertung abgeben. Im folgenden Abschnitt soll nun zunächst der Untersuchungsgegenstand auf ein bestimmtes Studiendesign eingegrenzt werden. Dies ermöglicht die von Schnell (1997: 18) geforderte präzise Analyse der einzelnen Stufen des Partizipationsprozesses und damit in der Folge auch die Formulierung eines theoretischen Konzepts zur Teilnahme an Umfragen.

2.2.2 Nonresponse im ALLBUS Eine der umfangreichsten Datenquellen für die empirische Sozialforschung ist das Angebot der Allgemeinen Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS). Die Daten des ALLBUS sind in der empirischen Wahl- und Einstellungsforschung eine der wichtigsten Quellen für Sekundäranalysen, da sie nach

42

2 Nonresponse als Untersuchungsgegenstand

ihrer Erhebung allen interessierten Personen und Institutionen schnell und kostengünstig zur Verfügung stehen und eine hohe Datenqualität aufweisen. Seit 1980 werden in der Trendstudie alle zwei Jahre persönlich-mündliche Befragungen durchgeführt, die sowohl einen festen Fragenkern als auch variable Themenmodule beinhalten. Alle zehn Jahre werden bestimmte Module repliziert, einzelne Items sogar häufiger. Aus diesem Grund bieten die Daten des ALLBUS die Möglichkeit, im Aggregat Entwicklungen über die Zeit zu verfolgen. Die Grundgesamtheit des ALLBUS bestand bis einschließlich 1990 aus allen wahlberechtigten Personen der Bundesrepublik (inklusive West-Berlin), die in Privathaushalten lebten. Nach der Wiedervereinigung wurde die Definition der Grundgesamtheit verändert und besteht seither aus der erwachsenen Wohnbevölkerung (vgl. Wasmer et al. 2007: 4). Die Stichprobenziehung des ALLBUS erfolgte in den ersten Jahren zunächst im ADM-Design (vgl. Arbeitsgemeinschaft ADM-Stichproben und Bureau Wendt 1994; Behrens/Löffler 1999).37 In den Jahren 1994 und 1996 sowie seit dem Jahr 2000 liegt der Erhebung eine Registerstichprobe der Einwohnermeldeämter zugrunde. Dabei handelt es sich um eine zweistufige, disproportional geschichtete Zufallsauswahl. Auf der ersten Stufe werden Gemeinden, proportional zur Anzahl der in ihr lebenden erwachsenen Einwohner, ausgewählt. In der zweiten Auswahlstufe werden von den Einwohnermeldeämtern Personen nach einem vorgegebenen systematischen Zufallsverfahren gezogen. Der Vorteil einer derartigen Registerstichprobe ist, dass die Zielpersonen vor der Feldphase eindeutig festgelegt sind und nicht erst, wie in Random Walk-Designs, vom Interviewer ermittelt werden müssen. Die Daten des ALLBUS werden seit dem Jahr 2000 in computergestützten persönlich-mündlichen Interviews (CAPI) erhoben (vgl. Wasmer et al. 2007: 5). Dem empirischen Teil dieser Arbeit liegen Daten aus dem ALLBUS 2008 und einer daran angegliederten Methodenstudie (ALLBUS+) zugrunde. Daher wird der Untersuchungsgegenstand zunächst auf die Nicht-Teilnehmer an einer CAPIStudie auf der Basis einer zweistufigen Einwohnermeldeamts-Registerstichprobe eingegrenzt, da bei der Verwendung anderer Stichprobenverfahren oder Erhebungsmethoden auch andere Ausfallgründe auftreten können. Für eine derartige persönliche Befragung lassen sich verschiedene Stufen des Partizipationsprozesses unterscheiden, bei denen ein Ausfall der zuvor ausgewählten Person auftreten kann (vgl. Schnell 1997: 18; Groves/Couper 1998: 26). Die erste Stufe bezieht sich auf die Bearbeitung der Adresse. Dabei ist zu fragen, ob eine Adresse überhaupt vom Interviewer besucht wurde und ob die zuvor angegebene Person auch dort wohnt. Bereits bei dieser ersten Phase kann aus verschiedenen Gründen ein Ausfall einer zuvor ausgewählten Adresse auftreten. Ein Interviewer könnte, beispielsweise auf37

Beim ADM-Design handelt es sich um ein dreistufiges Stichprobenverfahren. Auf der Basis der statistischen Bezirke werden zunächst ca. 60.000 sample points, d.h. Stimmbezirke, gebildet und davon einzelne proportional zu ihrer Größe (PPS-Design) ausgewählt. Diese Gebiete sind die Auswahlgrundlage für die Adressen, die mithilfe des Random Route-Verfahrens ausgewählt werden. Schließlich wird mithilfe des Schwedenschlüssels (Kish 1949) oder mit der Geburtstagsmethode in den Haushalten eine Zielperson ermittelt (vgl. ADM 2003: 20).

2.2 Die empirische Analyse von Nonrespondenten

43

grund einer Erkrankung, die ihm gelieferten Adressen nicht in der Feldzeit bearbeiten oder er findet eine bestimmte Adresse nicht. Auf dieser Stufe kann ein Ausfall verhindert werden, wenn die Interviewer in direktem Kontakt zur Feldabteilung stehen: Im Krankheitsfall würde dann der Interviewer ausgetauscht; wenn die Adresse nicht existiert oder die Zielperson verstorben ist, würde die Adresse als qualitätsneutraler Ausfall (siehe Kap. 2.2) direkt ersetzt. Die Praxis zeigt jedoch, dass auf dieser Stufe bereits vereinzelt Nonresponse auftritt, ohne dass dies mit der Entscheidung einer Zielperson zusammenhängt. Auf die Adressbearbeitung folgt die zweite Phase der Kontaktaufnahme, d.h. die Frage, ob ein Kontakt zustande kommt und jemand an der Adresse angetroffen wird. Dabei beginnt die erste Interaktionsphase, nämlich die Kommunikation zwischen Interviewer und erstem Ansprechpartner, wobei eine sinnvolle Verständigung mit dem Ansprechpartner notwendig ist. Zugleich muss dieser auch kooperativ sein, d.h. den Zugang zur Zielperson ermöglichen. Wenn die Ansprechperson bereits die Teilnahme für die Zielperson verweigert und keinen Kontakt ermöglicht, kann auch an dieser Stelle bereits ein Ausfall erfolgen, der unter Umständen unabhängig von der Entscheidung der Zielperson ist. Allerdings gibt es hier die Möglichkeit, durch weitere Kontaktversuche den Zugang zur Zielperson zu ermöglichen. Eventuell erhält der Interviewer an dieser Stelle auch die Information, dass die Zielperson nicht befragbar ist. Diese Phase der Kontaktierung eines Ansprechpartners wird übersprungen, wenn es sich beim ersten Kontakt schon direkt um die Zielperson handelt. Wenn der Kontakt zur Zielperson hergestellt ist, muss geklärt werden, ob mit ihr eine sinnvolle Verständigung möglich ist und eine Befragung durchgeführt werden kann. Im Falle der Kooperationsbereitschaft der Zielperson, kann das Interview beginnen. Wenn sich die Zielperson für eine Teilnahme entscheidet, können theoretisch, nach der zuvor aufgestellten Definition von Unit-Nonresponse, keine Ausfälle mehr auftreten. In der Umfragepraxis können jedoch technische Probleme im Nachhinein noch zu Ausfällen führen. Dies ist der Fall, wenn beispielsweise nicht alle Daten im Computer gespeichert sind oder im Nachhinein Fehler und Fälschungen zutage treten und Fälle ausgeschlossen werden. Auch muss die Befragung einer Zielperson noch innerhalb der Feldzeit liegen, damit sie in die Auswertung eingehen kann. Für die Haupt-Fragestellung dieser Arbeit ist diese Phase der Interaktion zwischen Interviewer und Zielperson sehr wichtig. In dieser Phase entscheidet der Befragte, ob er partizipieren kann und will oder eben eine Teilnahme verweigert. Nachdem nun die zentralen Begrifflichkeiten theoretisch erläutert und die Annäherung an die empirische Analyse von Nonrespondenten beschrieben wurde, befasst sich das nächste Kapitel mit dem Forschungsstand zur inhaltlichen Auseinandersetzung mit denen, die nicht an Umfragen teilnehmen. Daraus sollen die relevanten Annahmen abgeleitet werden, die anschließend zur Modellierung der Erklärung der Teilnahme benötigt werden.

3 Der Forschungsstand: Von theoretischem Vakuum zu komplexen Analysen

3.1 Problemwahrnehmung und bivariate Einzelerkenntnisse 3.1.1 Erste Schritte der Nonresponse-Forschung Nonresponse, d.h. der Ausfall von Zielpersonen, ist kein neues Phänomen in der Umfrageforschung. Erste Pionierstudien finden sich bereits in der psychologischen Methodenforschung der 20er Jahre des 20. Jahrhunderts (siehe Toops 1923, 1926; Crossley/Fink 1951; vgl. Porst/von Briel 1995: 4; Neller 2005: 11). In den 1940er und 1950er Jahren erreichte die Thematik in der amerikanischen Umfrageforschung, die der deutschen Umfrageforschung in der Zeit nach dem Zweiten Weltkrieg einige Jahrzehnte voraus war, größere Popularität (vgl. Smith 2002b: 27). Weitgehender Konsens war bereits in dieser frühen Zeit, dass die Annahme, Respondenten seien im Allgemeinen ein repräsentatives Abbild der Grundgesamtheit, nicht aufrecht erhalten werden kann (vgl. Hansen/Hurwitz 1946). Allerdings wurde zugleich noch davon ausgegangen, dass dieses Problem hauptsächlich schriftliche Befragungen beträfe und bei persönlichen Befragungen empirisch weniger relevant sei. Für diese wurde angenommen, dass „personal interviews generelly elicit a substantially complete response“ (Hansen/Hurwitz 1946: 517). Die Realität zeigt jedoch, dass sich diese Annahme einer vollständigen Ausschöpfung auch bei persönlichen Befragungen nicht aufrechterhalten lässt. Durch die Verbreitung der Umfrage als Methode der empirischen Sozialforschung wurde die Diskussion um Nonresponse angeregt, was zu einer ersten Hochphase der Forschung führte. Zwar konstatierte George Gallup, Pionier der amerikanischen Umfrageforschung, in den vierziger Jahren: „when samples are correctly selected, they do reflect opinions of the entire nation“ (Gallup 1944: 21), dies ist jedoch eine verkürzte Darstellung der Realität: Die korrekte Stichprobenziehung ist eine notwendige, aber keine hinreichende Bedingung für die Genauigkeit und Repräsentativität von Stichproben. Die ausgewählten Personen müssen eben auch teilnehmen wollen und können. Da dies aber in der Praxis der Umfrageforschung nicht für alle Elemente der ausgewählten Stichproben gegeben ist, entstanden erste Forschungsprojekte zu den Nicht-Teilnehmern. Gaudet und Wilson (1940) fragten „Who escapes the personal investigator?“, zehn Jahre später beschrieb Barnette (1950) „The Non-Respondent Problem in Questionnaire Research“ und auch Benson et al. (1951) stellten Überlegungen an, was diejenigen ausmacht, die eine Teil-

H. Proner, Ist keine Antwort auch eine Antwort?, DOI 10.1007/978-3-531-92721-3_3, © VS Verlag für Sozialwissenschaften | Springer Fachmedien Wiesbaden GmbH 2011

3.1 Problemwahrnehmung und bivariate Einzelerkenntnisse

45

nahme an einer Befragung verweigern.38 Die Kernaussage ist bereits in diesen frühen Studien, dass es gute Gründe gibt anzunehmen, dass sich diejenigen Personen, die sich nicht an Umfragen beteiligen, signifikant von den Teilnehmern unterscheiden. Zudem wurden bereits systematische Fehler angenommen und damit unterstellt, dass sich die Unterschiede nicht nur auf einzelne soziodemographische Merkmale, sondern auch auf die eigentlich interessierenden inhaltlichen Variablen beziehen (vgl. z.B. Lundberg/Larsen 1949; Reuss 1943; für einen Überblick siehe Ellis et al. 1970). Allerdings bleibt es meist bei plausiblen Erklärungen, wie sich Verzerrungen aufgrund von Nonresponse auswirken könnten, ohne dass empirische Überprüfungen der Annahmen oder eine theoretischen Fundierung der Teilnahmeentscheidung erfolgen. Daher fehlen gesicherte Erkenntnisse, wie sich der Unterschied zwischen beiden Personengruppen konkret darstellt und auf welche Variablen er sich aus welchen Gründen bezieht. Zudem beziehen sich die Analysen – mit Ausnahme der Studie von Gaudet und Wilson (1940) – weiterhin vor allem auf die zu dieser Zeit sehr populären schriftlichen Befragungen sowie auf QuotenStichproben und willkürliche Auswahlen. Gerade bei diesen weiß man jedoch nichts über den Ausfallprozess an sich und kann daher lediglich Spekulationen über diejenigen, die nicht teilnehmen, anstellen. Die Forschung zeichnet damit zunächst ein sehr bruchstückhaftes Bild der Determinanten von Nonresponse. Die abhängige Variable ist meist pauschal die aggregierte Nonresponse-Quote einer Befragung und nicht die Entscheidung eines Individuums, an einer Befragung teilzunehmen oder nicht. Die gewonnenen Erkenntnisse werden kaum repliziert und überprüft und können damit auch nicht als empirisch gesichert bezeichnet werden. Fitzgerald und Fuller bemerken durchaus zu Recht auch noch in den 1980er Jahren: „The literature on nonresponse provides few replicated findings“ (Fitzgerald/Fuller 1982: 3; vgl. auch Goyder 1987: 80; Neller 2005: 11). Es lassen sich jedoch erste grundsätzliche Annahmen erkennen: Unstrittig ist, dass die Verzerrung von Umfrageergebnissen durch Nonresponse (Nonresponse-Bias) grundsätzlich von zwei Faktoren abhängig ist, wobei jeder davon notwendigerweise ungleich Null sein muss: Erstens von der Höhe der Nonresponse-Quote, also davon, wie viele der zunächst ausgewählten Personen nicht teilnehmen. Zweitens hängt das Ausmaß der Verzerrung von der Größe des Unterschieds zwischen Respondenten und Nonrespondenten ab (vgl. Cochran 1972: 415; Curtin et al. 2000: 414; Deming 1960: 66f.; Groves/Couper 1998: 1ff.; Groves et al. 2006: 722ff.; Kish 1967: 532ff.; Koch 1998: 67ff., 2002: 31). Dieser so bezeichnete Nonresponse-Bias kann vom reinen Messfehler unter-

38 Sie erreichten in einer Befragung zunächst nur eine Ausschöpfungsquote von 56 Prozent (136 von 230 Adressen), befassten sich dann in weiteren Stufen intensiv mit den Verweigerern und konnten im Verlauf der Feldzeit 229 der 230 Zielpersonen doch noch von einer Teilnahme überzeugen (vgl. Benson et al. 1951: 118). Allerdings gab es in dieser Studie eine recht vage formulierte Auswahlregel der Zielpersonen („a responsible adult“) innerhalb der Haushalte (Benson et al. 1951: 116).

46

3 Der Forschungsstand

schieden werden, so dass man von zwei unterschiedlichen Fehlertermen sprechen muss (vgl. Biemer/Lyberg 2003: 39; Olson 2006: 739). Möchte man beispielsweise auf der Grundlage von Umfragedaten eine Aussage über einen Mittelwert (= x ) angeben (z.B. die durchschnittliche Sympathie für einen Politiker), lässt sich die Verzerrung aufgrund von Nonresponse folgendermaßen darstellen (vgl. Bethlehem 1988; Biemer/Lyberg 2003: 85; Erbslöh/Koch 1988; Groves 2006: 648; Koch 1998: 67). Abbildung 5:

Bias NR

Der Nonresponse-Fehler

x R

x NR

n NR n R n NR

BiasNR = Verzerrung durch Nonrespondenten xR = Mittelwert der Teilnehmer xNR nR nNR

= Mittelwert der Nicht-Teilnehmer = Fallzahl Teilnehmer = Fallzahl Nicht-Teilnehmer

Quelle: Eigene Darstellung.

Der vordere Teil des Terms (=1. Faktor) beinhaltet dabei den Unterschied zwischen Respondenten und Nonrespondenten, der zweite Teil des Terms (=2. Faktor) beinhaltet den Anteil der Nonrespondenten an der Ausgangsstichprobe. Wenn einer der beiden Faktoren gegen Null geht, ist das gesamte Produkt sehr klein. Das bedeutet, wenn die Ausschöpfung nahe an 100 Prozent ist, ist der letzte Teil der Gleichung minimal. Damit ist auch nur wenig Verzerrung zu erwarten. Wenn es keinen bzw. fast keinen Unterschied zwischen den Mittelwerten von Respondenten und Nonrespondenten gibt, ist der vordere Teil der Gleichung minimal. Dann sind, unabhängig von der Ausschöpfung, ebenfalls kaum Verzerrungen zu erwarten. Empirisch ist davon auszugehen, dass zumindest die Ausschöpfung nicht nahe an 100 Prozent liegt und damit der hintere Teil der Gleichung deutlich größer ist als Null. Daher sind Verzerrungen möglich, sobald sich der erste Teil des Terms von Null unterscheidet. Teilnehmer und Nicht-Teilnehmer einer Studie sollten daher genauer im Hinblick auf den ersten Faktor des Terms, d.h. ihre Unterschiede hin, untersucht werden.39

39 Groves (2006: 648ff.) kritisiert, diese Darstellung impliziere, dass Nonresponse etwas Konstantes sei, eine feste Eigenschaft von Personen. Dies träfe jedoch nicht zu, da es sich bei vielen Menschen bei der Teilnahmebereitschaft um eine variable Wahrscheinlichkeit handele, die je nach Situation zu Kooperation oder Verweigerung führen könne. Daher bevorzugt er andere, differenziertere Darstellungsformen des Nonresponsebias, wie etwa bei Bethlehem (2002) (vgl. Groves 2006: 648ff.). Auch Tourangeau et al. (2000: 320) formulieren den Bias eines Parameters durch Nonresponse allgemeiner als BNR PNR (YR YNR ) bzw. Bezug nehmend auf die Response

Propensity-Modelle zur Schätzung der individuellen Teilnahmebereitschaft: B NR ( yˆ )

cov( p i , Y i ) (1 p ) Y .

Für den hier verfolgten Zweck der Unterscheidung der beiden Elemente Ausschöpfungshöhe und Unterschied zwischen Respondenten und Nonrespondenten ist die oben gewählte Formel von Koch (1998) jedoch immer noch am anschaulichsten.

3.1 Problemwahrnehmung und bivariate Einzelerkenntnisse

47

3.1.2 Das Ausmaß von Nonresponse und die Diskussion um Ausschöpfungen In der Forschung beobachtete man jedoch zunächst verstärkt den zweiten Faktor, d.h. die Ausschöpfung. Ein wichtiger Untersuchungsgegenstand war die Entwicklung von Nonresponse-Raten im Zeitverlauf und damit das Ausmaß von Nonresponse (vgl. de Leeuw/de Heer 2002; Groves 1989; Lyberg/Rapaport 1979; Steeh 1981; Steeh et al. 2001; Synodinos/Yamada 2000). Die These steigender Nonresponse-Quoten über die Zeit wurde dabei, sowohl für einzelne Länder als auch international vergleichend, sowohl für persönlich-mündliche Befragungen als auch für andere Erhebungsmodi, empirisch weitgehend bestätigt (siehe die empirischen Studien von Baim 1991; Bradburn 1992; Brehm 1993, 1994; Brown 1994; Curtin et al. 2000, 2005; Daniel 1975; Fan 1994; Groves 1989; Groves/Lyberg 1988; Remington 1992; Schorr 1992; Singer/Martin 1994). So verwundert es nicht, wenn Bradburn (1992: 392) konstatiert: „We all believe strongly that response rates are declining and have been declining for some time“. Auch Brehm (1994: 45) stellt zusammenfassend fest: „Response rates for all surveys – academic, government, business, media – have been falling since the 1950s.“40 Eine Unterscheidung des Verlaufs nach den verschiedenen Ausfall-Typen, d.h. der Verweigerer, Nicht-Kontaktierten und Nicht-Befragbaren, ist jedoch zugleich selten und stellt damit eine Forschungslücke dar (vgl. Brehm 1994; Steeh 1981; Steeh et al. 2001). Hinzu kommt das Fehlen einer einheitlichen Definition von Ausschöpfungsquoten. Damit verbunden ist, dass es auch keine standardisierte Berechnung der Nonresponse-Quote gibt. Es existieren vielmehr zahlreiche unterschiedliche Möglichkeiten, die Ausschöpfung einer Studie zu bestimmen und anzugeben (vgl. Groves 1989: 136, 140ff.; Jowell 1998: 171; Schnell 1997: 19ff.; Stoop 2005: 27).41 Diese Unterschiede verhindern eine angestrebte Vergleichbarkeit der NonresponseRaten über die Zeit und relativieren Aussagen über Trendentwicklungen. Schließlich erschwert auch die fehlende Konstanz bei den Forschungsdesigns und der Feldarbeit präzise Aussagen über das Ausmaß von Nonresponse. Es werden nur 40

Es existieren jedoch auch gegenteilige Positionen, welche die empirische Evidenz der Hypothese generell sinkender Ausschöpfungsquoten zumindest kritisch beobachten und vor allem die daraus gezogenen pauschalen Schlussfolgerungen in Frage stellen (vgl. Gonzales et al. 1994, 1995; Marquis 1979; Singer 2006; Smith 1995). Dabei ist das zentrale Argument, dass sinkende Response-Quoten noch nichts darüber aussagen, welcher Typ Nonresponse sich wie über die Zeit entwickelt (vgl. de Heer/Israels 1992). Stabile Nonresponse-Raten könnten sowohl Stabilität als auch Variabilität innerhalb der einzelnen Kategorien von Nonresponse bedeuten. So könnte beispielsweise die Zahl der Nicht-Erreichten absinken, während die Zahl der Verweigerer deutlich ansteigt. Das Resultat wären gleichbleibende Gesamtquoten. Wenn es unterschiedliche Ursachen für einzelne NonresponseArten gibt, kann eine solche Variabilität zu unterschiedlichen Verzerrungen über die Zeit führen, die sich nicht in den stabilen Gesamtwerten widerspiegeln müssen (vgl. Groves 1989: 146; Stoop 2005: 31). 41 Die Unterschiede in den Berechnungsformeln haben meist damit zu tun, ob Ausfälle als stichprobenneutral oder systematisch eingestuft werden (vgl. Neller 2005: 10), gleichzeitig variieren sie auch mit unterschiedlichen Stichprobenverfahren. Einige Organisationen (z.B. AAPOR 2009), aber auch Einzelautoren (Lynn et al. 2002) haben versucht, präzise Definitionen für Gebiete oder einzelne Länder durchzusetzen. Es bleibt jedoch das Problem, dass bei vielen Datenerhebungen auf Auskünfte zur Ausschöpfung verzichtet wird und wenn Ausschöpfungen angegeben werden, die Art und Weise des Zustandekommens der Quoten wenig transparent ist (vgl. Couper/de Leeuw 2003; Groves/Couper 1998; Neller 2005; Schnell 1997: 48ff.; Smith 1995, 2002a).

48

3 Der Forschungsstand

selten Informationen publiziert, die Aufschluss über den Aufwand geben, der betrieben wird, um gewisse Ausschöpfungen zu erreichen (vgl. Schnell 1997; Stoop 2005).42 Zwar wird oft angenommen, dass gleichbleibende Ausschöpfungen mit gestiegenem Aufwand der Institute verknüpft sind (vgl. etwa Erbslöh/Koch 1988: 30), Belege dafür lassen sich jedoch nicht finden (vgl. Schnell 1997: 130).43 Auch der Blick auf die deutschsprachige Forschung über das Ausmaß von Nonresponse in Umfragen zeigt aus den bereits genannten Gründen, dass man keinen eindeutigen empirischen Trend allgemein ansteigender Nonresponse-Raten erkennen kann. Vielmehr muss das Problem auch hier differenziert betrachtet werden. Schnell (1997) weist in einer Metaanalyse zwar nach, „daß die Ausschöpfungsraten in allen Surveys von 1970 bis 1990 um ca. 5% sinken“ (Schnell 1997: 130). Er gibt aber gleichzeitig zu bedenken, dass sich die Ausschöpfungen signifikant je nach Surveytyp (kommerziell, akademisch, Mediaanalysen), Erhebungsperiode, Institut und Nonresponse-Typ (Verweigerer, Nicht-Erreichte, Sonstige) unterscheiden (vgl. Schnell 1997: 77ff.). Man kann demnach festhalten, dass zum Ausmaß und zur Entwicklung von Nonresponse-Raten über die Zeit zahlreiche heterogene empirische Befunde existieren. Der wahrgenommene Trend verändert sich, wenn verschiedene Typen von Nicht-Teilnehmern untersucht werden und wenn Einschränkungen in der Aussagekraft aufgrund verschiedener Designvariationen vorgenommen werden (müssen). Dies bedeutet wiederum, dass Aussagen zum Ausmaß von Nonresponse immer nur für eine präzise definierte Umfrageform, ein bestimmtes Design und bestimmte Nonresponse-Typen möglich sind. Die Ausschöpfungsquoten sind kontextabhängig, d.h. das Phänomen muss im Rahmen eines einzelnen Studientyps substanziell analysiert werden. Generalisierte Aussagen sind in diesem Bereich der Methodenforschung wenig erfolgversprechend (vgl. Engel et al. 2004: 44; Stoop 2005). Für die allgemeine Bevölkerungsumfrage der Sozialwissenschaften, den ALLBUS, der eine der größten deutschen sozialwissenschaftlichen Trendstudien ist, zeigt die Analyse der Ausschöpfungsquoten von 1992 bis 2006 (siehe Abb. 4, Kap. 2.1.2.2) schwankende Quoten, die sich in den einzelnen Jahren deutlich unterscheiden. Gerade der Anteil der Verweigerer steigt im Zeitverlauf – trotz weitge42

Selbst wenn man konstante Kategorien hat, welche Ausfälle stichprobenneutral und welche dies nicht sind, ist ein Vergleich über die Zeit problematisch. Es könnte ja bei zwei Studien mit der gleichen Ausschöpfung von 75% jeweils unterschiedlicher Aufwand betrieben worden sein, um diese Ausschöpfungen zu erreichen. Hinzu kommen Unterschiede in den Verfahren der Stichprobenziehung oder in der Feldarbeit. Selbst in Längsschnittanalysen werden die Methoden durch technische Neuerungen verändert. Ein Beispiel dafür ist die Umstellung des ALLBUS von PAPI auf CAPI. Gleichzeitig können sich Nonresponse-Raten durch unterschiedlich lange Befragungsintervalle verändern. Langzeitstudien mit vielen Erhebungswellen und konstantem Design fehlen, welche jedoch zur Zeitreihenanalyse besonders wünschenswert wären, um das „Rauschen“ auszugleichen, das sich durch unterschiedliche Befragungsrhythmen und Zeitabstände zwischen einzelnen Wellen ergibt. Groves/Couper stellen bereits 1998 fest: „We believe trends in nonresponse rates may appropriately be measured in terms of decades than years“ (Groves/Couper 1998: 159). 43 Auf diese Probleme weisen de Heer/Israels (1992) zu den „Response Trends in Europe“ hin, wenn sie für neun europäische Länder vergleichend zeigen, dass es keine klare Tendenz allgemein sinkender Ausschöpfungen gibt (vgl. de Heer/Israels 1992: 100f.).

3.1 Problemwahrnehmung und bivariate Einzelerkenntnisse

49

hend konstanter Feldarbeit – an. Eines lässt sich damit, trotz der angesprochenen Probleme zur Vergleichbarkeit von Ausschöpfungen, sicher konstatieren: Erstens kann ein bestimmter Teil der angestrebten Population nicht befragt werden und zweitens verschwindet dieses Phänomen nicht im Zeitverlauf. Je nach Studie und Design gibt es einen (unterschiedlich hohen) Anteil der Bevölkerung, der mit den Standardprozeduren nicht erreicht werden kann. Meist sind explizite Verweigerungen ausschlaggebend für die Nicht-Teilnahme, seltener Nicht-Erreichbarkeit und Nicht-Befragbarkeit. Zugleich kann man feststellen, dass vermutlich in den meisten sozialwissenschaftlichen Mehrthemenbefragungen, wie dem ALLBUS, die Verweigerungen den überwiegenden Teil der Nonrespondenten ausmachen (siehe Abb. 4, Kap. 2.1.2.2). Doch hat sich die Forschung aus diesem Grund einer inhaltlichen Analyse der Verweigerer gewidmet? Die Antwort lautet: Nicht direkt. Der Fokus verblieb zunächst bei den Ausschöpfungen und der Frage, wie diese über Designvariationen oder den Interviewereinsatz erhöht werden können (vgl. Alreck/Settle 1995: 184). Die Fokussierung der Forschung auf das Ausmaß von Nonresponse lässt sich leicht erklären: Die erreichte Ausschöpfung – und damit nur eine Seite der Medaille – wurde lange Zeit als einfaches Qualitätskriterium für Studien angesehen: „For many years, it seemed as if the design of the sample and the response rate were the only two indicators of a survey’s quality“ (Fowler/Mangione: 1990: 142). Diese Grundannahme spiegelt sich auch in der Literatur zur Umfrageforschung wider: „A response rate of 50 percent is adequate for analysis and reporting. A response of 60 percent is good. And a response rate of 70 percent is very good” (Babbie 1998: 262)44 oder: „For interview surveys, a response rate of 85 percent is minimally adequate; below 70 percent there is a serious chance of bias” (Singleton/Straits 2005: 145).45 Erstaunlich ist, wie unterschiedlich (und willkürlich) die Angaben in der Literatur sind: 70 Prozent werden einerseits als sehr gut, andererseits als Minimalstandard eingeschätzt.46 Dieser einseitige Blickwinkel bringt verschiedene Probleme mit sich: Das erste Problem ist, wie bereits erwähnt, dass eine einheitliche Berechnung von Ausschöpfungsquoten fehlt. Aus diesem Grund werden in den vorliegenden Studien häufig Fakten miteinander verglichen, die nicht vergleichbar sind, und durch „NeuDefinitionen“ unsystematischer Ausfälle künstlich hohe Ausschöpfungen konstru44

Babbie (1998: 262) weist zwar auf die Probleme derartig pauschaler Aussagen hin, trifft sie aber dennoch. Besonders erstaunlich ist, dass es sich bei den Büchern von Babbie und Singleton/Straits dabei jeweils um Lehrbücher handelt, die den Fokus auf die reine Höhe der Ausschöpfung legen bzw. eindeutige „Grenzwerte“ angeben (vgl. Groves 2006: 647). 46 In einer empirischen Untersuchung der Ausschöpfungen sozialwissenschaftlicher Studien wird als „Benchmark“ (zumindest für schriftliche Befragungen) ein Wert von 60 Prozent +/- 20 Prozentpunkte für Studien zur Gesamtbevölkerung angegeben (vgl. Baruch 1999: 434). Dabei wurde ein Bereich von einer Standardabweichung um den Mittelwert aller untersuchten Studien (n=175) gewählt. Wie unterschiedlich jedoch die Ausschöpfung in den Studien angegeben und berechnet wurde, geht nicht mit in die Analyse ein. Der praktische Nutzen einer derartigen Angabe im Sinne von: „Ausschöpfungen zwischen 40 und 80 Prozent sind unproblematisch“ kann bezweifelt werden. 45

50

3 Der Forschungsstand

iert. Da die Ausschöpfung in der Regel als Anteil der Interviews an der „bereinigten Bruttostichprobe“ definiert wird, ist es eben höchst relevant, wie der Begriff der Bereinigung verstanden wird (vgl. Schnell 1997: 19ff.). Daher sind auch die Benchmarks meist ungeeignet. Hinzu kommt, dass verschiedene Stichprobenverfahren unterschiedliche Implikationen mit sich bringen. Während etwa bei einer Registerstichprobe eindeutig festgelegt ist, wer befragt werden soll, ist dies bei dem in den USA üblichen Random Route-Verfahren viel schwieriger zu konstatieren. Grundsätzlich bleibt festzuhalten, dass die Ausschöpfung, wie in der Gleichung in Abbildung 5 (siehe Kap. 3.1.1) gezeigt, nur das Potenzial für eine Verzerrung angibt. Diese kommt unter bestimmten Umständen, sollte es etwa keinen Unterschied zwischen Nonrespondenten und Respondenten geben, überhaupt nicht zum Tragen. So ist es möglich, mit einer geringen Ausschöpfung valide Ergebnisse zu erhalten, wenn es keine (oder nur geringe) Unterschiede zwischen Teilnehmern und Nicht-Teilnehmern gibt (vgl. die Studie von Keeter et al. 2000). Eine reine Reduktion des Forschungsinteresses auf die Höhe der Ausschöpfung ignoriert diesen Aspekt (vgl. Groves/Peytcheva 2008: 168; Koch 2002: 31; Olson 2006: 739; Voogt 2004: 85). Das bedeutet aber wiederum, dass man diejenigen, die nicht an einer Befragung teilnehmen wollen, genauer analysieren muss.

3.1.3 Der Weg zu inhaltlichen Modellen In den letzten zwanzig Jahren hat sich die Nonresponseforschung ausdifferenziert. Auf der einen Seite entwickelte sich die Methodenforschung weiter, daneben entstanden aber auch inhaltlich orientierte und theoretisch fundierte Pionierstudien. Im Bereich der Methodenforschung stehen weiterhin Details der Feldarbeit (Stichprobenziehung, Interviewertraining, der Einsatz von Incentives oder auch die Konvertierung von Verweigerern) und deren Auswirkungen auf allgemeine Ausschöpfungsquoten sowie der statistische Umgang mit (Unit- und Item-) Nonresponse im Mittelpunkt des Forschungsinteresses. Daraus ergeben sich relevante methodische Innovationen, wie etwa die Entwicklung der multiplen Imputation oder andere spezifische Gewichtungsprozeduren, um Verzerrungen durch Nonresponse auszugleichen (vgl. Singer 2006: 640; siehe auch Bethlehem 2002; Gelman/Carlin 2002; Heeringa et al. 2002; Marker et al. 2002; Rubin/Zanutto 2002). Der Grund für diese eher als pragmatisch zu bezeichnende Herangehensweise, die sich nicht mit den Ursachen beschäftigt, sondern eine Bekämpfung von Symptomen bedeutet, liegt in der Angst vor steigenden Surveykosten und sinkender Datenqualität (vgl. Groves/Peytcheva 2008: 168; Schnell 1997: 30). Diese Angst führte, nicht nur von Seiten der universitären, sondern auch und insbesondere von Seiten der kommerziellen Sozialforschung, zu einer intensiven Beschäftigung mit dem Gebiet. Jedoch muss man trotz aller Bemühungen um ideale Erhebungsdesigns feststellen, dass eine vollständige Aus-

3.1 Problemwahrnehmung und bivariate Einzelerkenntnisse

51

schöpfung utopisch bleibt und ein gewisser Anteil der Zielpersonen nicht erreicht werden kann (vgl. Singer 2006: 240). Gleichzeitig zeigen alle Bemühungen um Gewichtungs- und Korrekturprozeduren, dass auch deren erfolgreicher Einsatz ein umfassendes theoretisches Verständnis des Ausfallprozesses und damit substanzielle Informationen über Nicht-Teilnehmer voraussetzt (vgl. Goyder et al. 2006). Damit rücken die inhaltliche Analyse der Charakteristika der Nicht-Teilnehmer und die Frage, was die Entscheidung zur Teilnahme beeinflusst, in den Vordergrund des Forschungsinteresses. Wenn man inhaltlich wissen möchte, was Personen, die nicht an einer Befragung teilnehmen, von den Teilnehmern unterscheidet, wendet man sich vom zweiten Teil der Formel (siehe Abb. 5, Kap. 3.1.1) dem ersten Teil des Terms zu. An dieser Stelle sind nun – unter der Prämisse, dass es keine pauschalen, sondern merkmalsspezifische Unterschiede gibt – inhaltliche Modelle relevant. Man benötigt Informationen über die Nonrespondenten, um die potenziellen Verzerrungen abschätzen zu können. Das bedeutet zugleich, dass ein Schritt von der reinen Methodenforschung hin zur inhaltlichen Forschung einzelner Disziplinen erfolgen muss. Diesen Weg gehen für die Sozial- bzw. Politikwissenschaft erstmals Goyder (1987) und Brehm (1993). Sie setzten sich inhaltlich mit der Frage auseinander, was Nonrespondenten in politikwissenschaftlichen Umfragestudien charakterisiert, konzentrierten sich dabei auf politikwissenschaftlich relevante Determinanten von Nonresponse und formulierten Konsequenzen, die sich daraus für das politische System ergeben können.47 Die bis dahin gewonnenen, meist bivariaten Erkenntnisse zu den Unterschieden zwischen Teilnehmern und Nicht-Teilnehmern wurden hierfür zunächst systematisiert und komplexere theoretische Modelle zur Erklärung von Kooperation oder Verweigerung aufgestellt (vgl. Brehm 1993; Groves 1989; Groves et al. 1992; Groves/Couper 1998; Groves et al. 2002; Hox et al. 1996; Voogt 2004; Voogt/Saris 2003). Diese Modelle beziehen unterschiedliche Determinantenbündel auf Mikround Makroebene ein, um eine möglichst umfassende Erklärung der Teilnahmeentscheidung zu liefern.48 Die empirische Überprüfung der theoretischen Modelle war jedoch zunächst nur bedingt möglich. In der Regel wurden die Modelle lediglich im US-amerikanischen Kontext auf der Basis von staatlichen Befragungsdaten, die zudem zu anderen Zwecken erhoben wurden, sekundäranalytisch geprüft (vgl. 47

In der Literatur ist zu beobachten, dass die Konzentration auf den ersten Teil der Formel, d.h. die Unterschiede zwischen Teilnehmern und Nicht-Teilnehmern, vereinzelt dazu geführt hat, anzunehmen, die Ausschöpfungsquoten seien irrelevant. Diese Annahme wurde bestärkt, da in einzelnen Studien für verschiedene Merkmale keine Unterschiede zwischen Respondenten und Nonrespondenten gefunden wurden (vgl. Curtin et al. 2000; Keeter et al. 2000; Merkle/Edelman 2002). Auch dieser Schluss ist jedoch nicht zutreffend und wird der Komplexität des Problems nicht gerecht. Groves (2006) und Groves/Peycheva (2008) zeigen in Metaanalysen verschiedener Studien, dass die Ausschöpfung alleine immer noch zwischen vier und elf Prozent der Varianz der Verzerrung durch Nonresponse erklärt. Sowohl die Höhe der Ausschöpfung, als auch die Unterschiede zwischen Teilnehmern und Nicht-Teilnehmern müssen daher berücksichtigt werden. 48 Damit ist jedoch auch häufig ein Mangel an Präzision der Aussagen für die konkrete Entscheidung auf Individualebene verbunden.

52

3 Der Forschungsstand

Groves/Couper 1998: 22). Bei den nachfolgenden international vergleichenden Studien zeichnete sich aber ab, dass weniger von allgemein gültigen Determinanten von Nonresponse auszugehen ist, sondern vielmehr kontextabhängige Wirkungsmechanismen (z.B. je nach Thema der Befragung, politischem oder gesellschaftlichem System) plausibler erscheinen (vgl. neben anderen Billiet et al. 2007).49 Damit einher geht die Forderung nach spezifischeren Modellen des Ausfallprozesses, die in verschiedenen Umfragekontexten überprüft werden. Für die Bundesrepublik Deutschland versuchte dies zunächst Schnell (1997), der in seiner Arbeit ein theoretisch fundiertes Erklärungsmodell aufstellte, aber ebenfalls das Problem fehlender Primärdaten hatte. Im folgenden Abschnitt sollen nun einige dieser komplexeren Modelle ausgewählt und vorgestellt werden. Zugleich wird versucht, jeweils den Bezug zu wichtigen und bewährten empirischen Forschungserkenntnissen herzustellen.

3.2 Komplexe Modellierungen zur Erklärung von Kooperation Das Forschungsgebiet war zunächst weitgehend von empirischen Einzelergebnissen dominiert, wobei verschiedene Instrumente meist experimentell eingesetzt wurden, um Nonresponse-Raten in Studien zu reduzieren. Die dahinter liegenden theoretischen Annahmen wurden dabei nur selten ausführlich formuliert. Die Forschung kann daher als insgesamt wenig theoriegeleitet bezeichnet werden (vgl. Goyder et al. 2006: 28; Schnell 1997: 133). Zudem kann man feststellen, dass sich die relevantesten Forschungsarbeiten verschiedenen sozialwissenschaftlichen Forschungskonzepten zuordnen lassen, ohne dass die damit verbundenen unterschiedlichen Prämissen und Konsequenzen explizit herausgearbeitet werden. Um die Begriffsverwirrung und die theoretische Unschärfe noch zu steigern, kommt hinzu, dass sich die Erkenntnisse aus der empirischen Überprüfung der theoretischen Konzepte auf unterschiedliche Typen von Nonresponse (Erreichbarkeit, Befragungsfähigkeit, Kooperation) beziehen, die Studien mit Individual- und Aggregatdaten arbeiten und sowohl direkte als auch indirekte Effekte aus Scheinkorrelationen modellieren, ohne diese Differenzierungen immer zu benennen und zu berücksichtigen. Im Folgenden soll daher bewusst nicht der gesamte Forschungsstand in aller Breite wiedergegeben werden. Die Fokussierung auf einzelne zentrale Studien soll vielmehr dazu beitragen, relevante Aspekte für die anschließende Modellbildung abzuleiten und damit den theoretischen Rahmen für die vorliegende Fragestellung abzustecken. Als Ausgangspunkt wird das Modell der Kooperation bei Umfragen von Groves/Couper (1998) verwendet. Es eignet sich gut als Heuristik, um den 49 „The relationship between the type of respondent and the attitudinal and background variables was not all in the same direction in all countries. This needs further research and discussion because it creates a serious challenge to any scholar who believes there is a theory of nonresponse that applies cross-nationally” (Billiet et al. 2007: 159).

3.2 Komplexe Modellierungen zur Erklärung von Kooperation

53

Forschungsstand zu Einflussfaktoren auf verschiedenen Ebenen aufzuarbeiten und zu systematisieren. Auf diese Weise können Erkenntnisse zu gesellschaftlichen Einflussfaktoren, Designfaktoren, Interviewerfaktoren, Einflüsse der Interaktion zwischen Interviewer und Befragtem sowie Merkmale auf der Ebene des Befragten dargestellt, bilanziert und diskutiert werden. Anschließend konzentriert sich die Arbeit auf die Ebene des Individuums und dessen Handlungsentscheidung zu Kooperation oder Verweigerung. Dazu werden neben den Annahmen von Groves/Couper noch weitere Arbeiten vorgestellt, welche, mit zum Teil unterschiedlichen Annahmen und Vorgehensweisen, die Handlungsentscheidung des Individuums modellieren.

3.2.1 Ein allgemeines Konzept der Kooperation bei Umfragen Nachdem insbesondere im angelsächsischen Raum50 bereits seit den 1980er Jahren verschiedene kleinere Studien zu den Einflussfaktoren von Nonresponse bei Umfragen durchgeführt wurden, legten Groves und Couper im Jahr 1998 ein umfassendes „Konzept der Kooperation bei Umfragen“ (Groves/Couper 1998: 29ff.) vor. Damit wird eine Skizze verschiedener denkbarer Erklärungsgrößen von Nonresponse auf Makro- und Mikroebene gezeichnet, die verschiedenen Forschungsparadigmen entlehnt sind. Es handelt sich weniger um eine konkrete Theorie im Sinne eines „System[s] von Aussagen, das mehrere Hypothesen oder Gesetze umfasst“ (Schnell et al. 2008: 54), die widerspruchsfrei miteinander verbunden sind, als eher um die Vorstufe einer Theorie, die eine Sammlung potenzieller Einflussfaktoren darstellt. Demnach können (1) (2) (3) (4) (5)

gesellschaftliche Einflussfaktoren, Designfaktoren, Attribute des Interviewers, Elemente der Interaktion zwischen Interviewer und Zielperson sowie Attribute der Zielperson bzw. des Haushalts

die Entscheidung einer Zielperson bzw. eines Zielhaushalts51 an einer Befragung teilzunehmen direkt oder indirekt beeinflussen (vgl. Groves et al. 1992; Groves/Couper 1998: 30). Die fünf Kategorien werden noch einmal in zwei Gruppen unterteilt. In die erste Gruppe fallen diejenigen Faktoren, die vom Forscher kontrollierbar sind. Dazu gehören Designfaktoren und Interviewer-Eigenschaften, die bereits bei der Erstellung des Forschungsdesigns einer Nonresponse-Studie berück50

Hier ist besonders der Forscherkreis um den amerikanischen Sozialwissenschaftler Robert Groves zu nennen. In der amerikanischen Forschung werden meist keine Personenstichproben auf der Basis von Einwohnermelderegisterdaten, sondern Haushaltsstichproben auf der Basis von Random Route-Verfahren gezogen. Daher sprechen Groves/Couper (1998) auch von „Haushalten“ und nicht von „Zielpersonen“. 51

54

3 Der Forschungsstand

sichtigt und in die Planungen einbezogen werden sollten. In der anderen Gruppe befinden sich die Faktoren, die außerhalb der Kontrolle des Forschers liegen, wie gesellschaftliche Einflussfaktoren und Eigenschaften des Haushalts oder der Zielperson selbst (vgl. Groves/Couper 1998: 29ff.). Insbesondere die Eigenschaften der Zielpersonen können in der Folge zu systematischen Unterschieden zwischen Teilnehmern und Nicht-Teilnehmern führen, die sich kaum verhindern lassen. In den nächsten Abschnitten sollen die genannten Einflussfaktoren-Bündel beschrieben werden, wobei die Merkmale, die vom Forscher weitgehend kontrollierbar sind (Design- und Interviewerfaktoren), gemeinsam betrachtet werden. Dabei werden sowohl die zentralen Annahmen von Groves und Couper als auch darüber hinausgehend weitere Erkenntnisse, die in die einzelnen Kategorien gehören und sich bislang empirisch bewährt haben, dargestellt. Gesellschaftliche Faktoren (Kap. 3.2.1.1) sind für ein besseres Verständnis individueller Effekte notwendig, Designund Interviewereffekte (Kap. 3.2.1.2) müssen bei der Umsetzung der empirischen Studie berücksichtigt werden. Über den Weg der Leverage-Salience-Theorie, die sich mit dem Einfluss verschiedener Designelemente in der Interaktion zwischen Interviewer und Zielperson beschäftigt (Kap. 3.2.1.3 und 3.2.1.4), wird schließlich die Handlungsentscheidung des Individuums beleuchtet. Diese Erkenntnisse der Einflussfaktoren auf der Ebene der Zielperson bilden anschließend den Kern der weiteren theoretischen Überlegungen (siehe Kap. 3.2.2).

3.2.1.1 Gesellschaftliche Faktoren Die gesellschaftliche Umgebung als Makroebene kann unmittelbar auf die Akteure auf der Mikroebene, d.h. die Zielperson und den Interviewer, wirken und damit indirekt deren Handlungsentscheidungen beeinflussen. Dahinter steckt die Annahme, dass das soziale Umfeld zu bestimmten Erwartungen in der Bevölkerung führt, die sich wiederum auf die Entscheidung zu Kooperation oder Verweigerung auswirken können. Diese gesellschaftlichen Faktoren bezeichnen Groves und Couper als „Schranken“ (Groves/Couper 1998: 31), innerhalb derer die Handlungen von Interviewer und Befragtem stattfinden. Sie wirken nicht direkt auf die Teilnahmeentscheidung, sondern vielmehr indirekt auf die Erwartungen der interagierenden Personen und ihre Strategien und können darüber die Handlungen der beteiligten Personen beeinflussen. 52 52 Diese Annahme wird bspw. bei einem Augenzeugenbericht eines Umfrageteams deutlich, das im Jahr 2007 für die Sender ARD, ABC News, BBC und die Zeitschrift USA Today im Irak mehr als 2.200 Bürger befragte. Der Chef des Umfrageteams wird dabei zitiert: „Die Leute – besonders in den gefährlichen Gebieten mit ethnischen und religiösen Spannungen – haben Angst. Wenn jemand an ihre Tür klopft, dann nehmen sie an, dass jemand kommt, um ihre Tochter oder ihren Sohn zu entführen. Darum sind wir immer zu zweit aufgetreten – ein Mann und eine Frau – damit die Befragten sich von vorneherein wohler fühlten und nicht in Gefahr wähnten“ (Sami Ibrahim Ali, auf http://www.tagesschau.de/ausland/meldung49082.html; Referenzdatum 22.11.2007). Die Kriegssituation führt zu Kriminalitätsfurcht, daher öffnen die Menschen nicht die Tür. Die Interviewer rechnen schon damit und

3.2 Komplexe Modellierungen zur Erklärung von Kooperation

55

Erkenntnisse aus anderen Studien unterstützen die Annahme, dass gesellschaftliche Einflussfaktoren die Teilnahme an Umfragen beeinflussen. Ein empirisches Indiz für den Einfluss des jeweiligen Kontextes auf die Teilnahmebereitschaft ist, dass in vergleichenden Untersuchungen auf Aggregatebene für unterschiedliche Länder abweichende Ausschöpfungsquoten bei ähnlichen bzw. identischen Befragungsstudien aufgezeigt wurden (vgl. etwa de Heer/Israels 1992: Stoop 2005; Smith 2007).53 Grundsätzlich sind verschiedene Ursachen für die Unterschiede zwischen den Ländern denkbar, die sowohl auf der gesellschaftlichen (Makro-) Ebene als auch bei Interviewern oder Design oder eben den Zielpersonen selbst, und damit auf Meso- oder Mikroebene, liegen können: Auf der Makroebene sind die gesetzlichen Rahmenbedingungen, wie etwa verpflichtende Teilnahmen oder spezifische Datenschutzregelungen zu nennen. Daneben kann sich auch das Umfrageklima oder der Verstädterungsgrad in den verschiedenen Ländern unterscheiden (vgl. Smith 2007: 45). Zudem könnten aber auch die Interviewerauswahl (Ausbildung, Training, Vorgaben), die Themen der Befragungen oder andere Elemente des Forschungsdesigns (Incentives, Modus, Felddauer) die Ausschöpfung beeinflussen (vgl. Goyder 1987). Weil diese Faktoren in vergleichenden Studien jedoch meist nicht kontrolliert werden, kann das unterschiedliche Teilnahmeverhalten in den Ländern in den meisten Fällen nicht ursächlich auf einzelne Elemente des gesellschaftlichen Umfelds zurückgeführt werden. Drei Merkmale, die in der Literatur als zentrale Faktoren bezeichnet werden, die auf der Makroebene angesiedelt sind, sollen einer detaillierteren Betrachtung unterzogen werden. Dazu gehören das Umfrageklima, der Verstädterungsgrad und das Nachbarschaftsklima. Zunächst ist das so genannte Umfrageklima einer Region ein Merkmal, das als relevanter Einflussfaktor in der Forschung diskutiert wird und auf der gesellschaftlichen Ebene angesiedelt ist (vgl. Goyder 1986; Groves/Couper 1992, 1998: 155; Harkness 1999; Lyberg/Dean 1992; Stoop 2004, 2005). Darunter wird die aggregierte Einstellung der Bevölkerung gegenüber Umfragen verstanden, die über Indikatoren wie Häufigkeit und wahrgenommene Legitimität von Umfragen gemessen wird (siehe dazu auch Schleifer 1986). Man könnte dieses Merkmal auch in Anlehnung an den Begriff der politischen Kultur als „Umfragekultur“ bezeichnen. Die Grundidee hinter der Operationalisierung ist, dass sich die Anzahl der Befragungen in einer Gesellschaft (auf der Makroebene) auf die Einstellung der Bevölkerung gegenüber Umfragen und darüber schließlich auf die individuelle Entscheidung zur Teilnahme auswirkt. Wenn nur selten Umfragen durchgeführt werden, sind sie passen daher ihr Verhalten an. Gleichzeitig zeigt das Beispiel, wie die soziale Umgebung auch das Forschungsdesign beeinflusst, weil man versucht, dem Problem des Misstrauens entgegenzusteuern, indem im Forschungsdesign zwei Interviewer unterschiedlichen Geschlechts vorgesehen sind. 53 Empirisch wird die Hypothese eines Einflusses des gesellschaftlichen Umfelds auf Nonresponse meist auf der Grundlage vergleichender Untersuchungen überprüft. Das Problem der vergleichenden Analysen ist, dass dabei oft nur Aggregatdaten zur Verfügung stehen, die keine Aussagen über individuelles Handeln erlauben bzw. sich weitreichender Prämissen über die Verknüpfung von Makro- und Mikroebene bedienen müssen. Es besteht das Risiko von ökologischen Fehlschlüssen (siehe Robinson 1950: 351ff.).

56

3 Der Forschungsstand

etwas Interessantes und Abwechslungsreiches. Wird die Bevölkerung jedoch andauernd mit Befragungen und Interviewanfragen konfrontiert, kann daraus eine regelrechte Befragungsmüdigkeit resultieren. Dieser Effekt wird in der Forschung auch unter dem Stichwort des „oversurveying“ bzw. der „research tiredness“ besprochen (vgl. Dillman et al. 1974; Groves/Kahn 1979; Groves/Couper 1998: 31; Groves et al. 2004b: 176; Költringer 1992; Nederhof 1981, 1986, 1987; Remington 1992).54 Die Legitimität von wissenschaftlichen Umfragen ist ebenfalls ein Indikator des Umfrageklimas. Diese nimmt ab, wenn in einem Land viele unseriöse Verkaufsgespräche als Umfragen getarnt werden. Das Problem wurde bereits in den 1960er Jahren erkannt (vgl. Allen/Colfax 1968; Baxter 1964; McDaniel et al. 1985; Rugg 1971: 625; Schleifer 1986; Sheets et al. 1974) und dürfte seither eher zu- als abgenommen haben, da Marketing und Vertrieb über „angebliche“ Umfragen populärer geworden sind (vgl. Forsa 2000, 2006: 3; Groves/Couper 1998: 300; Steeh et al. 2001: 227; Stocké/Langfeldt 2003). Der Effekt trifft jedoch wahrscheinlich vor allem Telefonbefragungen, da Marketing- und Vertriebsmaßnahmen in der Regel telefonisch durchgeführt werden.55 Für die Bundesrepublik Deutschland kann man – zumindest Anfang der 1990er Jahre – zeigen, dass die Markt- und Sozialforschung (noch) ein positives Image besitzt (vgl. Leiblein/Klass 1990: 259; Leiblein/Oglesby 1993: 48). Zu all diesen Effekten muss man jedoch feststellen, dass Aussagen über die individuellen Motive der agierenden Personen auf der Grundlage der vorliegenden Aggregatdatenanalysen immer die Gefahr ökologischer Fehlschlüsse beinhalten (siehe Robinson 1950). Zudem wird kritisiert, dass das Konzept des Umfrageklimas noch nicht hinreichend präzise definiert und operationalisiert ist (vgl. die Kritik bei Smith 2007: 48). Auch der Verstädterungsgrad eines Gebiets wird als ein weiterer gesellschaftlicher Einflussfaktor diskutiert, der sich – etwa über eine höhere Kriminalitätsrate (vgl. Groves/Couper 1998: 145) oder einen höheren Grad sozialer Desintegration (vgl. Couper/Groves 1996: 174) – auf die Mikroebene auswirkt (vgl. auch Brehm 1993; Goyder et al. 1992; House/Wolf 1978; Smith 1983; Steeh 1981). Die Kriminalitätsraten sind in größeren Städten höher als in ländlichen Regionen. Dies wird auf der Individualebene mit einer höheren Verbreitung von Kriminalitätsfurcht verbunden. Die Annahme ist, dass potenzielle Befragte aus Angst vor Verbrechen keine Unbekannten in ihre Wohnungen lassen und eine Teilnahme am Interview 54

Studien in Ländern bzw. Regionen, in denen selten oder noch nie Befragungen durchgeführt wurden, zeigen eine sehr hohe Bereitschaft der Befragten zu antworten und weisen außerordentlich hohe Responseraten auf (siehe etwa die erste Runde des Afrobarometers in Tansania im Jahr 2001, bei dem über 99% der Zielpersonen erreicht und befragt werden konnten; Abruf auf: http://www.jdsurvey.net/jds/afrobarometer.jsp, Referenzdatum: 22.11.2007). Zu berücksichtigen ist bei der Interpretation der Ausschöpfung jedoch wiederum jeweils das gewählte Auswahlverfahren. 55 Dabei sind jedoch auch Ausstrahlungseffekte auf andere Befragungsmodi möglich. Bei persönlichen Interviews sind etwa Probleme aufgrund der unseriösen „Drückerkolonnen“ denkbar, die versuchen, Zeitungsabonnements über den persönlichen Kontakt an der Haustür zu vertreiben. Wenn der Zielperson nun ein Interviewer an der Haustür gegenübersteht, ist es möglich, dass die Situation falsch interpretiert und aus diesem Grund eine Teilnahme verweigert wird.

3.2 Komplexe Modellierungen zur Erklärung von Kooperation

57

bereits an der Gegensprechanlage oder an der Haustür verweigern (vgl. Blohm et al. 2007; Goyder et al. 1992: 39; House/Wolf 1978: 1036; Koch 1997). Dabei wird erneut postuliert, dass sich das Merkmal „Verstädterungsgrad“ auf der Makroebene über die individuellen Erwartungen („Kriminalitätsangst“) auf das individuelle Handeln der Zielpersonen („Verweigerung“) auswirkt. Schließlich nimmt man auch für das Nachbarschaftsklima an, dass es eine wichtige Rolle bei der Erklärung der Kooperationsbereitschaft spielen kann. So kann man feststellen, dass in ökonomisch gut gestellten Wohngegenden seltener Verweigerungshaltungen auftreten. Begründet wird dies über das höhere soziale Vertrauen, das bei einer positiven Atmosphäre in der Nachbarschaft vorliegt. Persönlich-mündliche Interviews profitieren davon in besonderem Maße, da das Interview (meist) direkt in den Privaträumen der Befragten stattfindet und dieser Eingriff in die Privatsphäre soziales Vertrauen der Zielpersonen voraussetzt. Groves/Couper bezeichnen die Einzelfaktoren, die sich auf das soziale Vertrauen einer Zielperson auswirken können, als „social responsibility“-Grad eines Kontextes. Dieser wird über verschiedene Dimensionen operationalisiert und ergibt sich aus der Akzeptanz von Institutionen, dem Grad sozialer Ähnlichkeit, dem ökonomischen Status, dem Entfremdungsgrad und der Verbreitung zivilgesellschaftlicher Normen innerhalb eines Gebiets. Die Autoren weisen empirisch nach, dass die Kooperationsbereitschaft mit einem steigenden Grad an sozialer Verantwortung zunimmt (vgl. Groves/Couper 1998: 31, 170f.; Groves et al. 1992: 477; siehe auch Goyder 1987 zum Zusammenhang von sozialer Kohäsion, gesellschaftlichem Verantwortungsbewusstsein und Kooperationsraten). Bei diesen Untersuchungen ist besonders interessant, dass letztlich politikwissenschaftlich relevante Merkmale, wie etwa das Institutionenvertrauen, gesellschaftliche Integration oder Anomie als Determinanten von Nonresponse diskutiert werden (vgl. Couper et al. 1997; Groves et al. 1992; Knack 1992; Mathiowetz et al. 1991; siehe auch Knack/Kropf 1998; Putnam 1995).56 Es wird angenommen, dass: „[...] the relative lack of participation or involvement in the community may reduce the willingness to engage in activities (such as surveys) that are seen to benefit either that community or the society at large“ (Couper/Groves 1996: 175). Darauf wird im späteren Verlauf der Arbeit, insbesondere bei der Entwicklung eines handlungstheoretischen Modells, noch einmal eingegangen und gezeigt, wie diese letztlich individuellen Merkmale die Handlungsentscheidung beeinflussen.

56 Damit eng verbunden ist die Forschungsfrage, ob – und wenn ja wie – das vieldiskutierte Konzept des Sozialkapitals (Bourdieu 1983; Coleman 1988, 1990; Erickson 1996; Lin 2001; Putnam 1993) mit Kooperationsraten verknüpft ist. Im vierten Kapitel dieser Arbeit wird eine Verbindung zwischen den Konzepten hergestellt.

58

3 Der Forschungsstand

3.2.1.2 Design- und Interviewerfaktoren Neben den gesellschaftlichen Faktoren, die meist über die Erwartungen der interagierenden Personen wirken, benennen Groves und seine Kollegen auch Elemente des Forschungsdesigns und die Auswahl der Interviewer als potenzielle Einflussfaktoren auf die Entscheidung einer Person zu Kooperation oder Verweigerung. In der Regel können diese beiden Bereiche nicht vollständig isoliert voneinander betrachtet werden, da die Interviewer oftmals als Vermittler der Designelemente eingesetzt werden. Beide Bereiche sind der Methodenforschung zuzurechnen und, folgt man der Argumentation von Groves und Couper, weitgehend vom Forscher zu beeinflussen (vgl. Groves/Couper 1998: 30). Einschränkend zu erwähnen ist dabei, dass beim Design einer Studie selbstverständlich wirtschaftliche Restriktionen und personelle Ressourcen beachtet werden müssen. Die theoretische Annahme, dass man Interviewereffekte als Forscher vollständig kontrollieren könne, erscheint daher empirisch nur bedingt tragfähig. Zum einen können nur diejenigen Interviewer eingesetzt werden, die sich einsetzen lassen, d.h. man hat das Problem der Selbstselektion. Zudem müssen Interviewer in vielen Studien aus Kosten- und Effizienzgründen wohnortnah eingesetzt werden, was die „freie Auswahl“ weiter eingrenzt. Schließlich sind die Kontrollmöglichkeiten eines Forschers in der konkreten Interaktionssituation nur sehr gering, da die Interviewer gerade bei persönlich-mündlichen Interviews in der Regel allein und ohne Kontrolle – etwa durch eine Aufzeichnung – arbeiten. Sowohl die Wirkungen einzelner Designelemente als auch die Wirkungen bestimmter Interviewermerkmale müssen aber bereits in der Planungsphase einer empirischen Studie berücksichtigt werden. Im Bereich des Forschungsdesigns werden Effekte des Einsatzes von Incentives ebenso wie die Wirkungen verschiedener Kontaktmodalitäten, der Länge einer Studie bzw. des damit verbundenen Aufwands, der Salienz des Themas oder auch des Auftraggebers einer Befragung diskutiert und aufgezeigt (vgl. Groves/Couper 1998: 269ff.; Groves et al. 1992, 2000). Auf konkrete empirische Erkenntnisse zu den einzelnen Bereichen wird anschließend bei der Beschreibung des Forschungsdesigns noch einmal ausführlicher eingegangen (siehe Kap. 5). Der große Einfluss der Interviewer manifestiert sich in deutlich unterschiedlichen Erfolgsquoten (vgl. auch Biemer/Lyberg 2003: 110f., 156ff.; Lyberg/Lyberg 1991; Lyberg/Dean 1992; Wasmer et al. 2007).57 Sie nehmen im Ablauf einer Umfrage eine Schlüsselposition ein und werden in der Forschung als „one of the most important means to improve nonresponse“ (de Leeuw et al. 1998: 240) gesehen (vgl. auch Campanelli et al. 1997; Campanelli/O’Muircheartaigh 1999; Groves et al. 1992, 2002; Loosveldt et al. 1998; Loosveldt et al. 2004; Morton-Williams 1993; Snijkers et al. 1999). Die in der Forschung diskutierten Attribute des Inter57 Im Jahr 2006 wurden beim ALLBUS insgesamt 231 Interviewer eingesetzt, acht von ihnen führten mehr als 50 Interviews durch, während andere nur geringe Antwortraten aufweisen konnten bzw. 22 Interviewer gar keinen Interviewerfolg hatten (vgl. Wasmer et al. 2007: 69).

3.2 Komplexe Modellierungen zur Erklärung von Kooperation

59

viewers, die einen Einfluss auf die Kooperationsbereitschaft der Zielpersonen haben können, lassen sich zunächst theoretisch in verschiedene Kategorien einteilen: Erstens werden soziodemographische Merkmale des Interviewers, wie etwa Alter, Geschlecht oder Bildung, diskutiert. Zweitens wird auch für die Erfahrung der Interviewer ein Einfluss auf seinen Interviewerfolg angenommen. Drittens wird vermutet, dass Persönlichkeitsmerkmale, die Erwartungen und Einstellungen des Interviewers gegenüber sich selbst, der Situation und der Zielperson den Interviewerfolg beeinflussen können. Dazu gehören beispielsweise das Selbstbewusstsein und der Glaube an die eigene Fähigkeit. Schließlich kann viertens auch das konkrete Interviewerverhalten, das insbesondere in der Interaktion mit der Auskunfts- oder Zielperson relevant wird, die Kooperationsbereitschaft beeinflussen (vgl. Biemer/Lyberg 2003: 111; Blohm et al. 2007: 97; Groves/Couper 1998: 194f.; Sturgis/Campanelli 1998). In der Regel wirken die einzelnen Interviewermerkmale weder direkt auf die Handlungsentscheidung der Zielperson, noch sind sie unabhängig voneinander (vgl. Groves/Couper 1998: 191).58 Gerade bei den soziodemographischen Merkmalen des Interviewers werden keine eigenständigen direkten Effekte angenommen, sondern es wird vermutet, dass Unterschiede über die Erfahrung (vgl. de Leeuw et al. 1998: 240; Groves/Fultz 1985) sowie über die Einstellungs- und Verhaltensebene der Interviewer und der Zielpersonen vermittelt sind. Ältere Interviewer haben meist einen größeren Erfahrungsschatz und ein größeres Verhaltensrepertoire, auf das sie zurückgreifen können. Soziodemographische Merkmale des Interviewers können der Zielperson zudem Hinweise auf die Intention des Besuchs geben und bestimmte Erwartungen aktivieren. Darüber hinaus können sie Auswirkungen auf Emotionen (Ängste, Vertrauen etc.) aller beteiligten Akteure haben, bspw. sind ältere weibliche Interviewerinnen vertrauenswürdiger als junge männliche (vgl. etwa Groves 1989; Groves/Couper 1996: 68; Groves/Couper 1998: 36). Für die Berufserfahrung der Interviewer konstatieren zahlreiche Studien einen deutlich positiven Zusammenhang mit dem Interviewerfolg. Gerade dabei kommt das bereits zu Beginn des Kapitels angesprochene Problem der Selbstselektion jedoch zum Tragen, da es die theoretische Wirkungsrichtung zwischen Erfolg und Erfahrung umkehren kann. Interviewer, die lange Zeit bei einem Institut sind, könnten dies aufgrund ihres Erfolges sein, weil ihnen die erfolgreiche Tätigkeit Spaß macht. Das Umfrageinstitut wird diese erfolgreichen, mit Freude arbeitenden Interviewer auch gerne weiterhin beschäftigen. In diesem Fall wäre die Erfahrung nicht Ursache, sondern Wirkung des Erfolgs (vgl. auch dazu Groves/Couper 1998: 200ff.).

58

Soziodemographische Merkmale, wie beispielsweise das Alter, hängen eng mit der Berufserfahrung zusammen. Die Erfahrung ist zugleich ein Indikator für bestimmte Einstellungen wie beispielsweise das Selbstbewusstsein des Interviewers. Zwischen Einstellungen und dem Verhalten der Interviewer können ebenfalls Zusammenhänge angenommen werden (vgl. Groves/Couper 1998: 194).

60

3 Der Forschungsstand

Auch auf den Einfluss von Persönlichkeitsmerkmalen des Interviewers auf die Kooperationsbereitschaft der Zielpersonen wird in der Forschung hingewiesen (vgl. bereits Hyman 1954; auch Blohm et al. 2007; Macfarlane Smith 1972: 28ff.). Es wird angenommen, dass Interviewerfolg mit emotionaler Stabilität und Introvertiertheit des Interviewers (vgl. Axelrod/Cannell 1959; Macfarlane Smith 1972), mit Überzeugungskraft und Organisationstalent (vgl. Johnson/Price 1988), mit Extraversion (vgl. Blohm et al. 2007) oder auch mit „other-directedness“ (Groves/Couper 1998: 200), d.h. Empathie, assoziiert ist. Jedoch lassen sich diese Hypothesen zum Zusammenhang von Persönlichkeitsmerkmalen der Interviewer und Kooperationsraten häufig empirisch nicht bestätigen. Eine Ursache dafür könnte die geringe Varianz der Persönlichkeitsmerkmale in der Gruppe der Interviewer sein (vgl. Groves/Couper 1998). Zudem ist umstritten, inwieweit Persönlichkeitsmerkmale von erlernbaren Techniken abgrenzbar sind. Manche Autoren argumentieren, dass der Interviewerfolg zwar mit sozialen Fähigkeiten verbunden sei, diese aber keine stabilen Persönlichkeitseigenschaften darstellen, sondern lern- und wandelbar und damit eng an die Erfahrung als Interviewer geknüpft seien (vgl. Argyle 1969; Hox/de Leeuw 2002; Morton-Williams 1993). Als empirisch erklärungskräftige Merkmale haben sich insbesondere die Einstellungen und Erwartungen der Interviewer herausgestellt, die meist in der Interaktion mit der Zielperson wirken.59 Dazu zählen Faktoren wie das Selbstbewusstsein des Interviewers, der Glaube an die eigene Fähigkeit sowie die Überzeugung, etwas Wichtiges und Legitimes zu tun (vgl. de Leeuw 1999; Groves/Couper 1998: 212; Hox/de Leeuw 2002; Singer et al. 1983). Wenn ein Interviewer von sich selbst annimmt, erfolgreich zu sein, ist er dies tatsächlich eher als wenn er sich unsicher fühlt. Psychologisch lässt sich dies über das Phänomen der „self-fulfilling prophecy“ (siehe Merton 1995) erklären. Auch die eigene Einstellung gegenüber dem Thema einer Studie, die wahrgenommene Schwierigkeit, jemanden zu einem Thema zu befragen, und die Einstellung gegenüber der Anwendung von Überzeugungsstrategien im Allgemeinen wirken sich auf die Kooperationsraten aus (vgl. Hox/de Leeuw 2002; Lehtonen 1996; Singer/Kohnke-Aguirre 1979; Singer et al. 1983).60 Dabei wird angenommen, dass positiv eingestellte Interviewer ihre Einstellung auf die Zielperson übertragen und diese daher eher überzeugen können. Neben soziodemographischen Merkmalen, der Erfahrung, Persönlichkeitsmerkmalen und Einstellungen der Interviewer, beeinflusst schließlich auch das Verhalten der Interviewer die Kooperationsbereitschaft der Zielpersonen. Die Einflüsse auf der Verhaltensebene sind jedoch komplex und nur schwer abzubilden, da 59 Dies zeigten z.B. Hox/de Leeuw (2002) in einer vergleichenden Studie für neun Länder. Sie untersuchten verschiedene Determinanten von Response-Raten und verwendeten als erklärende Variablen soziodemographische Merkmale, Erfahrung, Einstellungen sowie das Verhalten der Interviewer. Dabei zeigte sich, dass die Variablen auf der Einstellungsebene in allen Ländern am meisten zur Erklärung der Varianz beitragen konnten. 60 Hier zeigen beispielsweise Lehtonen (1996) und de Leeuw et al. (1998), dass diejenigen Interviewer, die der Aussage zustimmen, dass eine Interviewteilnahme freiwillig erfolgen muss und jeder die Freiheit hat, zu antworten, niedrigere Responseraten haben, als diejenigen, die der Aussage weniger zustimmen.

3.2 Komplexe Modellierungen zur Erklärung von Kooperation

61

sie meist nur über das selbstberichtete Verhalten der Interviewer gemessen werden können. Dennoch sind sie relevant, da man davon ausgehen kann, dass die Interaktion – und damit das Verhalten von Interviewer und Zielperson – bei der Erklärung des Teilnahmeverhaltens eine zentrale Rolle spielt (vgl. Groves et al. 1992; Groves/Couper 1998; Snijkers et al. 1999). Wenn eine Zielperson ausgewählt wird, um an einer persönlich-mündlichen Befragung teilzunehmen, erhält diese meist zunächst ein Anschreiben, das sie über den Besuch eines Interviewers informiert. In der Regel fällt die Entscheidung zu Kooperation oder Verweigerung dennoch erst während der Interaktion zwischen Interviewer und Zielperson. Nur die wenigsten Zielpersonen verweigern bereits direkt beim Umfrageinstitut oder Studienleiter, nachdem sie das Anschreiben erhalten haben und bevor ein Interviewer sie das erste Mal besucht.61 Während der Interaktion wirken die zuvor diskutierten Merkmale des gesellschaftlichen Umfelds, des Forschungsdesigns sowie Merkmale des Interviewers und der Zielperson zusammen und die Zielperson trifft die Entscheidung zu Kooperation oder Verweigerung.

3.2.1.3 Die Interaktion zwischen Interviewer und Zielperson Theoretisch lässt sich die Frage, in welcher Form die Interaktion zwischen Interviewer und Zielperson abläuft und was die Entscheidung zu Kooperation oder Verweigerung beeinflusst, mit soziologischen Ansätzen verbinden. Schon früh wurde in den Ansätzen der sozialen Austauschtheorie (vgl. Blau 1964; Homanns 1958, 1961; Thibaut/Kelley 1959) beschrieben, dass sich bei Individuen Erfahrungen und zuvor „Erlerntes“ in aktuellen Erwartungen und Situationsdefinitionen widerspiegeln. Das bedeutet, eine Interaktion startet nicht jedes Mal an einem Nullpunkt, sondern findet in einem bestimmten sozialen Rahmen statt, der die Situation definiert. Esser bezeichnet diese subjektive Definition aus der Perspektive des Handelnden als „Framing“ der Situation (Esser 1999: 165).62 Bereits Dillman (1978) bettet die Entscheidung eines Individuums zur Umfrageteilnahme in den theoretischen Rahmen der Austauschtheorie ein. Damit wurde erstmals ein schlüssiges umfassenderes theoretisches Fundament der Nonresponse-Forschung erarbeitet. Der Interviewer muss sich auf die Situation einstellen, dass eine Zielperson einen gewissen Bestand an sozialem Wissen besitzt. Dieses steht kognitiv in Form 61 Dahinter steckt die Annahme, dass es nur einen kleinen Teil Verweigerer gibt, für die eine Teilnahme unter keinen Umständen in Frage kommt und die zudem die Mühe auf sich nehmen, von sich aus aktiv beim Institut zu verweigern. Der Großteil der Verweigerungen ist situationsabhängig (vgl. auch den Vortrag von Schnell 16.11.2004 in Zürich; Esser 1986a: 38). 62 Ableiten lässt sich die Definition der Situation aus dem Thomas-Theorem: „If men define situations as real, they are real in their consequences“ (Thomas/Thomas 1928: 572). Das bedeutet, dass Menschen unabhängig von der objektiven Beschaffenheit einer Situation ein subjektives Bild einer Situation entwickeln und diese dementsprechend einordnen.

62

3 Der Forschungsstand

von Skripten oder Schemata zur Verfügung und kann abgerufen werden (vgl. Esser 1996, 2001; siehe auch Abelson 1981). Hat eine Zielperson schon einmal schlechte Erfahrungen mit Fremden an der Haustür gemacht, die ihr z.B. etwas verkaufen wollten, wird sie die Situation, dass eine ihr fremde Person an der Haustür steht und klingelt, anders bewerten (und damit einen anderen „Frame“ setzen), als jemand, der diese schlechten Erfahrungen noch nicht gemacht hat. Für beide Akteure gilt in diesem Zusammenhang: „Past experience with similar situations will dictate behavior“ (Groves/Couper 1996: 64).63 Für die Zielperson gibt es grundsätzlich mehrere Möglichkeiten, die Situation „Eine mir fremde Person steht vor der Tür oder ruft mich an“ zu deuten. Eine mögliche Deutung wäre „Die Person erwartet etwas von mir, will mir etwas verkaufen und nimmt Zeit in Anspruch“, worauf eine legitime Reaktion wäre, zu sagen „Ich bin zu beschäftigt“ (vgl. Groves/Couper 1998). Dies ist für den Interviewer jedoch das falsche, nicht intendierte Skript. Interviewer können mit ihrem Verhalten hingegen direkt aktiv falsche Skripte zerstreuen und etwa in ihrer Einleitung anmerken, dass sie nichts verkaufen, nur wenig Zeit brauchen oder etwa flexibel Termine machen können (vgl. de Leeuw/Hox 2004; Gonzenbach/Jablonski 1993). Die Anfrage des Interviewers sollte daher möglichst individuell auf die Zielperson und ihre Erfahrungen zugeschnitten sein. Diese Passgenauigkeit, die Interaktionssituation einschätzen zu können und die „richtige“ Ansprache zu wählen, wird in der Forschung als „Tailoring“ bezeichnet (vgl. Blohm et al. 2007; Groves et al. 1992; Groves/Couper 1998: 37, 213; Groves/McGonagle 2001; Stoop 2004). Es gilt als eines der wichtigsten Elemente des Interviewerverhaltens zur Steigerung der Kooperationsrate. Bei persönlich-mündlichen Interviews hat der Interviewer verschiedene Möglichkeiten, bei der Zielperson das „richtige“ Skript zu aktivieren. Er kann sich als Mitarbeiter eines großen Instituts vorstellen und dies etwa über Ausweise legitimieren (anders als bei Telefonbefragungen, siehe Prince 1985: 261). Jede Reaktion der Zielperson kann anschließend den Verlauf der Argumentation verändern. Der Interviewer kann mit jeder neuen Information neu entscheiden, welche Argumente ihm als geeignet erscheinen. Daraus ergibt sich direkt eine zweite Annahme erfolgreicher Interaktionen: „Maintaining Interaction“ (vgl. Groves et al. 1992; Groves/Couper 1996, 1998). Je länger die Interaktion andauert, desto mehr Informationen erhält der Interviewer über die Zielperson und desto passender sollte er argumentieren können. Zudem wird über die Interaktionsdauer die Beziehung zwischen den Akteuren gestärkt und es wird für die Zielperson umso schwieriger, die ihr gegenüberstehende Person abzuweisen. Daher ist es aus der

63

Ein empirisches Indiz für die Relevanz dieser Skripte geben Blohm et al. (2007), die nachweisen, dass es bei telefonischen Anfragen mehr Verweigerungen gibt als bei persönlich-mündlichen Interviewanfragen. Die Ursache sehen sie darin, dass es am Telefon schwieriger sei, das „richtige“, positiv besetzte Skript bei der Zielperson zu aktivieren (vgl. Blohm et al. 2007: 98).

3.2 Komplexe Modellierungen zur Erklärung von Kooperation

63

Perspektive des Interviewers wichtig, die Interaktion so lange wie möglich andauern zu lassen und kein schnelles „Nein“ der Zielperson zu erhalten.64 Studien zeigen, dass sich die theoretischen Annahmen zum „Tailoring“ und zur „Maintaining Interaction“ empirisch bewähren. Dabei wurde die Kommunikation vom Interviewer aufrechterhalten, Informationen gesammelt und versucht, einen zweiten Termin zu ermöglichen. Anschließend wurde die „passende“ Strategie eingesetzt, um Interviews zu generieren. So kann belegt werden, dass eine Anpassung des Verhaltens der Interviewer nach dem ersten Besuch beim zweiten Kontakt zu höheren Kooperationsraten führt (vgl. Groves/Couper 1996; de Leeuw 1992; Groves/Couper 1998; Groves/McGonagle 2001). Leider existieren bislang aber nur vage Operationalisierungen der beiden Konzepte, weswegen die empirischen Erkenntnisse auch nur als Indizien gewertet werden können.65 Sie sind jedoch als Argument dafür geeignet, dass sozialpsychologische Faktoren in Modelle zur Erklärung der Kooperationsentscheidung integriert werden sollten. Die beiden Konzepte lassen sich theoretisch in die sozialpsychologische Forschung einordnen, die sich mit der Anwendung so genannter „ComplianceTechniken“ beschäftigt (vgl. Cialdini et al. 1975; Cialdini 1987, 1997; Groves et al. 1992). Unter „Compliance“ wird dabei die Veränderung des eigenen Verhaltens nach der Konfrontation mit den Meinungen anderer verstanden.66 Nun existieren verschiedene Techniken, die eingesetzt werden können, um jemanden zu einer solchen Verhaltensänderung in eine bestimmte gewünschte Richtung zu bewegen. Für den Interviewer stellen sie eine Art „Werkzeugkasten“ dar (vgl. Groves/Couper 1998).67 Die zentrale Frage ist dabei jedoch nicht ob, sondern in welcher Form und wann genau die Techniken eingesetzt werden. Die „Aufrechterhaltung der Interaktion“ ist eine Voraussetzung dafür, dass Compliance-Strategien überhaupt angewandt werden können. Das „Tailoring“ ist das Finden der „richtigen“ Strategie. Verschiedene Argumentationsstrategien sind denkbar und werden in der Forschung gerade im Hinblick auf die Formulierung von Anschreiben und Einleitungen diskutiert. Dazu gehört das Betonen von Reziprozität oder der sozialen Nützlichkeit einer Studie (vgl. auch Dillman et al. 1976), das Betonen einer legitimen und anerkannten Autorität, etwa durch die Nennung eines Sponsors (vgl. Hawkins 1979; 64

Groves/Mc Gonagle (2001: 251) beschreiben, dass es beim Aufrechterhalten der Interaktion gar nicht darum geht, die Zielperson zur Kooperation zu bewegen, sondern nur darum, eine Verweigerung zu verhindern. 65 Entgegen der theoretischen Annahme lässt sich beispielsweise für die nachfolgenden Kontakte kein Effekt zeigen. 66 Compliance ist ein Begriff aus der Sozialpsychologie. Hierunter versteht man die (meist kurzfristige) Verhaltensänderung einer Person, die durch den sozialen Einfluss einer anderen Person oder Gruppe (durch eine Bitte, eine Forderung) ausgelöst wird und durch Belohnung oder Vermeidung von Strafe motiviert ist (siehe etwa Cialdini et al. 1975; Cialdini 1988). 67 Eines dieser Werkzeuge ist beispielsweise die „Foot-in-the-door“-Technik. Darunter versteht man ein Verfahren aus der Persuasionsforschung: Man beginnt mit kleineren Anfragen, die der Interaktionspartner kaum ablehnt, bevor man zur eigentlichen Anfrage, in diesem Fall der Interviewanfrage, kommt. Diese Technik wird auch in Verkaufsgesprächen angewandt und basiert auf der psychologischen Annahme, dass Menschen, die bereits einer kleineren Anfrage positiv begegnet sind, auch auf die folgenden Anfragen positiv reagieren, um sich möglichst konsistent zu verhalten (siehe etwa Burger 1999; DeJong 1979; Freedman/Fraser 1966).

64

3 Der Forschungsstand

Orr 1976) oder auch das Herstellen von Sympathie durch Mitgefühl, Ähnlichkeit oder andere Mittel. Vielfach ist auch die Betonung der Einmaligkeit der Situation einer Interviewanfrage eine Möglichkeit, die Zielperson zu überzeugen. Hier könnte der Interviewer darauf hinweisen, dass man nur selten in der Lage sein wird, mit der eigenen Meinung stellvertretend für viele andere Menschen zu stehen (vgl. Groves/Couper 1998: 210; siehe auch Cialdini 1984, 1988, 1997). Der Einsatz von Interaktionsstrategien ist nicht unabhängig vom jeweiligen Kontext, in dem eine Umfrage durchgeführt wird. Je nach Land bzw. Kultur können unterschiedliche Verhaltensstrategien der Interviewer wirken. So wurde für Deutschland empirisch gezeigt, dass Argumente, die auf den gesellschaftlichen Nutzen bzw. den Spaß aufgrund der Abwechslung vom Alltag durch Umfragen abzielen, nicht sonderlich erfolgreich sind. Dazu gehört etwa das Argument, eine Befragung habe einen hohen gesellschaftlichen Wert, das Thema der Befragung sei interessant, alle anderen nähmen auch daran teil und die Teilnahme mache Spaß. Erfolgreicher im Hinblick auf die Kooperationsbereitschaft in deutschen Studien sind so genannte „Knappheitsargumente“: Dabei wird argumentiert, der Befragte habe nun die einmalige Chance seine Meinung zu sagen und damit andere Personen zu repräsentieren (vgl. Hox/de Leeuw 2002: 108ff.).68 Auch Groves et al. (1992) weisen bereits auf diese Kontextabhängigkeit hin, wenn sie feststellen, dass die Auswahl der Interviewerstrategien (und damit der Inhalt des „Werkzeugkastens“) durch das Forschungsdesign und die Umweltfaktoren eingeschränkt sind (vgl. Groves et al. 1992: 479). Aus diesem Grund lassen sich keine allgemeingültigen Konzepte erarbeiten. Festzuhalten ist, dass der Interviewer vor der schwierigen Aufgabe steht, die situativ passenden Instrumente auswählen zu müssen: „No one introduction is suitable to adress the concerns of diverse sample persons.[…] Interviewers must have ways of learning the concerns to make salient those attributes given positive leverage by the sample persons” (Groves et al. 2004: 177). Der Einsatz der Compliance-Techniken ist damit über die Ebene der Zielpersonen modellierbar, indem man fragt, welche Argumente bei welcher Zielperson salient gemacht werden müssen, weil sie von dieser positiv bewertet werden und ihr zugleich wichtig sind (vgl. auch Kap. 3.2.1.4 zur Leverage-Salience-Theorie). Die Subjektivität der Erwartungen der Zielpersonen sollte in einer Erklärung des Teilnahmeverhaltens berücksichtigt werden, indem man ihre Bewertungen berücksichtigt. Letztlich basieren jedoch all diese Strategien auf der theoretischen Vorstellung einer subjektiven Kosten-Nutzen-Analyse der Zielperson, bei der ein weiter Nutzenbegriff angenommen wird. Diese Vorstellung der sozialen Einbettung der Kosten-Nutzen-Abwägung findet sich sowohl in der Austauschtheorie (vgl. Blau 1964; 68

Wenn man nicht nur die Bundesrepublik Deutschland, sondern alle neun untersuchten Länder analysiert, weisen die Daten nicht auf einen signifikanten Einfluss des Interaktionsverhaltens auf die Kooperationsbereitschaft hin. Bei den Daten muss jedoch berücksichtigt werden, dass es sich um selbstberichtetes Verhalten der Interviewer handelt und diese Messung nicht unbedingt geeignet ist (vgl. Hox/de Leeuw 2002).

3.2 Komplexe Modellierungen zur Erklärung von Kooperation

65

Homans 1961; Thibaut/Kelley 1959) als auch in den Compliance-Ansätzen. Neuere Studien zeigen, dass eine theoretische Integration der beiden Forschungsstränge möglich ist (vgl. Goyder et al. 2006: 28ff.). Genau diese Perspektive wird bei der Theoriebildung im vierten Kapitel aufgenommen.

3.2.1.4 Leverage-Salience-Theorie Man kann konstatieren, dass dem Gesamtkonzept von Groves und Couper (1998) implizit die Annahme zugrunde liegt, dass die Wirkungen der einzelnen Determinantengruppen, d.h. der gesellschaftlichen, der Design- und Interviewerfaktoren sowie der Elemente, die in der Interaktion eingesetzt werden können, letztlich meist über die individuellen Erwartungen der Zielperson, d.h. über die fünfte der von Groves/Couper (1998) ausgeführten Kategorien (siehe Kap. 3.2.1) verlaufen. Dahinter steckt die handlungstheoretische Annahme, dass bei der Zielperson eine individuelle Kosten-Nutzen-Abwägung vollzogen wird, wenn sie sich zwischen den beiden Handlungsalternativen Kooperation oder Verweigerung entscheiden muss. Die Hypothese einer handlungsleitenden Kosten-Nutzen-Analyse zur Erklärung von Befragtenverhalten ist nicht neu (vgl. Goyder 1987: 163). Während frühere Studien jedoch meist bivariate Effekte für einzelne Designmerkmale untersucht haben – im Sinne von „Ein Incentive erhöht bei Zielpersonen den Nutzen, wirkt daher (situationsunabhängig) ausschöpfungssteigernd“ – wurden über die so genannte Leverage-Salience-Theorie von Groves und seinen Kollegen erstmals multiple Einflüsse modelliert (vgl. Groves et al. 2000: 299). Im Gegensatz zu einer einfachen (bivariaten) Kosten-Nutzen-Abwägung wird dabei davon ausgegangen, dass verschiedene Designelemente, wie etwa ein Incentive, das Thema oder der Sponsor von bestimmten Zielpersonengruppen positiv oder negativ bewertet werden. Gleichzeitig sind die Merkmale den einzelnen Personen unterschiedlich wichtig. Diese Wichtigkeit drückt sich bildlich in ihrer „Hebelkraft“ (=„leverage“) aus. Wenn man sich eine Balkenwaage vorstellt, sind die Merkmale daher entweder auf der einen (=positive Bewertung) oder auf der anderen Seite (=negative Bewertung) angesiedelt. Gleichzeitig liegen sie weiter innen (=kleine Hebelkraft) oder weiter außen (=große Hebelkraft) auf dem Balken. Hinzu kommt, dass gewisse Designelemente vom Interviewer (oder Forscher) hervorgehoben, d.h. „salient“ gemacht werden können. So kann bei einer politischen Umfrage, z.B. im Anschreiben oder durch den Interviewer, explizit darauf hingewiesen werden, dass es sich um Fragen zum politischen System handelt, wenn man davon ausgeht, dass die Zielperson daran interessiert ist. Aus der Kombination der Faktoren Wichtigkeit, Bewertung und Salienz setzt sich die Wirkung eines Merkmals im Hinblick auf die Kooperationsbereitschaft zusammen (vgl. Groves et al. 2000; Groves/Peytcheva 2008). Die Gesamtbetrachtung gibt schließlich den Ausschlag, um bei der verwen-

66

3 Der Forschungsstand

deten Metapher zu bleiben, auf welche Seite – Kooperation oder Verweigerung – sich die Waage senkt. Abbildung 6:

Die Grundidee der Leverage-Salience-Theorie Incentive Sponsor

Thema Sponsor

Thema

Incentive

Verweigerung

Verweigerung

Kooperation

Kooperation

Person 2

Person 1

Bewertung negativ

Hebelkraft L (Leverage)

Bewertung positiv Größe des Balls S (Salience)

Verweigerung

Kooperation

Quelle: Eigene Darstellung nach Groves et al. (2000: 300).

Ein Vorteil der Leverage-Salience-Theorie ist, dass sie „Gegengewichte“ (Groves et al. 2000: 302) erlaubt, d.h. die Annahme beinhaltet, man könne über ein entsprechend positiv gewichtetes Designelement ein negatives ausgleichen. Damit lässt sich beispielsweise gut erklären, warum Personen, die dem Sponsor einer Studie zwar positiv, dem Thema jedoch negativ gegenüberstehen, bei der Gabe eines Incentives doch noch kooperieren (Abb. 6, Person 1), während andere, die Thema und Sponsor einer Studie sehr viel negativer bewerten, trotz Incentive nicht kooperieren (Abb. 6, Person 2) (vgl. Groves et al. 2004a: 2ff.; Groves et al. 2000; Groves et al. 2006). Die Interviewer werden innerhalb der Leverage-Salience-Theorie als Vermittler angesehen. Sie überbringen das Thema der Studie, repräsentieren den Sponsor und vermitteln die Designelemente wie etwa Incentives oder die Länge der Studie (vgl. Groves/Couper 1998: 192). Letztlich liegt es an ihnen, ob in der Interaktion mit der Zielperson ein bestimmtes Designelement hervorgehoben wird oder nicht. Ein Problem in der Überprüfung der Theorie besteht darin, dass man die kombinierten situationsspezifischen Einflüsse nur in komplexen Forschungsdesigns überprüfen kann. Das theoretische Modell zeigt jedoch, wie NichtBefragungswillige doch noch zu Befragten werden können: Man hat die Möglichkeit, über ein Gegengewicht auf der Designebene (höhere Incentives, geeignete

3.2 Komplexe Modellierungen zur Erklärung von Kooperation

67

Sponsoren, das Nennen bestimmter Themen) die Entscheidung des Individuums zu verändern. Die Grundidee einer individuellen Abwägung ermöglicht es nicht nur, den Einfluss von Designmerkmalen in der Interaktionssituation zwischen Interviewer und Interviewtem zu modellieren, wie es bei Groves et al. (2000: 300) explizit dargestellt wird. Vielmehr ist eine Verallgemeinerung des Modells möglich, indem man davon ausgeht, dass auch andere Einflüsse, wie Normen, Einstellungen gegenüber den Inhalten der Befragung oder bestimmte Werte eine individuelle Hebelkraft entwickeln können. Damit ist die Leverage-Salience-Theorie, die zunächst in der Umfrageforschung zur Erklärung des Einflusses verschiedener Merkmale des Forschungsdesigns entwickelt wurde, geeignet, die Handlungsentscheidung eines Individuums insgesamt zu veranschaulichen. In ein solches allgemeines Modell zur Erklärung der Teilnahmebereitschaft auf der Ebene der Zielpersonen lassen sich dann verschiedene Determinantengruppen der Kooperationsentscheidung einbetten.

3.2.2 Erklärungsmodelle auf der Ebene der Zielperson In der Forschungsliteratur zu Ursachen und Konsequenzen der Nicht-Teilnahme bei (politischen) Umfragen und den daraus resultierenden Konsequenzen lassen sich vier Erklärungsmodelle hervorheben, die sowohl einen integrativen Ansatz verfolgen als auch mehrere, für die politische Einstellungs- und Verhaltensforschung relevante, Erklärungsfaktoren einbeziehen. Neben dem bereits erwähnten Konzept von Groves/Couper (1998) sind hier die Arbeiten von Brehm (1993), Voogt (2004) und Schnell (1997) zu nennen. Allen gemeinsam ist die Grundannahme, dass die Zielperson eine Kosten-Nutzen-Abwägung vornimmt, in der verschiedene Nutzenanreize wirken können (vgl. Brehm 1993; Groves/Couper 1998: 119ff.; Groves et al. 1992). Sowohl materielle als auch (sozial-)psychologische Anreize, die sich aus Einstellungen ableiten lassen, können die Entscheidung des Individuums beeinflussen (vgl. bereits Bradburn 1978). Meist lassen sich die Modelle im Rahmen der subjektiven Wert-Erwartungstheorie (=SEU-Theorie, „subjective expected utility“-Theorie) reformulieren (vgl. Esser 1999, siehe dazu auch Kap. 4). Bei dieser Variante der Rational Choice-Theorie wird angenommen, dass Personen bei gegebenen Präferenzen eine Situation und die eigenen Handlungsalternativen subjektiv wahrnehmen und interpretieren, die Folgen einer Handlung abwägen und anschließend diejenige Handlungsalternative auswählen, deren Nutzenwert ihnen im Vergleich zu den anderen Alternativen am höchsten erscheint. Auch Erfahrungen und Ressourcen können dabei als Grundlage mit in die subjektiven Bewertungen eingehen. Im Folgenden werden zunächst die einzelnen Modelle vorgestellt, anschließend werden die zentralen theoretischen Annahmen daraus abgeleitet.

68

3 Der Forschungsstand

3.2.2.1 Die Erklärung bei Groves/Couper auf der Individualebene Bereits Groves und Couper konstatieren, dass Theorien aus der Sozialpsychologie zur Erklärung der Kooperationsentscheidung auf der Individualebene herangezogen werden sollten, um eine „strenge“ Kosten-Nutzen-Perspektive zu ergänzen: Die Autoren benennen dabei explizit die soziale Austauschtheorie, die soziale Isolationsthese, die Wirkung von Autoritäten sowie „weitere Einflüsse“ wie Kriminalitätsfurcht oder die Wichtigkeit des Themas, die – so argumentieren sie – komplementär zu einer „rein materiellen“ Kosten-Nutzen-Abwägung angelegt sind (vgl. Groves/Couper 1998: 125ff., 131ff., 141ff., 145ff.). Zunächst soll nun das Grundkonzept der Kombination von ökonomischen Theorien mit sozialpsychologischen Ansätzen vorgestellt werden. Im Anschluss daran wird auf die einzelnen Theorien eingegangen, die zur Ergänzung der Kosten-Nutzen-Abwägung bei den beiden Autoren beschrieben sind. Groves und Couper plädieren dafür, dass auch Einstellungen, Werte sowie Normen in die theoretischen Überlegungen einbezogen werden sollten, weil sie die Kosten-Nutzen-Abwägung der Zielpersonen beeinflussen können. Die zentrale Annahme ist, dass alle durch die Kooperation entstehenden Kosten mit dem erwarteten Nutzen verrechnet werden. Solange das Ergebnis dieser „rationalen“ Abwägung positiv ist, wird kooperiert. Als mögliche Kosten für die Befragten nennen Groves und Couper den kognitiven Aufwand beim Verstehen und Beantworten der Fragen, die Zeit, die man benötigt, um an der Umfrage teilzunehmen, die Opportunitätskosten, d.h. den entgangenen Nutzen aus anderen Tätigkeiten, denen man sich in der für das Interview notwendigen Zeit hätte widmen können, und die Peinlichkeit, die daraus entstehen kann, dass man Informationen über sich selbst preisgeben muss (vgl. Groves/Couper 1998: 119ff.; auch Biemer/Lyberg 2003: 107; Bradburn 1977). Der Nutzen einer Umfrageteilnahme kann hingegen daraus resultieren, dass man lästigere Aufgaben, die man erledigen müsste, aufschieben kann oder auch aus der alltäglichen Routine herauskommt (vgl. auch Morton-Williams/Young 1987: 48). Hinzu kommt, dass man Spaß daran haben könnte, über neue Themen nachzudenken und mit anderen Menschen zu interagieren, in der Interaktion mit dem Interviewer neue Informationen erhält oder man sich geehrt fühlt, weil die eigene Meinung gefragt ist. In diesem Modell wird die Entscheidung damit als KostenNutzen-Abwägung modelliert. Der Akteur ist dabei aber auch von Einstellungen und sozialen Einflüssen beeinflusst, da sich auch daraus Kosten- oder Nutzenfaktoren ergeben können. So kann auch die Vorstellung, eine „gute Tat“ vollbracht zu haben, d.h. die Zufriedenheit, einer subjektiv wahrgenommenen Bürgerpflicht nachgekommen zu sein und damit so etwas wie einen sozialen Dienst an der Gesellschaft verrichtet zu haben, eine Teilnahmemotivation sein (vgl. Groves/Couper 1998: 121; Goyder 1987: 173). Damit sind expressive bzw. altruistische psychologische Anreize mit in die Erklärung der Handlungsentscheidung einbezogen und es ist ausdrücklich ein weiter Nutzenbegriff zugrunde gelegt.

3.2 Komplexe Modellierungen zur Erklärung von Kooperation

69

Groves und Couper weisen im weiteren Verlauf ihrer Argumentation darauf hin, dass eine „stärker rationale“ – womit sie materiell meinen – Kosten-NutzenAnalyse insbesondere dann stattfindet, wenn die „zentrale Route“ der Informationsverarbeitung69 abläuft, d.h. wenn die Zielperson interessiert und motiviert ist (vgl. Groves/Couper 1998: 122). An dieser Stelle spiegelt sich die Annahme wider, dass aufgrund der begrenzten Informations- und Entscheidungskapazitäten nicht alle Entscheidungen eines Akteurs wohlüberlegt sein können (vgl. zu dem dahinter liegenden Menschenbild auch Lindenberg 1985, 1990 und zum Konzept der begrenzten Rationalität auch Simon 1955, 1959). Aus diesem Grund beziehen sich Groves und Couper auf die verschiedenen Routen der Informationsverarbeitung. Damit liegt ihrem Ansatz implizit die Idee dualer Prozesse der Informationsverarbeitung zugrunde, die bereits seit Mitte der 1980er Jahre in der sozialpsychologischen Einstellungs- und Verhaltensforschung diskutiert werden. In Anlehnung an das MODE-Modell zum dualen Prozessieren von Fazio (1990) nehmen sie an, dass Zielpersonen verschiedene Entscheidungsmodi besitzen können, in denen jeweils unterschiedliche Determinanten die Handlungsentscheidung beeinflussen. Im automatisch-spontanen Modus wirken stärker generalisierte Einstellungen auf die Handlungsentscheidung, im rationalen Modus eher Kosten-Nutzen-Analysen. Diese Annahmen bilden bei Groves und Couper den Begründungszusammenhang, warum die theoretische Perspektive einer Kosten-Nutzen-Abwägung durch andere Theorieelemente, wie generalisierte Einstellungen gegenüber der Gesellschaft, anderen Menschen, dem Sponsor oder auch dem Interviewer zur Erklärung der Teilnahmeentscheidung ergänzt werden sollte (zum dualen Prozessieren siehe auch Kap. 4). Die Ausführungen sind an dieser Stelle jedoch nicht ganz eindeutig, was an der fehlenden Präzision des Rationalitätsbegriffs liegt. Problematisch ist an der Darstellung, dass bei der Begründung der Ergänzung einer Rational Choice (RC)Perspektive zwei Aspekte miteinander vermischt werden. Zum einen beschreiben Groves und Couper, dass auch weiche Faktoren, wie Normen und (spezifische) Einstellungen als Nutzenmotive in die Kosten-Nutzen-Abwägung eingehen. Dafür müssten sie jedoch die Grundidee einer rationalen Entscheidung nicht aufgeben, sondern lediglich (wie bspw. bei der SEU-Theorie) auf der Grundlage einer Variante der RC-Theorie mit einem weiten Nutzenbegriff argumentieren. Sie beziehen sich in der Begründung, warum sie Normen, Werte und Einstellungen zur Erklärung hinzunehmen, aber zum anderen auch auf die periphere Route der Informationsverarbeitung, d.h. auf das so genannte automatisch-spontane Prozessieren. Dabei sind (generalisierte) Einstellungen als unabhängige Variablen notwendig, um stärker heuristische und unreflektierte Entscheidungen von wenig motivierten Zielpersonen zu erklären. Leichte Inkonsistenzen zeigen sich, wenn Groves/Couper in

69 Zur Annahme verschiedener Routen der Informationsverarbeitung und dem theoretischen Konzept des Elaboration Likelihood Models siehe Petty/Cacioppo (1986).

70

3 Der Forschungsstand

der Folge ihrer Argumentation bei den interessierten und motivierten Zielpersonen wieder auf „rein materielle“ Kosten-Nutzen-Abwägungen hinweisen. In der theoretischen Argumentation vermischen die Autoren damit zwei Argumente: die Variante der RC-Theorie und das duale Prozessieren. Die Variante der RC-Theorie ist aber zunächst unabhängig von der Idee des dualen Prozessierens. Sie gibt lediglich an, welche verschiedenen Formen von Nutzenanreizen wirken können. Entweder sind dies nur materielle Nutzenanreize, wie z.B. Geld oder drastische Sanktionen, oder auch weichere Anreize, wie z.B. ein positives Gefühl, weil man einem sympathischen Interviewer helfen konnte oder der Spaß, den man an einer Teilnahme hat. Wenn sich Groves und Couper daher auf einen weiten Rational Choice-Begriff beziehen, müssten sie auch bei den interessierten und motivierten, reflektiert agierenden Zielpersonen weiche Nutzenanreize zulassen, die in die rationale Kosten-Nutzen-Abwägung eingehen. Dieses Argument beziehen sie jedoch nicht mit in ihre Überlegungen ein (siehe Abb. 7, „Lücke“). Abbildung 7:

Die Lücke in den theoretischen Annahmen von Groves/Couper

rational-überlegt/ reflektiert automatisch-spontan/ heuristisch Quelle: Eigene Darstellung. Entscheidungsmodus

Rational-Choice-Begriff eng weit X (Lücke) X

Vielmehr modellieren sie lediglich einerseits rational-überlegtes Handeln ohne den Einfluss von weichen Anreizen und andererseits automatisch-spontanes Handeln, das einstellungsdominiert ist. Sie unterscheiden nicht zwischen spezifischen Einstellungen, die auch situativ in die rational-überlegte Abwägung eingehen können, und generalisierten Einstellungen, die wirken, wenn automatisch-spontane Handlungsmuster ausgelöst werden. Diese Perspektive könnte jedoch zu einem umfassenderen Verständnis der Handlungsentscheidung beitragen und würde neuere Forschungserkenntnisse zum Einstellungsbegriff in die Modellierung integrieren (vgl. dazu auch die weiteren Ausführungen zum Einstellungsbegriff in Kap. 4). Dennoch kann man festhalten, dass bei Groves und Couper erstmals konkrete Annahmen einer Erweiterung der strengen RC-Perspektive getroffen werden. Diese Sichtweise ist innovativ und soll daher detaillierter vorgestellt werden. Dazu werden nun die vier sozialpsychologischen Konzepte (Austauschtheorie, Isolationsthese, das Konzept der Autoritäten und die „weiteren“ Einflüsse) im Einzelnen vorgestellt. Man kann zeigen, dass die letzten drei im Grunde genommen auch auf die Annahmen der Austauschtheorie zurückzuführen sind. Die soziale Austauschtheorie, die von Groves/Couper (1998: 125) als erstes Theoriekonzept zur Ergänzung der „reinen RC-Erklärung“ benannt wird, ist ein

3.2 Komplexe Modellierungen zur Erklärung von Kooperation

71

Ansatz, der dem RC-Ansatz nahe steht (vgl. auch Heath 1976; Goyder 1987) und bereits von Dillman (1978) zur Erklärung der Teilnahme an schriftlichen Befragungen herangezogen wurde. Dabei wird angenommen, dass soziales Handeln – ähnlich wie das „Markthandeln“ – grundsätzlich ein Austausch von Gütern ist. Diese Güter beim sozialen Handeln können jedoch – im Gegensatz zum marktorientierten Handeln – sowohl materiell als auch immateriell sein. Eine weitere Grundannahme des Konzepts der Austauschtheorie ist, dass die Handlungsentscheidung des Individuums in ein soziales Umfeld eingebettet ist und damit Normen, insbesondere Normen der Reziprozität, wirken (vgl. Goyder 1987: 163).70 Die soziale Austauschtheorie integriert damit explizit Merkmale auf der Einstellungsebene in die Kosten-Nutzen-Abwägung zur Erklärung einer Handlungsentscheidung: Wenn der Austausch zwischen Individuen nicht rein ökonomischen Prinzipien unterliegt, können auch längerfristige soziale Normen und Werte, wie Vertrauen und Gerechtigkeit zwischen den interagierenden Personen zur Erklärung von Verhalten beitragen (vgl. allgemein zur Austauschtheorie Blau 1964; Homanns 1961; konkret auf die Interviewsituation bezogen Groves/Couper 1998; Dillman 1978; Dillman et al. 2002). So resultieren aus eigenen Erfahrungen oder aus Erfahrungen von Personen, die man als sich selbst ähnlich wahrnimmt, Erwartungen oder Verpflichtungen und damit stärker emotionale Kosten-Nutzen-Abwägungen:71 „All social ‚commodities‘ (ranging from measurable entities, such as time and information, to less tangible socio-emotional goods, such as approval) are part of an intuitive bookkeeping system in which debts […] and credits […] are documented” (Groves/Couper 1998: 126).72 Damit wird berücksichtigt, dass eine Interaktion demnach nicht immer wieder neu am Nullpunkt startet, sondern in einem Geflecht von Erwartungen stattfindet. Ein zentrales Argument im Rahmen der Austauschtheorie ist die sozialpsychologische Vorstellung einer Reziprozitätsnorm, deren Annahme ist, dass eine Person eher positiv reagiert, wenn ihr zuvor positives Verhalten entgegengebracht wurde (vgl. Cialdini et al. 1975; Groves et al. 1992: 480; Regan 1971; siehe auch Stegbauer 2002). Für Umfragen, die meist stellvertretend für bestimmte gesellschaftliche Institutionen (Staat, Wissenschaft, etc.) durchgeführt werden, resultiert daraus, dass Zielpersonen, die diesen Institutionen insgesamt positiv gegenüberstehen oder sich aus früheren Kontakten verpflichtet fühlen, 70

In der Forschung ist umstritten, ob es sich dabei eher um ein ökonomisches Konzept, wie z.B. bei Blau (1964) dargestellt, handelt, oder ob der behavioristische Aspekt eher im Vordergrund steht, wie etwa bei Homans (1961) oder Schwartz (1977) formuliert (vgl. Goyder 1987: 166). Dabei ist die zentrale Frage, wie bewusst bzw. rational die Entscheidung zu Kooperation oder Verweigerung abläuft. 71 Dillman (1978) konstatiert in diesem Zusammenhang für die Beziehung zwischen Zielperson und Studienleitung, dass eine gesellschaftlich universell gültige Reziprozitätsnorm greifen kann („Hilf demjenigen, der Dir hilft“), wenn beispielsweise kleine symbolische Geschenke als Vorableistung eingesetzt werden und auf diese Weise Vertrauen gegenüber der sozialen Austauschbeziehung generiert wird (vgl. auch Gouldner 1960). Goyder (1987) fasst die Idee des sozialen Austauschs weiter und argumentiert, dass diese Beziehung auch zwischen einem Individuum und der Gesellschaft wirken kann. 72 Das Problem dieser theoretischen Konzeption und ihrer Anwendung auf die Situation der Anfrage eines Interviews ist, dass sie diffus und unspezifisch ist und dass die daraus abgeleiteten Hypothesen nur schwer zu falsifizieren sind (vgl. Groves/Couper 1998: 127).

72

3 Der Forschungsstand

etwas zurückzugeben, mit einer höheren Wahrscheinlichkeit kooperieren (vgl. Groves et al. 1992: 481). Hierbei handelt es sich um eine Form „altruistischer“ Anreize, die jedoch nicht völlig selbstlos sind, sondern vielmehr den Nutzen eines positiven Gefühls für das Individuum mit sich bringen (vgl. Heberlein/ Baumgartner 1978: 461).73 Aus der sozialen Austauschtheorie lässt sich die soziale Isolationshypothese ableiten (vgl. Groves/Couper 1998: 131ff.; siehe ähnliche Konzepte auch bei Brehm 1993 mit der „social involvement hypothesis“ und bei Voogt 2004, Voogt/Saris 2003 mit den Konstrukten „social involvement“ und „attachment to society“ im weiteren Verlauf dieses Kapitels). Diese besagt, dass die Kooperationsbereitschaft eines Individuums mit zunehmender Integration in die Gesellschaft steigt und mit zunehmender sozialer Isolation sinkt. Sie bezieht sich damit nicht nur auf den Einfluss von Einstellungen gegenüber der konkreten Institution oder Person, die die Umfrage durchführt, sondern integriert die Position der Zielperson gegenüber der Gesamtgesellschaft. Dabei wird argumentiert, dass mit zunehmendem Grad sozialer Isolation bei den Individuen ein Gefühl der Entfremdung von der Gesellschaft entsteht. Die Zielperson nimmt sich selbst als außerhalb der Gesellschaft stehend und wenig einflussreich wahr. Für diese entfremdeten Zielpersonen hat die Teilnahme an einer Umfrage, deren Ergebnisse der Gesellschaft zugutekommen, keinen Nutzen. Dahinter liegt die Annahme, dass durch sozialen Austausch langfristig universell geteilte Normen in einer Gesellschaft entstehen, wie z.B. das Gefühl der Bürgerpflicht („Civic Duty“). Diese führt dazu, dass sich integrierte Menschen zu sozialer Beteiligung verpflichtet fühlen. Die Teilnahme an einer Befragung wird als sozialer Event angesehen, weil gesellschaftliche Fragen und Phänomene thematisiert werden und die Erkenntnisse aus den Umfragestudien wieder der Gesamtgesellschaft zur Verfügung stehen (vgl. Dillman 1978; Gallup 1944; Goyder 1987: 161; Groves et al. 2000: 302f.). Diejenigen, die sozial isoliert sind, fühlen sich nicht in dem Maße an diese gesellschaftlichen Partizipationsnormen gebunden. Entfremdung aufgrund von sozialer Isolation kann sich sowohl in Form eines Gefühls der eigenen Machtlosigkeit als auch in fehlendem Vertrauen in die Responsivität des Systems äußern. Aus beiden Gründen könnte man annehmen, dass die Teilnahme von entfremdeten Personen eher verweigert wird als bei sozial eingebundenen Zielpersonen (vgl. Groves/Couper 1998). Im ersten Fall gehen die Zielpersonen davon aus, dass ihre eigene Meinung sowieso nichts verändert, im zweiten Fall, dass Umfragen bzw. die daraus gewonnenen Informationen keine relevante Rolle im System haben. Beide Determinanten erinnern an relevante Kon73 Das aus der sozialen Austauschtheorie abgeleitete „intuitive bookkeeping system [...]“ (Groves/Couper 1998: 126) bezieht sich sowohl auf spezifische Einstellungen, die mit in die konkrete Kosten-Nutzen-Abwägung eingehen, als auch auf die Herausbildung generalisierter Einstellungen. Diese können dann in der konkreten Situation einer Interviewanfrage das automatisch-spontane Prozessieren einer Zielperson dominieren. Wie bereits kritisiert, fehlt bei Groves/Couper jedoch die Integration spezifischer Einstellungen in beide Entscheidungsmodi.

3.2 Komplexe Modellierungen zur Erklärung von Kooperation

73

zepte, die in der politischen Partizipationsforschung diskutiert werden: die interne und externe politische Efficacy (siehe Kap. 4). Die Annahme, dass sich die Einbindung in die Gesellschaft positiv auf die Kooperationsbereitschaft auswirkt, formulierte Esser bereits Anfang der 1970er Jahre: „Die Involviertheit in die soziale Umwelt scheint somit eine der grundlegendsten Voraussetzungen zur Teilnahme an sozialwissenschaftlichen Interviews zu sein“ (Esser 1973: 121).74 Neben sozialen Normen und gesellschaftlicher Isolation nennen Groves und Couper auch Einstellungen gegenüber Autoritäten und die wahrgenommene Legitimität einer Umfrage als Faktoren, die zur Erklärung von Kooperation und Verweigerung beitragen können (vgl. Groves et al. 1992; Groves/Couper 1998: 141ff.; Morton-Williams/Young 1987). Den Anfragen von Autoritäten kommt man demzufolge eher nach als Anfragen von unbekannten Personen oder Institutionen, die nicht als Autorität wahrgenommen werden. Daraus ergibt sich, dass Zielpersonen wahrscheinlicher an einer Befragung teilnehmen, wenn sie die Studie als legitime Anfrage einer Autorität (etwa des Staates oder einer Universität) wahrnehmen. Was jedoch als „Autorität“ angesehen wird, kann sich von Individuum zu Individuum unterscheiden und ist abhängig von der jeweiligen Einstellung gegenüber den einzelnen Institutionen. Dieser Ansatz kann beispielsweise den empirisch auftretenden Einfluss der Nennung verschiedener Sponsorentypen auf die Kooperationsbereitschaft erklären. Studien mit universitärem und/oder staatlichem Hintergrund zeigen dabei höhere Ausschöpfungen als Studien aus dem kommerziellen Marktforschungsbereich (vgl. Blumberg et al. 1974; Fox et al. 1988; Goyder 1985a: 247; Heberlein/Baumgartner 1978; Orr 1976; Presser et al. 1992; siehe aber auch die Metaanalysen von Yammarino et al. 1991; Engel/Schnabel 2004).75 Die Wirkung der Wahrnehmung von Autoritäten ist jedoch kein neuer Aspekt, sondern ist bereits im Rahmen der Austauschtheorie enthalten. Auch dort wird argumen-

74 Aus diesem theoretischen Argument, das einen Zusammenhang zwischen der sozialen Einbindung in die Gesellschaft und der Entscheidung zu kooperieren postuliert, lassen sich empirisch Hypothesen über den Zusammenhang zwischen dem Alter, der Wohnortgröße oder dem sozioökonomischen Status und der Kooperationsbereitschaft ableiten. Ältere Menschen sind oft weniger in die Gesellschaft involviert als jüngere Personen. Diesen Effekt bezeichnet Goyder (1987) als „disengagement“, Groves/Couper (1998) fassen ihn unter den Begriffen „soziale Isolation“ oder „Desintegration“ dieser Gesellschaftsteile zusammen. Dies erklärt den Befund, dass ältere Menschen eher verweigern, weil sie häufiger am Rand der Gesellschaft stehen (vgl. Allehoff 1980: 27; Esser 1973: 120; Goyder 1987; Groves/Couper 1998: 131). Das Argument könnte in ähnlichem Maß auf Menschen in prekären Lebensverhältnissen und damit auf den sozioökonomischen Status als Einflussfaktor zutreffen. Dazu gehören Langzeitarbeitslose bzw. Arbeiter im Niedriglohnsektor, einkommensschwache Selbstständige und Angestellte, Praktikanten, Alleinerziehende oder Kranke. Auch für diese Gruppe kann man annehmen, dass sie weniger in die Gesellschaft eingebunden sind. Allerdings lässt sich dieser Zusammenhang in bisherigen Studien empirisch nicht zeigen. Schließlich lässt sich auch der Zusammenhang zwischen der Wohnortgröße und der Kooperationsbereitschaft auf die soziale Einbindung einer Person zurückführen: In Städten ist der Grad sozialer Desorganisation aufgrund einer höheren Bevölkerungsdichte größer, was sich auf die Einstellung der Bürger gegenüber HilfeAnfragen auswirken kann (vgl. Couper/Groves 1994, 1996; House/Wolf 1978). 75 Hierbei sind auch Wechselwirkungen möglich, etwa zwischen sozialer Integration und der Wahrnehmung von Autoritäten. Man könnte annehmen, dass diejenigen, die sozial isoliert leben, weniger legitime soziale und politische Autoritäten wahrnehmen werden, da sie weniger in gesellschaftliche Auswahlprozesse involviert sind.

74

3 Der Forschungsstand

tiert, dass die Autoritäten positiv auf die Kooperationsbereitschaft wirken, wenn positive Assoziationen, etwa aus früheren Erfahrungen, mit ihnen verbunden sind. Neben Austauschtheorie, Isolationsthese und Autoritäten-Ansatz werden bei Groves und Couper noch „weitere Einflüsse“ diskutiert, welche die Teilnahmeentscheidung auf der Individualebene beeinflussen. Hierbei nennen sie das Interesse am Thema und die individuelle Kriminalitätsfurcht (vgl. Groves/Couper 1998; Couper 1997). Die diskutierten Einflüsse müssen jedoch nicht, wie bei Groves/Couper, getrennt von den zuvor aufgezeigten Theorien diskutiert werden. Sie sind problemlos auf die Annahmen der sozialen Austauschtheorie und der daraus abgeleiteten sozialen Isolationsthese zurückzuführen.76 Sozial isolierte Menschen haben in der Regel weniger Interesse an ihrer Umwelt und damit auch an den Themen sozialwissenschaftlicher Befragungen. Gleichzeitig lässt sich vermuten, dass mit zunehmenden sozialen Kontakten auch die Kriminalitätsfurcht sinkt, da erlernt wird, dass Fremde nicht unbedingt Böses wollen (vgl. zur Kriminalitätsfurcht auch die bereits diskutierten Einflüsse auf der gesellschaftlichen Ebene, siehe Kap. 3.2.1.1).

3.2.2.2 Das Vier-Ebenen-Modell von Brehm Das von Groves und Couper im vorangegangenen Abschnitt vorgestellte Konzept nimmt Bezug auf eine Arbeit von Brehm (1993). In „The Phantom Respondents“ wird ein integratives Modell zur Erklärung der Kooperationsbereitschaft bei Umfragen entwickelt, das sowohl verschiedene Formen von Einstellungen in die Erklärung einbezieht als auch auf das grundlegende Prinzip einer Kosten-NutzenAbwägung rekurriert. Dabei werden vier Einstellungsebenen genannt, welche die Entscheidung zu Kooperation oder Verweigerung beeinflussen können: die Einstellung gegenüber Fremden im Allgemeinen, gegenüber dem Interviewer, gegenüber der Umfrage (und Umfragen im Allgemeinen) sowie die Einstellung gegenüber sich selbst (vgl. für die folgenden Ausführungen Brehm 1993: 50ff.). Als erstes nennt Brehm die Einstellung gegenüber Fremden im Allgemeinen („suspiciousness“, Brehm 1993: 52) als Einflussfaktor auf die Kooperationsbereitschaft. Wenn man Angst vor Fremden hat, ist die Teilnahme an einer persönlich-mündlichen Befragung unwahrscheinlicher als wenn man Spaß daran hat, Fremde zu treffen, mit ihnen zu kommunizieren und Meinungen auszutauschen. In diesen Bereich fällt auch die hohe Kriminalitätsfurcht einer Zielperson, die sich aus der Einstellung gegenüber Fremden ergibt. Auch wenn man andere Menschen als Eindringlinge in die eigene Privatsphäre empfindet, ist eine Kooperation eher un76

Vielleicht diskutieren Groves und Couper diese Einflüsse getrennt von den anderen Erweiterungen als viertes Determinantenbündel, weil sie erkennen, dass es sich bei diesen so genannten „weiteren Einstellungen“ um einen anderen Typ von Einstellungen handelt. Gerade das Interesse am Thema ist eine situative spezifische Einstellung, im Gegensatz zu den bis dahin diskutierten generalisierten Einstellungen.

3.2 Komplexe Modellierungen zur Erklärung von Kooperation

75

wahrscheinlich (vgl. eine ähnliche Argumentation bei Goyder 1986; Hartmann et al. 1968; Stocké/Langfeldt 2003: 58).77 Zweitens beeinflusst die Einstellung der Zielperson gegenüber dem konkreten Interviewer die Kooperationsbereitschaft. Wenn die Zielperson dem Interviewer vertraut und man sich sympathisch ist, steigt die Wahrscheinlichkeit zur Teilnahme an der Umfrage, weil sich ein positives Gefühl für den Befragten ergibt, wenn er jemandem, der ihm sympathisch ist, eine Anfrage positiv beantworten kann. Brehm argumentiert, dass in diesen ersten beiden Bereichen – der Einstellung gegenüber Fremden im Allgemeinen und dem Interviewer im Speziellen – „reine RC-Erklärungen“ (Brehm 1993: 68), wie er sie nennt, nur bedingt Plausibilität für sich beanspruchen können und eher „Bauchentscheidungen“ getroffen werden (vgl. Brehm 1993: 68f.). Allerdings muss man hierbei, unter Verwendung des weiter gefassten SEU-Verständnisses von Esser, den RC-Ansatz und die Annahme einer rationalen Entscheidung des Individuums zunächst nicht verlassen. Die Sympathie gegenüber dem Interviewer führt dazu, dass die Teilnahme für die Zielperson mit einem Nutzen verbunden ist: Man kann einem sympathischen Menschen eine Bitte erfüllen, woraus ein gutes Gefühl bzw. eine positive Emotion resultiert. Ebenso lässt sich aus der Einstellung gegenüber Fremden ein Kostenfaktor ableiten. So kann die Anfrage, ob (in der eigenen Wohnung) ein Interview geführt werden kann, bei ängstlichen Menschen psychische Kosten in Form von Angst, Misstrauen oder Unsicherheit hervorbringen. Neben der Einstellung zu Fremden und zu Interviewern sind auch positive Zusammenhänge zwischen der Einstellung gegenüber Umfragen im Allgemeinen bzw. der bestimmten Umfrage im Speziellen und der Kooperationsbereitschaft zu erwarten (vgl. Brehm 1993: 59f.). Dabei sind wiederum verschiedene Einstellungsformen bedeutsam, sowohl langfristige Einstellungen aufgrund von Erfahrungen mit früheren Befragungen als auch spezifische Einstellungen, die auf die konkrete Situation der Umfrage bezogen sind. Wenn Umfragen generell als etwas Relevantes und Interessantes wahrgenommen werden und der Nutzen von Umfragen für die Gesellschaft, die Wissenschaft und letztlich für die Zielperson selbst hoch ist, wird angenommen, dass das Individuum kooperiert (vgl. auch Biemer/Lyberg 2003: 108; Bradburn 1978; Stocké/Langfeldt 2003). Bereits Goyder (1987: 161) weist darauf hin, dass stärker generalisierte Einstellungen, wie der Schutz der eigenen Privatsphäre oder eine Begeisterung für die Umfrageforschung, Faktoren sind, die die Kooperationsentscheidung beeinflussen können. Bei der Einstellung gegenüber einer konkreten Umfrage wird angenommen, dass einerseits selektive ergebnisorientierte Erwägungen, andererseits aber auch generellere Entscheidungsmuster zur Erklärung des Verhaltens beitragen können. Brehm argumentiert, dass die – in seinem Sprachge77 Über diese Annahme einer Unsicherheit gegenüber Fremden wird in der Forschung oftmals die empirisch auftretende Unterrepräsentation von Frauen und Älteren erklärt (vgl. Schräpler 2000: 119; siehe auch Koch 1997; Morton-Williams 1993).

76

3 Der Forschungsstand

brauch „rationalen“ – selektiven ergebnisorientierten Kosten-Nutzen-Argumente wirken können, wenn die Zielperson motiviert und interessiert ist. „Sozialpsychologische Reize“ wirken hingegen stärker, wenn die Zielpersonen vom Thema der Anfrage nur wenig persönlich betroffen sind (vgl. Brehm 1993: 69). Brehms Herangehensweise lässt sich grundsätzlich in Form einer RCModellierung umsetzen, ohne dass man – wie er – zwischen RC und sozialpsychologischen Modellen trennen muss. Dabei wird nicht davon ausgegangen, dass es sich um zwei unterschiedliche Theorieblöcke handelt, sondern ein weiter Nutzenbegriff verwendet. Zudem lassen sich seine Annahmen in ein Modell mit der Unterscheidung verschiedener Entscheidungsmodi einfügen, wie bereits bei Groves und Couper ausgeführt (siehe ausführlicher Kap. 4). Auf diese Weise lassen sich sowohl generalisierte als auch spezifische Einstellungen in die Erklärung des Kooperationsverhaltens integrieren. Damit wird angenommen, dass es durchaus „rational“ ist, in bestimmten Situationen automatisch-spontan und stärker von generalisierten Einstellungen geleitet zu handeln, weil dadurch etwa Informationskosten reduziert werden (vgl. Esser 1996, 2001). Gleichzeitig können spezifischere Einstellungen auch in eine reflektierte Kosten-Nutzen-Entscheidung eingehen. Die Entscheidung, in welchem Modus gehandelt wird, ist – zumindest nach Esser – wiederum eine Entscheidung, die in rationaler Art und Weise gefällt wird: Weil automatisch-spontanes Handeln nach generalisierten Einstellungen die Handlungsentscheidungen vereinfacht, handelt man nach ihnen, solange man annimmt, dass es effizient und passend ist. Relevant ist hierbei auch die Unterscheidung in Hochund Niedrigkostensituationen, die es ermöglicht anzugeben, wann welcher Entscheidungsmodus dominiert. In ersteren sind die Zielpersonen motiviert, stärker rational-überlegt zu entscheiden, in den letztgenannten werden Entscheidungen eher automatisch-spontan gefällt (vgl. zu dieser Unterscheidung die Arbeiten von Kliemt 1986; Mensch 2000; Quandt/Ohr 2004). Schließlich beeinflusst das Bild, das eine Zielperson von sich selbst hat, als vierte Einstellungsebene in Brehms Modell die Teilnahmebereitschaft. Die Zielperson muss annehmen, kompetent zu sein und daher auch teilnehmen zu können. Sie muss das Gefühl haben, mit ihrer Teilnahme etwas bewegen zu können. Gleichzeitig muss sie dem Interviewer gegenüber auch kooperativ sein wollen und sich selbst als jemanden wahrnehmen, der gerne hilfsbereit ist (vgl. Brehm 1993: 51, 64). Brehm entwickelt damit ein Erklärungsmodell für die Teilnahme an politischen Umfragen, das Einstellungen auf vier Ebenen mit in die individuelle KostenNutzen-Abwägung einbezieht. Er unterscheidet nicht eindeutig zwischen generalisierten und spezifischen Einstellungen, jedoch sind beide in seinen Ausführungen angelegt. Ähnlich verhält es sich mit den verschiedenen Entscheidungsmodi: Auch darauf bezieht sich Brehm nicht explizit, deutet aber stärker automatisch-spontanes Prozessieren bei uninteressierten und wenig betroffenen Zielpersonen an.

3.2 Komplexe Modellierungen zur Erklärung von Kooperation

77

Ein weiteres Element der Brehm’schen Studie ist für die vorliegende Arbeit relevant: Die empirische Überprüfung des theoretischen Modells zeigt, dass das Selbstbild und die Einstellung gegenüber der konkreten Anfrage nicht nur auf die Umfrageteilnahme, sondern in ähnlicher Form auf politische Partizipation im Allgemeinen wirken (vgl. Brehm 1993: 69f.). Zentrale Determinanten für beide Formen der Teilhabe sind demnach politisches Interesse und politische Informiertheit. Sie tragen einerseits dazu bei, dass sich eine Person an einer Befragung beteiligt, andererseits bewirken sie, dass sich Bürger politisch und gesellschaftlich engagieren. Brehm schlussfolgert daher, dass diejenigen, die weniger an Politik interessiert sind, in den Umfragen ebenso unterrepräsentiert sind wie diejenigen, die weniger informiert sind. Beide Effekte lassen sich, so Brehm, auf individuelle KostenNutzen-Abwägungen hinsichtlich der Einstellung gegenüber der konkreten Umfrage zurückführen, da die kognitiven Kosten, an einer politischen Umfrage teilzunehmen, höher sind, weil man sich für das Thema nicht interessiert. Gleichzeitig besteht die Gefahr, vor dem Interviewer und sich selbst schlecht auszusehen, wenn man wenig informiert ist und Angst haben muss, die gestellten Fragen nicht oder falsch zu beantworten (vgl. Brehm 1993: 61, 159). Damit deutet Brehm als einer der ersten Autoren nicht nur Effekte im Sinne des Survey Variable Cause-Modells an, sondern weist auch auf Effekte im Sinne des Common Cause-Modells hin (wie in der Einleitung beschrieben, siehe Abb. 2, S. 29).

3.2.2.3 „Social involvement” und „Attachment to society” bei Voogt In Anlehnung an die Modelle von Brehm und Groves/Couper entwickelte auch der niederländische Forscher Voogt (2004, siehe auch Voogt/Saris 2003) ein Modell zur Erklärung der Teilnahme an Umfragen. Zwei Aspekte sind in diesen Arbeiten interessant: Erstens greift er den Zusammenhang zwischen Nonresponse bei politischen Umfragen, dem politischen Interesse und dem Wahlverhalten auf. Damit nimmt er eine explizit politikwissenschaftliche Perspektive ein und bezieht auch andere politikwissenschaftliche Konzepte, wie bspw. die beiden Konstrukte der internen und externen politischen Efficacy (vgl. Voogt 2004: 44) zur Erklärung des Phänomens der Teilnahmeverweigerung ein. Zweitens ist der regionale Kontext seiner empirischen Studie interessant, da Voogt nicht aus dem angelsächsischen Raum, sondern aus den Niederlanden stammt. Voogts Interesse ist es, gemeinsame Hintergrundvariablen zur Erklärung der Wahlteilnahme, einer Teilnahme an Umfragen und dem politischen Interesse zu finden (vgl. Voogt/Saris 2003).78 Ausgangspunkt seiner theoretischen Argumenta-

78 Problematisch ist die fehlende Verknüpfung der endogenen Variablen untereinander. Voogts Argumentation läuft darauf hinaus, dass politisches Interesse, Wahlbeteiligung und Umfragebeteiligung ähnliche Determinanten haben. Direkte Effekte zwischen politischem Interesse und den beiden Partizipationsvariablen werden jedoch

78

3 Der Forschungsstand

tion ist, ähnlich wie bei den Studien von Brehm (1993) bzw. Groves/Couper (1998), die soziale Isolations- bzw. (positiv formuliert) Integrationsthese und die damit verbundene Annahme, dass mit steigender sozialer Einbindung auch die Kooperationswahrscheinlichkeit steigt. Voogt unterscheidet zwei Dimensionen sozialer Einbindung: Die erste Dimension beinhaltet die Einstellung gegenüber der eigenen aktiven Teilhabe in der Gesellschaft („social involvement“). Dabei handelt es sich um die Einstellung gegenüber einem konkreten Verhalten. Daneben diskutiert Voogt mit der emotionalen Bindung an die Gesellschaft eine zweite Dimension, die sich lediglich auf das Teilen von Normen und Pflichten bezieht („attachment to society“). Eine positive Einstellung gegenüber bestimmten gesellschaftlichen Normen und Pflichten, die mit einer starken Bindung an die Gesellschaft einhergeht, ist jedoch nach Voogt keine hinreichende Bedingung dafür, dass Menschen auch tatsächlich aktiv an der Gesellschaft teilhaben. Sie könnten sogar annehmen, dass andere als sie selbst geeigneter seien, eine aktive Rolle zu erfüllen und sich aus diesem Grund passiv verhalten (vgl. Voogt 2004: 113f.). Damit ist implizit das Konzept des wahrgenommenen Selbstbilds („internal efficacy“) im Modell integriert, obgleich es nicht explizit im Kausalmodell mitmodelliert wird. Menschen, die glauben, soziale Teilhabe an sich sei eine wichtige Norm, aber daraus keine eigene Aktivitätsintention ableiten, haben nach Voogt ein hohes „attachment to society“, aber nur ein geringes „social involvement“. Voogt geht an dieser Stelle sogar einen Schritt weiter und postuliert theoretisch einen negativen Zusammenhang zwischen den beiden Konstrukten „social involvement“ und „attachment to society“. Dieses Argument erscheint jedoch nicht wirklich plausibel. Man kann zwar argumentieren, dass eine normative Bindung, d.h. das „attachment to society“, keine hinreichende Bedingung für gesellschaftliche Aktivität ist, allerdings ist ein negativer Zusammenhang nur schwer nachvollziehbar. Durch die Verwendung des mehrdimensionalen Einstellungsbegriffs in Kombination mit widersprüchlichen empirischen Ergebnissen ist die Studie an dieser Stelle wenig überzeugend. Ein positiver Zusammenhang zwischen den beiden Konstrukten wäre theoretisch ebenso plausibel abzuleiten. Personen, die bestimmte gesellschaftliche Normen kennen und mit ihnen sozialisiert sind, könnten (und sollten) auch eingebundener in die Gesellschaft sein und daher die Absicht haben, aktiv zu partizipieren. Das Konstrukt des „attachment to society“ erscheint bei Voogt daher mehr als eine Art Hilfskonstruktion, um divergierende empirische Befunde, insbesondere im Hinblick auf das Alter als Hintergrundvariable, zu erklären. Die Richtung des Zusammenhangs ist vor diesem Hintergrund mehr das Ergebnis der empirischen Berechnungen – und damit a posteriori – als theoretisch und somit a priori begründet (vgl. dazu Voogt 2004: 129). Auch bei der Operationalisierung und der Überprüfung der Hypothesen sind nicht alle Schritte in der Studie von Voogt unmittelbar plausibel. Die beiden zentausgeklammert und damit auch nicht überprüft. Die endogenen Variablen politisches Interesse, Umfrage- und Wahlteilnahme werden als unabhängig voneinander dargestellt.

3.2 Komplexe Modellierungen zur Erklärung von Kooperation

79

ralen Konstrukte „attachment to society“ und „social involvement“ werden jeweils nur über soziodemographische Indikatoren gemessen. Die meisten der untersuchten Merkmale (Alter, Ethnie, Bildung, Einkommen und die Haushaltszusammensetzung) fließen dabei jedoch gleichzeitig in beide Konstrukte ein (vgl. Voogt/Saris 2003: 167; Voogt 2004: 115). Damit ist die Operationalisierung nicht trennscharf. Das eigentliche theoretische Argument bei Voogt, dass sich politische Einstellungen (wie z.B. Informiertheit) und politisches Verhalten (wie die Einbindung in Netzwerke) über die beiden zentralen Konstrukte „attachment to society“ und „social involvement“ positiv auf die Teilnahmebereitschaft auswirken (vgl. Voogt 2004: 107; ähnliche Argumente bei Wolfinger/Rosenstone 1980; Eveland/ Scheufele 2000; Straits 1991), wird im Rahmen der empirischen Überprüfung des Modells nur unzureichend abgebildet. Letztlich bleibt es damit bei einer Form der „Variablensoziologie“ (Esser 1999: 402), bei der versucht wird, die passende Kombination verschiedener soziodemographischer Merkmale zu finden, um einen großen Teil der empirisch auftretenden Varianz zu erklären. Dazu passt auch die Anpassung und Veränderung des theoretischen Modells im Verlauf der empirischen Analyse. Letztlich ergibt diese, dass „social involvement“ sowohl die Wahlbeteiligung als auch das politische Interesse und die Teilnahmebereitschaft an Umfragen beeinflusst (vgl. Voogt 2004: 129).79 Das Innovative an der Studie von Voogt ist, dass er gemeinsame Determinanten für die Teilnahme an Wahlen und Umfragen annimmt. Er zeigt, dass für die politikwissenschaftliche Forschung systematische Verzerrungen aufgrund von Nonresponse insbesondere im Sinne des Common Cause-Modells (vgl. Abb. 2, Kap. 1.3) zu erwarten sind, da ähnliche Determinanten auf die Wahlbeteiligung und politisches Interesse sowie die Teilnahme an Umfragen wirken.80

3.2.2.4 Die handlungstheoretische Fundierung des Teilnahmeverhaltens bei Schnell Ein Blick auf die deutsche sozialwissenschaftliche Forschung zeigt zunächst nur vereinzelte Erkenntnisse über diejenigen, die nicht an Umfragen teilnehmen. Leverkus-Brüning machte zwar bereits 1966 auf das Problem der „Meinungslosen“ (Leverkus-Brüning 1966) in Umfragen aufmerksam, bezog sich darin aber noch nicht explizit auf Nicht-Teilnehmer, sondern hatte eher die Konsequenzen von Item-Nonresponse im Blick. Aus theoretischer Perspektive beschäftigte sich anschließend vor allem die soziologische Forschung mit der Erklärung des 79 Für „attachment to society“ ergeben sich lediglich positive Effekte auf die Wahlteilnahme, die Kooperationsbereitschaft wird dadurch nicht beeinflusst. Zwischen beiden zentralen Konstrukten ergibt sich der von Voogt postulierte, obgleich theoretisch nicht hinreichend erklärbare, negative Zusammenhang (vgl. Voogt 2004: 129). 80 Auch wenn man kritisieren kann, dass er dabei eine theoretisch konsistente Erklärung zugunsten einer hohen empirischen Erklärungskraft seines Gesamtmodells aus dem Blick verliert.

80

3 Der Forschungsstand

Befragtenverhaltens (vgl. Esser 1973, 1975, 1985). Aufgrund fehlender Primärdaten wurden die theoretischen Annahmen jedoch nicht oder nur in Ansätzen empirisch überprüft. Schnell legte schließlich 1997 eine erste umfassende Studie zu „Nonresponse in Bevölkerungsumfragen“ vor. Neben einer Analyse der Ausschöpfungsraten in Befragungen aus dem Bereich der deutschen Sozialwissenschaft im Zeitverlauf widmet sich Schnell auch aus theoretischer Perspektive dem Teilnahmeverhalten. In Anlehnung an die Überlegungen von Esser zur SEU-Theorie entwickelt er ein handlungstheoretisches Modell zur Erklärung des Teilnahmeverhaltens auf der Individualebene (vgl. Schnell 1997: 157ff.). Die Grundannahme dabei ist, dass das Befragtenverhalten das Ergebnis einer subjektiven Kosten-Nutzen-Abwägung zwischen „subjektiv vorstellbare[n] Handlungsalternativen“ (Schnell 1997: 158) ist. In seinen konkretisierenden Ausführungen weist Schnell sowohl auf die Relevanz von Ressourcen als „unüberschreitbare Grenzen“ (Schnell 1997: 160) als auch auf die Relevanz von „bewährten Strategien“ (Schnell 1997: 160) hin, die in typisierten Situationen Anwendung finden. Damit werden zwei relevante Aspekte modelliert: Zum einen der subjektive Einfluss von Ressourcen auf die Teilnahmebereitschaft: Ein Verhalten ist demnach nur dann möglich, wenn es auch ausgeführt werden kann, d.h. wenn die Ressourcen gegeben sind. Zum anderen beinhalten die theoretischen Ausführungen von Schnell die Existenz eines Kontinuums zwischen den Polen zweier Entscheidungsmodi. Eine „vollständige Optiminierung“, d.h. eine rein rational-überlegte Entscheidung trifft der Akteur nur dann, „wenn er mit Situationen konfrontiert wird, in denen die habitualisierten Strategien nicht den gewohnten Erfolg zeigen“ (Schnell 1997: 161). In Bezug auf die Überlegungen von Groves et al. (1992) und Cialdini (1987) führt Schnell aus, dass in Low-Cost-Situationen, die für den Akteur nicht sonderlich relevant sind, stärker generelle Normen wie z.B. Reziprozität oder die Reaktion auf Autoritäten wirken (siehe zu Low-Cost-Situationen auch Kap. 4.2). Schnell bettet die Entscheidung zu Kooperation oder Verweigerung damit in die SEU-Theorie ein. Allerdings nimmt er als Soziologe (meist) keine politikwissenschaftliche Perspektive ein und bezieht sich auf Umfragen im Allgemeinen und nicht politische Umfragen im Speziellen, weshalb der Fokus auf den für die Soziologie relevanteren Merkmalen liegt. Daher kommt er auch zu dem Schluss, dass „der größte Teil der Verweigerungen auf vorübergehende situationale Einflüsse zurück [geht]“ (Schnell 1997: 214). Wenn man sich auf Umfragen im Allgemeinen bezieht, ist dieser Schluss korrekt. Fokussiert man jedoch einen bestimmten Typ Umfragen, z.B. diejenigen zu politischen Themen, sind die so genannten situationalen Einflüsse, wie das Interesse oder die Einstellung gegenüber dem Thema, wiederum substanzielle und stabile Verzerrungen: Diejenigen Zielpersonen, die negative politische Einstellungen haben, würden in diesem Fall nie an einer politischen Umfrage teilnehmen, auch wenn sie sich beispielsweise über die Nutzung eines Waschmittels bereitwillig befragen lassen würden. Das theoretische

3.3 Zwischenfazit

81

Konzept von Schnell kann daher als Rahmen dienen, um die Teilnahme an politikwissenschaftlichen Befragungen zu modellieren. Gleichzeitig zeigt es, wie wichtig spezifische, auf den konkreten Untersuchungsgegenstand bezogene Modelle der Teilnahmeentscheidung sind: „Die Mechanismen, die einer Verweigerung [...] zugrunde liegen, [müssen] expliziert werden. [...]. Diese Beurteilung muß für jeden Survey abhängig von seinem Thema, seinem Design und den Details der Feldprozeduren jeweils neu durchgeführt werden“ (Schnell 1997: 216). Neuere Studien, z.B. von Stocké/Stark (2005) oder Stöss (2009: 47ff.), analysieren das Problem fehlender Antworten in Bezug auf verschiedene politikwissenschaftliche Merkmale, wie beispielsweise rechtsextremistische Einstellungen. Dabei werden Einzelhypothesen aufgeworfen, etwa dass eine Antwortverweigerung bei Personen mit rechtsextremen Einstellungen wahrscheinlich ist, da diese ihre Privatsphäre schützen wollen. Es wird argumentiert, dass sie eine Antwort vermeiden, weil sie annehmen, sie sei sozial nicht erwünscht (vgl. Stöss 2009: 47). Zudem, so argumentiert Stöss, könnten der Beantwortung der Fragen und den rechtsextremen Einstellungen gleiche Hintergrundvariablen zugrundeliegen, wie ein geringes Bildungsniveau oder auch der Grad der Systemloyalität (vgl. Stöss 2009: 48). Ähnliche Argumente findet man auch bei Stocké und Stark (vgl. 2005: 3). Der Fokus dieser Studien liegt jedoch auf der Nicht-Beantwortung einzelner Fragen durch Personen, die grundsätzlich an einer Befragung teilnehmen. Die Untersuchungen konzentrieren sich damit auf das Problem des Item-Nonresponse. Die theoretischen Annahmen werden zudem nicht in einen größeren theoretischen Rahmen eingebettet.81

3.3 Zwischenfazit Es wurde gezeigt, dass der Forschungsstand zu den Determinanten von Nonresponse anfangs aus meist bivariaten Einzelerkenntnissen bestand. Explizite theoretische Fundierungen waren rar. Erst in den 80er und 90er Jahren des 20. Jahrhunderts entstanden komplexere theoretische Modelle zur Erklärung der Kooperationsentscheidung, die auch empirisch überprüft wurden. Für die politische Wahl- und Einstellungsforschung sind dabei die Erklärungsmodelle von Verweigerungen bei politischen Umfragen besonders interessant, wovon einige in diesem Kapitel dargestellt wurden (vgl. insbesondere Brehm 1993; Voogt/Saris 2003; Voogt 2004).

81 Zwei weitere Studien von Bosnjak (2002) und Kaczmirek (2008) beschäftigen sich mit Nonresponse in Deutschland. Sie beziehen sich jedoch auf Online-Surveys. Bosnjak wählt in seiner Studie dabei eine theoriegeleitete Erklärung über die sozialpsychologische Theorie geplanten Verhaltens. Allerdings liegt bei ihm, wie auch in der Studie von Kaczmirek (2008), der inhaltliche Schwerpunkt auf der Wirkung der Umfrageeinstellungen und daraus resultierenden methodischen Fragen. Der Zusammenhang mit politikwissenschaftlich relevanten Konzepten wird in keiner der Studien aufgenommen.

82

3 Der Forschungsstand

Potenzielle Einflussfaktoren auf die Entscheidung zu Kooperation oder Verweigerung bei politischen Umfragen liegen auf der Ebene der Gesellschaft, des Forschungsdesigns, des Interviewers oder der Zielperson selbst. Das Forschungsdesign und (obgleich begrenzt) der Interviewer-Einsatz sind – zumindest theoretisch – vom Forscher kontrollierbar; gesellschaftliche Faktoren wirken als Rahmen auf der Makroebene und damit nicht direkt, sondern indirekt über die Einstellungen und das Verhalten der Akteure (vgl. Groves/Couper 1998: 30). Man geht dabei nicht davon aus, dass die einzelnen Determinantenbündel unabhängig voneinander auf die Entscheidung zu Kooperation oder Verweigerung wirken, sondern dass sie sich gegenseitig beeinflussen (vgl. Groves/Couper 1998: 30ff.; Groves/Peytcheva 2008: 172f.). Forscher müssen sich zudem darauf einstellen, etwa unter bestimmten gesellschaftlichen Bedingungen und Restriktionen (wie z.B. bestimmten Datenschutzgesetzen eines Landes) nur bestimmte Designelemente einsetzen zu können. Aus diesem Grund können sich auch in Gesellschaften mit verschiedenen politischen und rechtlichen Rahmenbedingungen unterschiedliche Umfragekulturen entwickeln. Daher haben ähnliche Erklärungsmodelle je nach Kontext wechselnden Erfolg, woraus sich die Forderung nach situations- und kontextspezifischen Überprüfungen ergibt. Die Determinanten auf der Ebene der Zielperson haben eine besondere Relevanz. Sie sind nicht vom Forscher kontrollierbar und wirken zugleich direkt auf die individuelle Handlungsentscheidung zu Kooperation oder Verweigerung. Daraus können sich systematische Unterschiede zwischen Teilnehmern und NichtTeilnehmern ergeben, die zu Verzerrungen führen. Daher muss man auf dieser Ebene der Zielpersonen fragen, in welcher Form und warum diese Unterschiede auftreten. In der Forschungsliteratur ist zwar keine einheitliche Theorie der Erklärung der Teilnahmeentscheidung zu erkennen, man kann aber feststellen, dass allen theoretischen Modellen die Annahme einer Kosten-Nutzen-Abwägung der Zielperson gemeinsam ist (vgl. Schnell 1997: 157). Dillman (1978, 2000) gab der bis dahin stark empirisch ausgerichteten Forschung mit seinen Überlegungen zur sozialen Austauschtheorie eine theoretische Fundierung. Er erarbeitete die Idee einer handlungsleitenden Kosten-NutzenAbwägung, in die nicht nur rein ökonomische, sondern auch soziale Anreize eingehen (vgl. auch Goyder et al. 2006; Groves/Couper 1998). Dies ebnete den Weg hin zu Erklärungen, die auf einem weiten Verständnis von Rational Choice basieren. Daneben entwickelte sich ein Forschungsstrang zur Erklärung des Teilnahmeverhaltens, der die Teilnahme an Befragungen weniger als rationalen Prozess, sondern als Ergebnis einer rein heuristischen Entscheidung ansieht (vgl. Groves et al. 1992). Stoop (2005: 101) spricht in diesem Zusammenhang von „two conflicting nonresponse schools“, Goyder et al. (2006) zeigen allerdings, dass sich die Annahmen gegenseitig nicht ausschließen. Sie argumentieren, dass die soziale Austauschtheorie ein Kontinuum darstelle, „ranging from decisions based on habits and scripts right up to the deep weighting of every alternative“ (Goyder et al.

3.3 Zwischenfazit

83

2006: 38). Ökonomische und sozialpsychologische Ansätze lassen sich unter dieser Prämisse in eine gemeinsame Modellvorstellung integrieren: Ein solches integriertes Modell basiert auf den Grundannahmen des weiten RC-Ansatzes, der annimmt, dass sowohl materielle Anreize als auch weichere Anreize wie spezifische Einstellungen in die Kosten-Nutzen-Abwägung eines Indivduums eingehen. Zusätzlich wird angenommen, dass Handlungsentscheidungen sowohl spontan und unter Rückgriff auf einfache Entscheidungsheuristiken als auch stärker rational reflektiert ablaufen können (=duales Prozessieren; vgl. Fazio 1986, 1990; Fazio/Towles-Schwen 1999; Fiske/Neuberg 1990; siehe auch Ajzen/Sexton 1999; Esser 1986a, 1991, 1993).82 Die Bilanzierung des Forschungsstands zeigt, dass – zwar zeitlich versetzt, aber dennoch vom Verlauf her ähnlich zur Entwicklung in den USA – das Problem der Nicht-Teilnehmer an Umfragen auch in der deutschen sozialwissenschaftlichen Forschung zunehmend stärker wahrgenommen wird (vgl. Schnell 1997; siehe auch die Metaanalyse von Engel/Schnabel 2004). Gleichzeitig wird die Beschäftigung mit dem Thema durch die vergleichende Politikwissenschaft angeregt, wenn bspw. große Umfragestudien wie der European Social Survey (ESS) parallel zueinander in verschiedenen Ländern durchgeführt werden und die Vergleichbarkeit der Ergebnisse maßgeblich von der Datenqualität abhängt (vgl. Blom 2008; Harkness et al. 2002; Mohler et al. 2003; Neller 2005; Smith 2007). Dennoch bestehen weiterhin Forschungslücken: Diese liegen im Besonderen in der Verknüpfung der allgemeinen Theorien zu Kooperation und Verweigerung mit Merkmalen aus dem Bereich der politischen Kulturforschung. Zudem fehlt bislang eine empirische Analyse der politikwissenschaftlich relevanten Merkmale der Nicht-Teilnehmer in Deutschland. Zum einen lassen sich damit Aussagen über den Prozess des Ausfalls gewinnen, zum anderen Konsequenzen für die empirische Politikforschung im Allgemeinen und das politische System und die politische Kultur der Bundesrepublik Deutschland ableiten.83 Daher muss der Ausfallprozess an sich zunächst in Bezug auf die für die empirische Politikforschung relevanten Variablen theoretisch modelliert werden. Anschließend sollen die theoretischen Annahmen empirisch auf der Basis einer großen sozialwissenschaftlichen Bevölkerungsbefragung überprüft werden. 82

Damit wird angenommen, dass es nicht die eine, in sich homogene Rational-Choice-Theorie gibt, sondern dass es sich um ein Forschungsprogramm im Sinne Lakatos‘ (1982) handelt, in dessen Rahmen unterschiedliche Theorievarianten existieren. Diese besitzen einen gemeinsamen Kern, in dem sie übereinstimmen und Zusatzannahmen, in denen sie variieren können. Ob die Annahmen zum dualen Prozessieren und die damit verbundene Annahme eines rein automatisch-spontanen Entscheidens noch mit den Kernannahmen des RC vereinbar sind, ist in der Forschung umstritten. In der hier vorliegenden Arbeit wird in Anlehnung an Esser (1990, 1996, 2001) argumentiert, dass auch das heuristische Handeln rational erklärbar und damit im Rahmen der RC-Theorie anzusiedeln ist, da es unaufwändig und in gewissen Situationen kostensparend und effizient ist. Rationalität bezieht sich damit lediglich auf die Art und Weise der Entscheidungsfindung (siehe dazu ausführlicher die Modellbildung in Kap. 4). 83 Gerade im Bereich der politischen Kulturforschung, die versucht Erkenntnisse über die Verteilung von Einstellungen und Handlungsintentionen der Bevölkerung zu gewinnen, bieten alternative Erhebungsmethoden, wie etwa Beobachtungen oder Inhaltsanalysen, keinen äquivalenten Ersatz zu Umfragedaten.

4 Die Teilnahme an politischen Umfragen: Ein handlungstheoretisch fundiertes Erklärungsmodell und seine Konsequenzen

In diesem Kapitel sollen nun noch einmal die zentralen Prämissen, die aus dem Forschungsstand abzuleiten sind und die Grundlage für das folgende Erklärungsmodell darstellen, ausgeführt werden (Kap. 4.1 bis 4.3). Danach wird im Sinne des Survey Variable Cause-Modells ein handlungstheoretisches Modell zur Erklärung der Kooperationsentscheidung aufgestellt, um Hinweise auf Unterschiede zwischen Kooperativen und Verweigerern zu erhalten (Kap. 4.4). Anschließend wird theoretisch abgeleitet, für welche anderen relevanten Konzepte aus dem Bereich der politischen Einstellungs- und Verhaltensforschung im Sinne des Common Cause-Modells ebenfalls Verzerrungen aufgrund von Teilnahmeverweigerungen zu erwarten sind (Kap. 4.5). Das Kapitel wird von einer Zusammenfassung des Theorieteils (Kap. 4.6) und einer Übersicht über die Hypothesen (Kap. 4.7) abgerundet, die anschließend im empirischen Teil der Arbeit überprüft werden sollen.

4.1 Handlungstheoretische Fundierung 4.1.1 Methodologischer Individualismus und Wert-Erwartungstheorie Die Erklärung von Kooperations- und Verweigerungsverhalten lässt sich zunächst auf die einfache Frage reduzieren, warum eine Zielperson auf eine gewisse Art und Weise handelt. Mit dieser Perspektive ist eine Fokussierung auf individuelle Handlungsmotive und Restriktionen verbunden. Damit ist die Fragestellung wissenschaftstheoretisch in den methodologischen Individualismus eingebettet, der soziale Phänomene auf das Handeln84 von Individuen zurückführt (vgl. Weber 1976; auch Druwe 1995; Esser 1999: 177ff.; Green/Shapiro 1994: 14ff.; Hennen/Springer 1996; Zintl 1997: 33ff.). Bei der Frage der Teilnahmebereitschaft an Interviews kann man den Handlungsbegriff sogar noch weiter spezifizieren und von sozialem Handeln sprechen, da nicht nur ein einzelnes Individuum, sondern mehrere Akteure 84

„Handeln“ wird dabei intentional definiert, d.h. es ist im Gegensatz zum allgemeineren Begriff des „Verhaltens“ aktiv motiviert und zielgerichtet. Allerdings werden beide Begriffe im weiteren Verlauf dieser Arbeit weitgehend synonym verwendet. Bei den hier untersuchten Gegenständen bezieht sich beides immer auf eine zielgerichtete Form individuellen Agierens.

H. Proner, Ist keine Antwort auch eine Antwort?, DOI 10.1007/978-3-531-92721-3_4, © VS Verlag für Sozialwissenschaften | Springer Fachmedien Wiesbaden GmbH 2011

4.1 Handlungstheoretische Fundierung

85

relevant sind (vgl. Weber 1976: 1). Eine zuvor ausgewählte Zielperson trifft ihre Entscheidung zu Kooperation oder Verweigerung in der Situation der Interviewanfrage nicht völlig isoliert. Der Interviewer als direktes Gegenüber oder der Forscher, der zuvor ein Anschreiben mit der Teilnahmeanfrage gesendet hat, sowie andere Menschen, wie etwa das soziale Umfeld, das Umfragen eventuell ablehnend gegenübersteht, können die Entscheidung beeinflussen (vgl. Cialdini et al. 1992, zitiert nach Hox et al. 1996).85 Die im vorigen Kapitel erläuterten Erklärungsmodelle kooperativen Verhaltens basieren alle auf ähnlichen Grundannahmen, obgleich sie nicht immer explizit ausgeführt werden. Dazu gehören neben dem methodologischen Individualismus die Annahmen, dass Individuen zielgerichtet handeln, dass sie Handlungsbeschränkungen unterliegen und dass sie innerhalb der gegebenen Restriktionen ihren jeweiligen Nutzen maximieren. Damit basieren die Ansätze auf dem, was verschiedene Autoren als „harten Kern“ des Rational Choice-Forschungsprogramms bezeichnen (vgl. Opp 1991: 106; Kunz 2004: 36; Frings 2008: 77). Es kommen jedoch noch weitere Prämissen hinzu. Grundsätzlich wird für die Kooperationsbereitschaft einer Zielperson angenommen, dass die Entscheidung zu Kooperation und Verweigerung über eine subjektive Kosten-Nutzen-Abwägung fällt. Die zentrale Überlegung dabei ist, dass es für ein Individuum nur dann rational ist, sich an einer Befragung zu beteiligen, wenn der subjektiv angenommene Nutzen einer Teilnahme die erwarteten Kosten übersteigt und die angenommenen positiven Folgen einer Handlung auch wahrscheinlich sind. Diese Zusatzannahmen entsprechen der allgemeinen WertErwartungstheorie und deren Handlungsmaxime: „Versuche dich vorzugsweise an solchen Handlungen, deren Folgen nicht nur wahrscheinlich, sondern Dir gleichzeitig auch etwas wert sind! Und meide ein Handeln, das schädlich bzw. zu aufwendig für Dich ist und/oder für Dein Wohlbefinden keine Wirkung hat!“ (Esser 1999: 248). Die Grundannahme der Wert-Erwartungstheorie in ihrer SEU-Variante ist, dass ein Individuum zwischen Handlungsalternativen wählen muss, deren Ausführung Konsequenzen hat. Diese können auf der Grundlage einer transitiven und in sich verbundenen, subjektiven Präferenzordnung des Akteurs positiv oder negativ bewertet sein. Die Wahrscheinlichkeit, dass eine bestimmte Handlungsfolge eintritt, ist in den subjektiven Erwartungen eines Individuums abgebildet. Auf der Grundlage dieser Erwartungen gewichtet das Individuum die verschiedenen Handlungsalternativen und wählt die Alternative mit der „besseren“ Bewertung (vgl. Esser 1999: 248; Green/Shapiro 1994: 14ff.; Mensch 1998: 38). Bei der Frage, in welcher Art und Weise die Alternativen gewichtet werden, gilt die SEU-Regel, welche die Subjektivität von Bewertungen und Erwartungen betont (vgl. Esser 1999: 344): 85

Dies trifft auch bei einer Interviewanfrage für eine schriftliche Befragung zu, da soziales Handeln nicht unbedingt impliziert, dass eine andere Person physisch anwesend sein muss (vgl. Esser 2000: 5).

86

4 Die Teilnahme an politischen Umfragen SEUi=w(pij)*Uj.

SEUi ist dabei der subjektive Gesamtnutzen einer Alternative i, w(pij) beschreibt die subjektiven Erwartungen des Akteurs, dass bestimmte Konsequenzen j eintreten, wenn die Alternative i gewählt wird. Uj beinhaltet die Bewertung des Nutzens U, den das Individuum der Konsequenz j zuspricht (vgl. Esser 1999: 344). Die Grundannahmen der SEU-Theorie sind – mehr oder weniger explizit – der Ausgangspunkt für fast alle theoretischen Konzepte, die zur Modellierung der Teilnahmeentscheidung in der Forschung diskutiert werden. Die Abwägung einer Zielperson basiert dabei in der Regel nicht nur auf materiellen Nutzenanreizen. Aus diesem Grund wird auch in dieser Arbeit ein offener Nutzenaspekt zugrunde gelegt, der auch weiche Motive wie intrinsische Befriedigung und immaterielle Nutzenaspekte umfasst. Auch die Ziele eines psychischen Wohlergehens, einer inneren Befriedigung oder eines positiven Gefühls können damit das Handeln von Individuen beeinflussen (vgl. Arzheimer 2008: 57; Esser 1996; Frings 2008: 78; Opp 1991; Kühnel 1993: 18; Lindenberg 1985: 104). Aus dieser Perspektive sind Einstellungen, Normen und Wertorientierungen als mögliche Determinanten in der Kosten-Nutzen-Abwägung relevant. Der Einfluss von Einstellungen auf Handlungsentscheidungen wird somit nicht als „Alternative“ (im Sinne von „entweder einstellungsdominiertes oder rationales Handeln“), sondern als Ergänzung innerhalb der Kosten-Nutzen-Abwägung verstanden. Nicht jede Handlungsalternative, die gewählt wird, muss nach dieser Nutzenkonzeption den materiellen Nutzen maximieren, wenn andere, weiche Nutzenmotive in einer bestimmten Situation als relevanter erachtet werden. Vielmehr wird angenommen, dass das Individuum diejenige Handlungsalternative wählt, die ihren materiellen und/oder psychischen Nutzen maximiert. Ein konkretes Beispiel für die Wirkung nicht-materieller Nutzenanreize wäre, wenn eine Zielperson die Teilnahme an einer Umfrage als Bürgerpflicht empfindet und mit der Entscheidung zu kooperieren einem inneren Pflichtgefühl nachgeht.

4.1.2 Menschenbild und Rationalitätsbegriff Auf der Grundlage des methodologischen Individualismus und der WertErwartungstheorie wird angenommen, dass eine Zielperson bei einer Befragung kooperiert, wenn sie sich in der Lage fühlt teilzunehmen und wenn der aus der Teilnahme resultierende subjektiv angenommene Nutzen die zu erwartenden Kosten übersteigt (vgl. Esser 1985; Lindenberg 1989: 176). Obwohl die Teilnahme an Befragungen damit als rationales Handeln dargestellt ist, ist das dahinter stehende Menschenbild nicht das eines homo oeconomicus, sondern vielmehr der RREEMM (vgl. Lindenberg 1985; siehe auch Esser 1999: 238f.). Darunter versteht man einen Akteur, der resourceful, restricted, expecting, evaluating und maximizing ist. Das

4.1 Handlungstheoretische Fundierung

87

bedeutet, er ist findig, verschiedene Handlungsalternativen zu erkennen und kann ständig neue hinzugewinnen. Zugleich ist er durch soziale und natürliche Restriktionen eingeschränkt und wird sich für diejenige Handlungsalternative entscheiden, die ihm als subjektiv beste Alternative erscheint (vgl. Lindenberg 1985: 100). Diese Subjektivität unterscheidet ihn von der Konzeption des unabhängig von seinem Umfeld agierenden „objektiv“-rationalen homo oeconomicus. Dieses Akteursmodell erscheint deshalb so geeignet, weil es den rationalen Aspekt des Handelns betont, aber dennoch Restriktionen wie z.B. institutionelle Regeln oder die begrenzte Verfügbarkeit von Zeit sowie die Subjektivität von Erwartungen und Bewertungen und damit auch frühere Erfahrungen mit einbezieht. „Rationale Entscheidung“ bedeutet in diesem Zusammenhang, dass eine Person bei bestimmten Präferenzen und Restriktionen in einer bestimmten Situation gewisse Handlungsalternativen erkennt, diese in Relation zueinander bewertet und in eine transitive Reihung bringen kann. Anschließend wählt es entsprechend des subjektiv angenommenen eigenen Vorteils konsistent eine Handlungsalternative aus und handelt dementsprechend (vgl. Lindenberg 1985: 100; Kunz 2004: 36). Das heißt, bei der „Rationalität“ handelt es sich um die Rationalität des Verfahrens der Handlungsentscheidung. Als Auswahlregel bei der Selektion der Handlungsalternativen wird angenommen, dass die subjektive Nutzenerwartung maximiert wird (vgl. Esser 1999). „Dabei ist es egal, ob die Einschätzung des Nutzens eines Zieles und die Erwartungen über die Effizienz eines Tuns objektiv richtig oder subjektiv und/oder falsch sind. […] Das Etikett der Rationalität eines Handelns bezieht sich – kurz gesagt – auf die Regel und eben nicht auf die Randbedingungen seiner Selektion“ (Esser 1999: 216). Damit liegt ein weites Verständnis von Rationalität zugrunde (vgl. Opp 1999: 172ff.). Darin spiegelt sich eine weitere Prämisse: In den letzten Jahrzehnten wurde, insbesondere im Rahmen von psychologischen Entscheidungstheorien, verstärkt auf die begrenzten Informations- und Entscheidungskapazitäten von Individuen hingewiesen. Simon führte diese bereits in den 1950er Jahren mit seinem Konzept der „bounded rationality“ aus (vgl. Simon 1955: 99ff., 1957: 241ff.; auch Kirchgässner 1991: 31; Schmitt 1996: 112). Der Mensch wird dabei als Akteur angesehen, der nur begrenzte kognitive Fähigkeiten hat. Das bedeutet, er kann nicht alle theoretisch denkbaren Handlungsalternativen erkennen und nicht alle möglichen Konsequenzen einer Handlung mit in die Analyse einbeziehen. Aus diesem Grund ist die Bewertung einer Situation nicht unbedingt vollständig. Daraus lässt sich die Annahme ableiten, dass ein Akteur nicht unbedingt den Nutzen im Sinne eines theoretischen Ziels absolut maximiert, sondern auch eine Alternative wählt, wenn der daraus resultierende Nutzen zufriedenstellend ist („satificer“) oder die bestmögliche Alternative wählt, die er erkennt.86 Im RREEMM ist dies mit abgebildet. 86 Esser führt aus, dass diese Form des „satisficing“ lediglich ein Spezialfall des Maximierens ist, da der Akteur vermutet, dass ein weiteres Maximieren wiederum mit Kosten verbunden wäre (vgl. Esser 1999: 259).

88

4 Die Teilnahme an politischen Umfragen

Mayerl (2009: 160) bezeichnet die Gesamtheit der so getroffenen theoretischen Annahmen, die geeignet sind „eine soziologische RCT-Erklärung mit ‚harten‘ sowie ‚weichen‘ Bestimmungsfaktoren zu modellieren“ (Mayerl 2009: 160) als Rational Choice-Theorie Typ „weit I“.87 Einstellungen und Normen können demnach Anreize schaffen oder Kosten verursachen und werden in die Abwägung mit einbezogen. Es kommt jedoch noch ein weiterer Aspekt hinzu: Einstellungen sind zudem als Mittel geeignet, dem begrenzt rational agierenden Individuum in einer bestimmten Situation, die Beurteilung der Entscheidungssituation zu vereinfachen und damit Kosten zu sparen. Aus diesem Grund ist es durchaus rational auf Einstellungen zurückzugreifen (vgl. auch Esser 1990, 1991). Damit wird angenommen, dass eine soziale Situation wie ein Interview nicht „immune from general norms“ (Bradburn 1977: 35) ist, sondern sowohl normgeleitet als auch stärker von situativen Anreizen geprägt ablaufen kann.

4.2 Duales Prozessieren Wenn in eine Abwägung sowohl Normen als auch stärker situative Anreize eingehen können, stellt sich die Frage, wann welche Form der Anreize dominiert. Außerdem ist dabei bereits implizit die Annahme verschiedener Entscheidungsmodi und damit die Annahme des dualen Prozessierens angelegt. Daher wird nun in diesem Kapitel auf das duale Prozessieren eingegangen, das von verschiedenen Entscheidungsmodi ausgeht und die Handlungsentscheidung zweistufig modelliert. Zuvor muss zum besseren Verständnis jedoch noch ein Blick auf die Einstellungsdefinition und die Unterscheidung von generalisierten und spezifischen Einstellungen geworfen werden, die in diesem Zusammenhang relevant ist.

4.2.1 Der Einstellungsbegriff Unter einer Einstellung wird im Folgenden, in Anlehnung an den eindimensionalen Einstellungsbegriff von Fishbein (1963, 1965; vgl. auch etwa Eagly/Chaiken 1993; Fazio 1986; Fishbein/Ajzen 1975), zunächst ganz allgemein die Reaktion auf ein Einstellungsobjekt verstanden. Diese Reaktion basiert auf der Summe der gewichteten Bewertungen, die ein Individuum den Merkmalen und Eigenschaften eines Einstellungsobjekts entgegenbringt (vgl. zu den verschiedenen Einstellungsbegriffen Schumann 2001, zur Entstehung von Einstellungen nach der WertErwartungstheorie bereits Feather 1959, 1982). Anfangs wurden in der Einstellungsforschung unter Einstellungen nur generelle, stabile, situationsunabhängige Konstrukte verstanden. In der jüngeren kogniti87 Daneben gibt es die noch einmal erweiterten RC-Theorien Typ („weit II“). Zu diesen Annahmen, siehe Kap. 4.2.2.

4.2 Duales Prozessieren

89

onspsychologischen Einstellungsforschung ist jedoch die Erkenntnis gewachsen, dass bestimmte Einstellungen nicht unbedingt auskristallisiert in fester Form vorliegen, sondern bei Bedarf vom Individuum in einer bestimmten Situation zusammengesetzt werden (vgl. Zaller 1992: 34ff.; Ajzen/Fishbein 2000; Steenbergen/ Lodge 2003; Taber 2003). Das bedeutet, eine Person hat positiv und negativ besetzte Eindrücke, Vorstellungen und Assoziationen zu einem Objekt, die im Langzeitgedächtnis verankert sind. Bei Bedarf, etwa wenn der Interviewer vor der Tür steht und um ein Interview bittet, können daraus Einstellungen zusammengesetzt werden (siehe zu diesem eher neueren Einstellungsbegriff den Literaturbericht bei Schoen 2006). Damit wird nicht mehr angenommen, dass es sich bei Einstellungen nur um generalisierte, stabile, gleichförmige, situational unabhängige Bewertungen von Objekten handelt (vgl. Stocké/Langfeldt 2003: 55ff.). Vielmehr nimmt man an, dass (spezifische) Einstellungen in einer bestimmten Situation unter bestimmten Bedingungen aufgrund von Überzeugungen auch kurzfristiger gebildet werden können. Sie sind dann „Ergebnis der Selektion einer quasi bewertungsmäßigen ‚Verfassung‘ durch Akteure mit begrenzter Rationalität“ (Stocké/Langfeldt 2003: 59; vgl. auch Vanberg 2002). Nicht unbedingt alle vorliegenden Eindrücke gehen in die Bildung dieser Einstellungen ein, sondern nur diejenigen, die in einer bestimmten Situation verfügbar sind (vgl. Eagly/Chaiken 1993; Zaller 1992). Die Folge dieser neueren Entwicklungen ist, dass zwischen verschiedenen Typen von Einstellungen unterschieden werden kann: „attitudes that are based on systematic analysis of available information and attitudes that are produced without much conscious deliberation“ (Ajzen/Fishbein 2000: 7). Das bedeutet, es gibt sowohl situationsspezifische Einstellungen als auch stärker generalisierte Formen von Einstellungen.88 Die letztgenannten sind erlernte und gefestigte Prädispositionen auf bestimmte Objekte. Die Annahme verschiedener Einstellungstypen geht auf die Studien von Fazio zum MODE-Modell zurück, der empirisch feststellt, dass es Einstellungen gibt, die einfacher abzurufen und demnach generalisierter sind, und Einstellungen, die schwieriger zu bilden und damit spezifischer sind. Fazio geht davon aus, dass die Einstellungen umso eher das Verhalten eines Individuums beeinflussen, je einfacher sie abrufbar und je verfügbarer sie sind (vgl. Ajzen/Gilbert Cote 2008: 297; Fazio/Williams 1986; Fazio et al. 1989; Stocké 2002).89 Zu den klassischen Forschungsgegenständen der sozialpsychologischen Einstellungsforschung gehören Untersuchungen zum Zusammenhang zwischen Einstellungen und Verhalten. Der Fokus auf Einstellungen als latente Konstrukte ist durch die Hoffnung begründet, über Einstellungen das Handeln von Menschen 88 Die Annahme generalisierter und spezifischer Einstellungen findet sich in zahlreichen politikwissenschaftlichen Theorien wieder, etwa bei dem sozialpsychologischen Ann-Arbor-Modell zur Erklärung der Wahlentscheidung. Dabei wäre die Parteiidentifikation eine generalisierte Einstellung, die kurzfristig variablen Einstellungen gegenüber Themen oder Kandidaten vorgelagert ist (vgl. Campbell et al. 1954). 89 Die Abrufbarkeit der Einstellung wird in den empirischen Studien über die Latenzzeit von Antworten gemessen.

90

4 Die Teilnahme an politischen Umfragen

erklären und prognostizieren zu können (vgl. Frings 2008: 194; Olson/Zanna 1993: 131). Vor dem Hintergrund der Ausdifferenzierung des Einstellungsbegriffs in generelle und spezifische Einstellungen ist nun gut erklärbar, warum frühe Studien nur vereinzelt einen Zusammenhang zwischen Einstellungen und Verhalten nachweisen konnten: Sie bezogen sich lediglich auf generalisierte Einstellungen.

4.2.2 Heuristisches und reflektiert-rationales Entscheiden Die Annahmen zum Einfluss von Einstellungen auf das Handeln von Individuen können damit also berücksichtigt werden, ohne die Idee einer handlungsleitenden Kosten-Nutzen-Analyse der Zielperson aufgeben zu müssen. Die Entscheidung zur Teilnahme an Umfragen wird dabei als Ergebnis eines komplexen sozialen Prozesses modelliert, der je nach Befragtem und Situation in verschiedenen Entscheidungsmodi, sowohl stärker rational-systematisch als auch eher automatischspontan und unter Rückgriff auf vorgefertigte Einstellungen, verlaufen kann (vgl. Esser 1985). Zum einen können spezifische Einstellungen dabei direkt als Anreize in die überlegt-rational ablaufende Kosten-Nutzen-Abwägung einbezogen werden. Zum anderen können generalisierte Einstellungen über einen stärker heuristischen Weg die Handlungsentscheidung beeinflussen. Auf der Basis des RREEMMMenschenbildes und der Annahme begrenzter Informations- und Entscheidungskapazitäten ist es nicht möglich, dass alle Entscheidungen auf der Grundlage einer allumfassenden Kosten-Nutzen-Abwägung getroffen werden. Es wird daher zwischen den verschiedenen Entscheidungsmodi unterschieden und angenommen, dass der Rückgriff auf normativ gestützte oder einstellungsdominierte Routinehandlungen Spezialfälle rationaler Entscheidungen sind (vgl. Esser 1985, 1990, 1991). Die Prämisse, dass ein Individuum in „rationaler Art und Weise“ entscheidet, wird nicht aufgegeben, sondern es wird angenommen, dass es rational sein kann, einstellungsdominierte Heuristiken zu verwenden. Diese sind „(meist) relativ unaufwendig [...], effizient [...] und sie finden (häufig) eine zusätzliche normative Stütze“ (Esser 2004: 55). Damit sparen sie Informations-, Entscheidungs- und Transaktionskosten (vgl. Ajzen/Fishbein 2000; Esser 1985, 1996, 2001; Fiske/Neuberg 1990; Nisbett/Ross 1980; Tversky/Kahneman 1974, 1981).90 Die Handlungsentscheidung wird damit zweistufig modelliert: Auf der ersten Stufe wird in rationaler Art und Weise der Entscheidungsmodus gewählt und entschieden, ob rational-reflektiert oder automatisch-spontan gehandelt wird. Auf der zweiten Stufe läuft anschließend wiederum auf rationale Art und Weise die Bewertung

90 Für eine Übersicht über Dual-Process-Theorien in der Sozialpsychologie siehe Chaiken/Trope (1999). Mayerl (2009: 157ff.) subsummiert Theorien, die diese Annahme verschiedener Handlungsmodi beinhalten unter dem Begriff der „RCT (‚weit II‘)“.

4.2 Duales Prozessieren

91

der Handlungsalternativen ab, wenn ein rational-reflektierter Entscheidungsmodus gewählt wurde. Es wird sogar angenommen, dass ein Akteur zunächst versuchen wird, heuristisch zu agieren (vgl. Esser 2005: 88; Fazio 1990: 100). Hier ist der Begriff des Framings relevant. „Das Framing ist eine Strategie der Vereinfachung und Zuspitzung der Situation“ (Esser 1996b: 17). Das Prinzip wird dann eingesetzt, wenn es in einer Situation um nichts sonderlich Relevantes für den Akteur geht, d.h. wenn die wahrgenommenen Handlungskonsequenzen sehr gering sind. In Alltagssituationen eintreffende Informationen werden dazu mit vorhandenen Skripten und Schemata abgeglichen, um eine Situation zu klassifizieren und zu entscheiden, nach welchen Mustern gehandelt wird.91 Das Ziel des Akteurs ist es, kostengünstig automatisch mit einem bestimmten Verhalten zu reagieren, ohne bewusst aufwändige, kognitive Prozesse aktivieren zu müssen. Er versucht damit zunächst, die Situation in einen bereits bekannten „Frame“ einzubetten und die damit verbundenen Skripte und Schemata zu aktivieren (vgl. Esser 1996, 2001; Stocké/Langfeldt 2003: 58f.).92 Esser konstatiert: „Empirisch überwiegt als Alltagshandeln das reflexhafte Handeln […]. Das überlegte oder gar das (zweck-) rationale Handeln sind dagegen überaus seltener Ausnahmefall“ (Esser 2001: 294). Unter Alltagshandeln werden dabei eben jene Handlungen verstanden, die im Wesentlichen routiniert ablaufen und früheren Handlungssituationen ähnlich sind. An dieser Stelle werden, wie bei den Annahmen der Austauschtheorie, frühere Erfahrungen in die Handlungsentscheidung integriert. Daraus resultierende Erwartungen, Normen und Werte können sich in generalisierten Einstellungen gegenüber bestimmten Objekten widerspiegeln. Diese Idee des Framings und der Entscheidungsmodi nimmt auch Lindenberg auf. In neueren Publikationen modifiziert er das Menschenbild des RREEMM noch einmal explizit im Hinblick auf die Dual-Prozess-Theorien und spricht von einem RREEMM#2, der „restricted, resourceful, expecting, evaluating, motivated [und] meaning“ ist (vgl. Lindenberg 2001a, 2001b).93 Mit dem Begriff des „meaning“ in91

Der Einfluss dieser kognitiven Handlungsschemata und -skripte auf das menschliche Handeln wurde bereits Anfang der 80er Jahre von Abelson expliziert (1981). Gerade zur Entstehung der Skripte und Schemata können sozialpsychologische Theorien einen Erklärungsbeitrag leisten. In den Skripten und Schemata spiegeln sich frühere Erfahrungen und Einstellungen der Zielpersonen. Damit ermöglichen sie z.B. eine Modellierung der Annahmen der Austauschtheorie. 92 Diese Handlungsskripte, die im Laufe der Zeit immer weiter eingeübt werden können und damit immer weiter automatisiert werden, werden von Esser als „Habits“ bezeichnet (Esser 1990, 1993). 93 Zunächst erscheint es so, als würde man damit das Menschenbild des RREEMM verlassen und von einem soziologischen Akteursbegriff ausgehen. Lindenberg (1985: 104) weist jedoch bereits darauf hin, dass es Situationen gibt, in denen es rational ist, dass ein RREEMM-Akteur entsprechend generalisierter Einstellungen handelt, nämlich wenn es sich um eine Routinesituation handelt. Damit ist der RREEMM vom OSAM (optionated, sensitive, acting man) nicht mehr unterscheidbar (siehe auch Arzheimer 2002: 67ff.). Kritisiert wird am OSAM-Modell meist die mangelnde Differenzierung zwischen Einstellungen und Verhalten (Esser 1996: 14), zumal sich empirisch Indizien dafür ergeben, dass Einstellungen nicht immer kongruent zu Handlungen sind. Dieses Phänomen lässt sich jedoch innerhalb des RREEMM#2 erklären, wenn man mit Fazios MODE-Konzept arbeitet und verschiedene Entscheidungsmodi annimmt, die der RREEMM#2 erkennt und nach denen er entweder rationalüberlegt oder automatisch-spontan handelt (vgl. Fazio 1986, 1990; Fazio/Towles-Schwen 1999; Ajzen 1996).

92

4 Die Teilnahme an politischen Umfragen

kludiert das Menschenbild nun die Idee des Framings: Ein Individuum versucht einer Situation zunächst eine Bedeutung zu geben und sie zu klassifizieren, um – wenn möglich – automatisch-spontan agieren zu können (vgl. Lindenberg 2001b: 631; Mayerl 2009: 161). In der jüngeren sozialpsychologischen Forschung wird damit vermutet, dass generelle Einstellungen als „intuitive short-cuts“ (Ajzen/Fishbein 2000: 2) bei der Handlungsentscheidung verwendet werden (vgl. Ajzen/Fishbein 2000; Fiske/Neuberg 1990; Nisbett/Ross 1980; Tversky/Kahneman 1974, 1981). Dabei wird angenommen, dass es für ein Individuum rational ist, bei der Bildung einer spezifischen Einstellung gegenüber einer Handlungsoption generalisierte Einstellungen, Normen und Wertorientierungen einzubeziehen. Diese sind, gerade in Situationen, in denen das Individuum wenig tangiert ist, zunächst bewährt und erfordern keine aufwändigen neuen Evaluationen einer Situation (vgl. Esser 2004: 47ff.). Ein Beispiel verdeutlicht diese Annahme: Bei der Entscheidung, ob man bei einer Bundestagswahl wählen geht, ist es für eine Person mit einer internalisierten Wahlnorm am einfachsten, entsprechend der eigenen Norm zu agieren. Bei der Wahl handelt es sich um eine typische Low-Cost-Situation, in welcher nur geringe Kosten anfallen, aber auch nur ein geringer Nutzen resultiert.94 Dieses Verhalten ist erprobt, normgestützt und kaum mit negativen Folgen besetzt. Das bedeutet, wenn man sich normengeleitet verhält, muss man keine aufwändigen Kosten-NutzenAbwägungen der Situation vornehmen, die mit hohen Informationskosten verbunden wären. Wenn ein Individuum hingegen annimmt, eine Handlungsentscheidung auf der Basis der vorhandenen generalisierten Einstellungen nicht ausreichend treffen zu können, werden auch stärker situationsspezifische Aspekte relevant. Neben dem automatisch-spontanen Handeln in Low-Cost-Situationen, das einstellungsdominiert ist, existiert damit auch das rational-überlegte Entscheiden, das spezifische Einstellungen als positive und negative Nutzenanreize mit in die Kosten-Nutzen-Abwägung einbezieht (vgl. Ajzen 1996: 387; Esser 1996, 2001). Dabei werden die in einer bestimmten Situation vorliegenden Handlungsalternativen kognitiv intensiver durchdrungen und die Konsequenzen abgewogen. Um daraus nun keine „universelle Theorie“ zu konzipieren, die nicht mehr falsifizierbar ist, müssen Rahmenbedingungen festgesetzt werden, welche Determinanten die Wahl des Entscheidungsmodus beeinflussen. In der Literatur werden dazu verschiedene Determinanten diskutiert. Ohne an dieser Stelle den gesamten Forschungsstand zu referieren, lassen sich dabei einige zentrale Annahmen festhalten.

94

Der Nutzen kann darin liegen, die eigene Bürgerpflicht erfüllt zu haben. Bereits Brennan/Lomasky (1993) und Brennan/Hamlin (2000: 142ff.) haben solche Normen als expressive Anreize in Kosten-Nutzen-Modellen zur Erklärung der Wahlbeteiligung integriert und diese als zentrale Faktoren herausgearbeitet.

4.2 Duales Prozessieren

93

4.2.3 Die Wahl des Entscheidungsmodus Ein bewusst rationales Verhalten als Entscheidungsmodus wird für die Zielperson insbesondere dann notwendig und auch erst möglich, wenn sich Informationen nicht in die bestehenden Schemata einordnen lassen und wenn das erlernte Handlungsmodell in einer Situation nicht genau passt. Wenn eine solche fehlende Passung auftritt, ahnt der Akteur, dass es erfolgreichere Handlungsalternativen als die Routinehandlung geben kann (vgl. Quandt/Ohr 2004: 699f.). Hinzu kommen zwei weitere notwendige Determinanten: Der Akteur muss motiviert sein, die Kosten einer nicht spontanen Handlung auszugleichen (vgl. Esser 1996: 16). Das bedeutet, dass er die Handlungskonsequenzen als hinreichend relevant einschätzen muss, um kognitiv aufwändige Prozesse in Gang zu setzen. Neben der Motivation braucht er schließlich die Gelegenheit (Opportunitäten), d.h. ein notwendiges Maß an zeitlichen und kognitiven Kapazitäten, um überhaupt rationale Überlegungen anzustellen. Diese Vorstellung verschiedener Modi der individuellen Informationsverarbeitung sind im MODE-Modell (=Motivation und Opportunitäten als DEterminanten des Modus der Entscheidungsfindung) von Fazio (1986, 1990; Fazio/TowlesSchwen 1999) erstmals präzise formuliert worden. Esser integrierte diese Annahmen in die allgemeinere SEU-Theorie, indem er – wie bereits zuvor ausgeführt – argumentiert, dass bei der Handlungsentscheidung eigentlich zwei rationale Handlungsentscheidungen nacheinander ablaufen: Auf der ersten Stufe findet die Wahl des Entscheidungsmodus, danach die Wahl der Handlungsalternative statt (vgl. Esser 1996, 2001, 2004). In den ersten Studien von Fazio (1986, 1990) sind die beiden Entscheidungsmodi noch als Alternativen konzipiert. Es gibt demnach entweder das automatischspontane Handeln nach generalisierten Einstellungen oder das rational-überlegte Handeln, bei dem situationsspezifische Kosten-Nutzen-Abwägungen ablaufen. In neueren Arbeiten werden zudem auch „mixed processes“ (Fazio/Towles-Schwen 1999: 102) als dritter Typ konzeptualisiert. Innovativ und grundlegend für die folgenden Ausführungen sind jedoch die Arbeiten, die noch weitergehen und von einer Gradualität der Informationsverarbeitung und damit von einem Kontinuum zwischen den beiden Polen „spontan“ und „rational“ ausgehen (vgl. für eine Zusammenfassung des Forschungsstands Frings 2008: 214ff.). Dabei wird angenommen, dass diejenigen stärker rational agieren, die einen höheren Grad an Involvierung gegenüber der Anfrage aufweisen. Dies passt wiederum zum Modell der Einstellungsbildung nach Zaller (1992). Es wird vermutet, dass eine Person umso eher neue Informationen zu den bereits bestehenden Prädispositionen hinzunehmen wird, je involvierter, d.h. je motivierter, sie ist. Gleichzeitig nimmt man an, dass ein stärker rationaler Entscheidungsmodus bei der Zielperson bewusst aktiviert werden kann. Dies wäre bei einer Befragung z.B. durch die Gabe von Incentives oder aufgrund einer interessanten Einleitung möglich (vgl. Brehm 1993: 69; Groves et al. 1992: 477ff.; Groves/Couper 1998: 119ff.;

94

4 Die Teilnahme an politischen Umfragen

Stocké/Langfeldt 2003: 59; Vanberg 2002). Grundsätzlich kann man konstatieren, dass sowohl generalisierte Normen, Werte und Einstellungen als auch spezifische, situative Kosten-Nutzen-Abwägungen die Handlungsentscheidung eines Individuums beeinflussen. In welcher Form dies bei der Handlung „Teilnahme an Umfragen“ geschieht, soll im nächsten Abschnitt noch einmal explizit dargestellt werden.

4.2.4 Die Teilnahme an Umfragen im Kontinuum zwischen Heuristiken und bewussten Kosten-Nutzen-Abwägungen Folgt man den theoretischen Ausführungen von Mensch (2000: 253ff.) oder auch Ajzen/Fishbein (2000: 8) kann man annehmen, dass die Unterscheidung in Hochund Niedrigkostensituationen empirisch keine einfache Dichotomie darstellt, sondern dass es sich bei sozialen Interaktionssituationen, in denen sich Individuen für eine bestimmte Handlung entscheiden müssen, eher um ein „Elaborationskontinuum“ zwischen „zwei Pole[n] menschlicher Informationsverarbeitung“ (Mayerl 2009: 151) handelt. Je nach Position auf dem Kontinuum können unterschiedliche Arten der Bewertung von Nutzenmotiven in unterschiedlichem Maß zur Erklärung beitragen. Empirisch ist damit nicht davon auszugehen, dass ein Individuum, das vor einer derartigen Entscheidung steht, entweder nur nach generalisierten Einstellungen entscheidet oder alle situativen Anreizstrukturen komplett überlegt evaluiert. In der Regel werden sowohl pauschalere Urteile in Form von generalisierten Einstellungen, bspw. die generelle Einstellung gegenüber Umfragen oder das politische Interesseals auch bewusste Kosten-Nutzen-Abwägungen in die Entscheidung eingehen. Dabei können sowohl materielle Anreize, wie beispielsweise ein versprochenes Incentive, als auch immaterielle Anreize, wie beispielsweise die Sympathie gegenüber dem Interviewer, für die Bildung und Bewertung der Handlungsalternativen bedeutsam sein (vgl. Mayerl 2009: 151; Mensch 2000: 261). Die Entscheidungssituation ist für das Individuum bei der Anfrage, an einer Umfrage teilzunehmen, zunächst recht einfach über nur zwei Handlungsalternativen zu modellieren. Es kann an der Befragung teilnehmen oder eine Teilnahme verweigern. Die „Teilnahme an einer Befragung zum Thema Politik und Gesellschaft“ beinhaltet dabei jedoch verschiedene Dimensionen: Zum einen geht es darum, an einer Umfrage teilzunehmen. Gleichzeitig bedeutet die Teilnahme für das Individuum über politische und soziale Themen, die eigenen politischen Einstellungen und das politische Verhalten zu sprechen. Zudem befindet sich die Zielperson in der konkreten Situation in einer Interaktion mit einem meist fremden Interviewer. Gegen die Annahme eines rein rational-reflektierten Modus bei der Erklärung von Kooperation und Verweigerung wird in der Literatur argumentiert, dass die Entscheidung zur Teilnahme an Umfragen ein komplexer Prozess ist, der in der Regel nicht durchdrungen wird, sondern eher heuristisch abläuft (vgl. Brehm 1993:

4.2 Duales Prozessieren

95

69; Groves et al. 1992: 486f.; siehe auch Fazio 1990; Fazio/Towels-Schwen 1999; Petty/Cacioppo 1986). Da die Teilnahme an einer Befragung zudem für die wenigsten Menschen mit schwerwiegenden Handlungskonsequenzen behaftet ist, findet man in der Literatur auch häufig die Aussage, es handele sich bei der Entscheidung zur Teilnahme an einer Befragung um eine typische „Low-CostSituation“ (vgl. Diekmann/Preisendörfer 2003; Groves/Couper 1998: 32; Schnauber/Daschmann 2008: 103; Schnell 1997: 198; siehe zum Begriff der LowCost-Situation Kirchgässner 1992; Kliemt 1986: 333; Mensch 2000).95 Das Definitionskriterium für diese Low-Cost-Situationen ist, wie in den vorigen Abschnitten bereits ausgeführt, dass im Fall einer „falschen“ Entscheidung dies in der Regel nur wenig Relevanz für das Individuum hat, d.h. keine oder nur minimale Opportunitätskosten daraus resultieren. Daraus folgernd wird in Frage gestellt, ob die Zielpersonen in einer derartigen Situation überhaupt Kosten-Nutzen-Abwägungen anstellen oder doch eher rein intuitiv handeln. Andererseits kann man aber argumentieren, dass die wenigsten Menschen eine fest vorgefertigte Meinung und generalisierte Einstellungen zur „Teilnahme an einer politischen Befragung“ haben werden. Sie haben die Situation wahrscheinlich noch nicht oft erlebt. Daher wird die Entscheidung nicht langfristig, sondern in den meisten Fällen situationsspezifisch an der Tür, während der Interaktion mit dem Interviewer, getroffen. Hierbei könnte die Zielperson bewusst motiviert werden. Dies würde für stärker situationsspezifische, rational-überlegte Entscheidungen sprechen. Letztlich ist es wohl eine empirische Frage, welche Determinanten in welcher Stärke die Handlungsentscheidung eines Individuums beeinflussen. Für die Situation der Teilnahme an einer Befragung kann man daher feststellen, dass sie zunächst zwar eher auf der Seite der Low-Cost-Situation angesiedelt ist, es sich bei der Entscheidung zu Kooperation und Verweigerung jedoch nicht um eine reine Niedrigkostensituation handelt. Dies würde nämlich implizieren, dass es keine Opportunitätskosten gäbe. Je nach Forschungsdesign, beispielsweise durch den Einsatz von monetären Incentives, können die Opportunitätskosten durch den Forscher aber deutlich gesteigert werden (wie in der nachfolgenden Studie, siehe Kap. 5). Empirisch ist damit von einer Situation auszugehen, in der unterschiedliche Determinanten die Entscheidung der Zielperson beeinflussen (vgl. auch Brehm 1993: 68f.; Brennan/Lomasky 1993; Mensch 2000: 261). Das bedeutet, es gibt kein „entweder-oder“, sondern ein „sowohl-als auch“ von generalisierten und spezifischen Einstellungen, die in die Modellierung eingehen.96

95

Damit ist das Handeln der Zielpersonen in den Begrifflichkeiten von Brennan/Lomasky (1993) als „Wahlverhalten“ im Gegensatz zum rein ökonomischen „Marktverhalten“ zu bezeichnen. 96 Ähnliche weitreichende Kosten-Nutzen-Modelle findet man auch für die Erklärung von politischem Verhalten, z.B. bei den „General Incentive“-Modellen von Seyd und Whiteley. Auf der Seite der positiven Anreize werden dabei die wahrgenommene Wirksamkeit des Handelns, kollektive sowie selektive Nutzenanreize, soziale Normen und expressive Motive modelliert und den Kosten gegenübergestellt (vgl. Pattie et al. 2003: 444; Seyd/Whiteley 1992; Whiteley/Seyd 1996, 1998).

96

4 Die Teilnahme an politischen Umfragen

4.3 Die Theorie geplanten Verhaltens und die Kompatibilität zu den bisherigen Annahmen 4.3.1 Die Theorie geplanten Verhaltens Die meisten Erklärungsmodelle in der Forschung zu Kooperation und Verweigerung bei der Umfrageteilnahme sind, wie in den letzten Kapiteln dargestellt, in den Rahmen des Rational Choice-Forschungsprogramms eingebettet und im Sinne der Wert-Erwartungstheorie spezifiziert. Die herausgearbeiteten Modellprämissen und Spezifikationen lassen sich jedoch ebenso gut in eine der einflussreichsten sozialpsychologischen Theorien, die Theorie des geplanten Verhaltens (vgl. Ajzen 1985, 1991), eine Weiterentwicklung der Theorie überlegten Handelns (vgl. Ajzen/Fishbein 1980), integrieren.97 Die Idee, dass die existierenden Annahmen zur Erklärung von Kooperation bzw. Verweigerung im Rahmen der Theorie geplanten Verhaltens zu formulieren sind, ist besonders für die sich anschließenden Überlegungen zu Effekten im Sinne des Common Cause-Modells relevant. Wenn sich das Kooperationsverhalten von Individuen über die Theorie geplanten Verhaltens erklären lässt, gelten für das Kooperationsverhalten ähnliche Erklärungsmuster wie für zahlreiche andere politische Verhaltensvariablen, z.B. für politische Partizipation. In diesem Fall sind Verzerrungen durch Nonresponse nicht nur für die Determinanten der Kooperationsentscheidung, sondern auch für andere Konzepte der politischen Einstellungs- und Verhaltensforschung anzunehmen (siehe Kap. 4.7). Letztlich sind die beiden Theorien, die Theorie geplanten Verhaltens und die SEU-Theorie, nicht unabhängig voneinander. Vielmehr handelt es sich bei der Theorie geplanten Verhaltens um eine Spezifikation der SEU-Theorie. Diese theoretische Integration soll im Folgenden dargestellt werden. Die Grundidee der Theorie geplanten Verhaltens, „one of the most popular social-psychological models for the prediction of behavior” (Ajzen/Gilbert Cote 2008: 301), ist in Abbildung 8 visualisiert.

97 Hierbei muss angemerkt werden, dass die Begriffe Handeln und Verhalten bei Ajzen und Fishbein weitgehend synonym verwendet werden. Die Differenzierung von „Handeln“ als aktiver Entscheidung eines Individuums und „Verhalten“ als normgeleitetem, nicht bewusst kontrollierbarem Tun wird dabei außer Acht gelassen. Da es sich jedoch um feststehende Begriffe handelt, wird in diesem Abschnitt auch von Handlung und Verhalten als Synonymen ausgegangen.

4.3 Theorie geplanten Verhaltens und Kompatibilität zu bisherigen Annahmen Abbildung 8:

97

Die Theorie geplanten Verhaltens

behaviorale Erwartungen

Einstellung ggü. Verhalten

normative Erwartungen

subjektive Norm

KontrollErwartungen

wahrg. Verhaltenskontrolle

HandlungsIntention

Handlung

objektive Kontrolle

Quelle: Ajzen/Gilbert Cote (2008): 310.

Dabei wird angenommen, dass die Einstellung gegenüber einer spezifischen Handlungsalternative gebildet wird, wobei die Mechanismen der subjektiven Wert-Erwartungstheorie greifen, d.h. es kommt zu einer Abwägung verschiedener vorliegender Erwartungen. In der theoretischen Konzeption der Theorie geplanten Verhaltens wird davon ausgegangen, dass der tatsächlichen Handlung die Intention, eine bestimmte Handlung auszuführen, direkt vorgeschaltet ist. Diese Handlungsintention ist wiederum abhängig von drei Determinanten: erstens von der Einstellung gegenüber dem Verhalten, zweitens von der subjektiven Norm und drittens von der subjektiv wahrgenommenen Verhaltenskontrolle. Die Einstellung gegenüber einem bestimmten Verhalten (z.B. gegenüber der Teilnahme an einer Umfrage) kann positiv oder negativ sein. Sie basiert auf einer Kosten-Nutzen-Abwägung der in der spezifischen Situation verfügbaren Erwartungen und Bewertungen.98 Das bedeutet, die Zielperson versucht bereits, mögliche Folgen einer bestimmten Handlungsentscheidung zu ermitteln, die Wahrscheinlichkeit des Eintretens dieser Folgen abzuschätzen und diese Folgen zu bewerten. Daraus resultiert eine Einstellung gegenüber diesem Verhalten. Die Theorie geplanten Verhaltens bezieht sich dabei strenggenommen nicht auf die Bewertung unterschiedlicher Handlungsalternativen und ist damit im eigentlichen Sinn keine Entscheidungstheorie. Handeln impliziert jedoch immer auch die Möglichkeit des 98 Diese haben in den Modellvorstellungen von Fishbein und Ajzen sowohl eine kognitive als auch eine evaluative Komponente (vgl. Kühnel 1993: 32).

98

4 Die Teilnahme an politischen Umfragen

Nicht-Handelns. Daher kann man die Theorie derart interpretieren, dass die Werte für die beiden Alternativen des Ausführens der Handlung und des Unterlassens derselben in Relation zueinander gesetzt werden (vgl. bereits Ajzen/Fishbein 1980). Damit wird davon ausgegangen, dass bei der Bildung der Einstellung gegenüber einer Handlung jeweils die Differenz zwischen den positiven und negativen Erwartungen für das Ausführen und das Unterlassen der Handlung gebildet und die besser bewertete Alternative angestrebt wird. Die Parallelen zu den Annahmen der subjektiven Wert-Erwartungstheorie, bei der ebenfalls Erwartungen und darauf basierenden Bewertungen verschiedener Handlungsalternativen die Handlungsentscheidung beeinflussen, sind damit klar erkennbar. Die Handlungsentscheidung ist jedoch nicht nur von der spezifischen Einstellung gegenüber einem Verhalten, sondern auch von der subjektiven Norm abhängig. An dieser Stelle differenziert die sozialpsychologische Theorie geplanten Verhaltens stärker als die allgemeinere Wert-Erwartungstheorie: In die Bildung der subjektiven Norm geht ein, welche Erwartungen das Individuum darüber hat, wie sein soziales Umfeld auf eine bestimmte auszuführende Handlung reagieren wird. Die Bewertung erfolgt, analog zur zuvor ausgeführten Bildung der behavioralen Einstellungen, als Differenz der Nutzenwerte der Handlungsausführung und des Unterlassens der Handlung. Dabei unterscheidet sich nur die Form salienter Erwartungen, die nun normativer Natur sind. Die Zielperson könnte beispielsweise evaluieren: „Es ist meine Bürgerpflicht, dass ich an der Befragung teilnehme, das macht man als guter Demokrat. Und dem Interviewer würde ich damit zudem einen Gefallen tun. Er erwartet es sicher von mir. Obgleich meine Frau diese Umfragen unnütz findet, aber das ist nicht so wichtig, sie nimmt es mir auch nicht übel, wenn ich daran teilnehme.“ Schließlich kommt die wahrgenommene Verhaltenskontrolle hinzu, d.h. das Individuum muss annehmen, die Handlung auch ausführen zu können. In die Bildung dieser wahrgenommenen Verhaltenskontrolle werden Erwartungen darüber einbezogen, wie wahrscheinlich die Ausführung einer bestimmten Handlung in der Kontrolle des Individuums liegt. Auch dabei sind wiederum positive und negative Nutzenanreize relevant. Eine mögliche Abwägung in diesem Sinne wäre: „Ich habe mich noch nie für Politik interessiert und kann die Fragen, die mir der Interviewer stellt, sicher nicht beantworten. Ich kann da nicht teilnehmen.“ Je schwieriger eine Handlung ist, desto stärker wirkt die wahrgenommene Verhaltenskontrolle (vgl. Madden et al. 1992). Die drei Einstellungskonstrukte wirken zusammen und determinieren gemeinsam die Handlungsintention des Individuums, d.h. die Absicht, die Handlung tatsächlich auszuführen. Die Stärke des Einflusses der einzelnen Konstrukte auf die Handlungsintention kann sich je nach Population und untersuchtem Verhalten unterscheiden (vgl. Ajzen/Gilbert Cote 2008: 301ff.). Die Intention, eine Handlung ausführen zu wollen, alleine reicht jedoch nicht aus, um sie auch tatsächlich ausführen zu können. Um dies zu berücksichtigen

4.3 Theorie geplanten Verhaltens und Kompatibilität zu bisherigen Annahmen

99

wurde ein weiterer Faktor zusätzlich in das Modell eingeführt, nämlich die objektive Kontrollmöglichkeit, d.h. die tatsächlich vorhandenen Ressourcen und Fähigkeiten eines Individuums (vgl. Kühnel 1993: 33). Die objektive Kontrolle beinhaltet die faktischen Restriktionen. Sie kann im Modell sowohl direkt auf die Handlungsausführung als auch zugleich auf die subjektiv wahrgenommene Verhaltenskontrolle wirken (vgl. Ajzen 1985; Ajzen/Fishbein 2005; Ajzen/Gilbert Cote 2008). Insgesamt bezieht sich die Theorie des geplanten Verhaltens zunächst auf die Bildung spezifischer Einstellungen und auf einen eher bewusst-reflektierten Entscheidungsmodus (vgl. Esser 2001: 294). Häufig findet man die Kritik formuliert, dass stärker heuristisches Entscheiden nicht mit in die Erklärung einbezogen wird (vgl. etwa Eagly/Chaiken 1998: 273). Dieses automatische Entscheiden ist jedoch gut mit der Modellvorstellung zu vereinen, worauf Ajzen und Fishbein schon 1980 bei der Entwicklung der Vorstufe ihrer Theorie hinweisen: „[…] we view the processes involved as largely automatic or implicit, and only in rare cases do we become fully aware of these processes“ (Ajzen/Fishbein 1980: 245). Sie gehen damit sogar generell von stärker heuristischem Entscheiden aus. Nur in „seltenen Fällen“, wenn der Akteur motiviert ist, finden demnach die Entscheidungen bewusst statt. Auch andere Autoren stellen die Frage, wie generalisierte Einstellungen in die Theorie geplanten Verhaltens einbezogen werden können. Kühnel weist beispielsweise darauf hin, dass generalisierte Einstellungen als „Hintergrundvariablen zum einen die Herausbildung bedeutsamer Vorstellungen beeinflussen und zum anderen die Stärke der Effekte moderieren“ (Kühnel 1993: 33) können. Damit verbunden ist die Vorstellung, dass generelle Einstellungen einen Bezugsrahmen bilden, der die vorliegenden Erwartungen in der Situation der Einstellungsbildung strukturiert. Je nachdem, wie die generellen Einstellungen eines Akteurs aussehen, sind dann nur bestimmte Assoziationen und Eindrücke abrufbar.99 Diese Vorstellung sieht generalisierte Einstellungen weniger als Determinanten, sondern als externe Faktoren an, die nicht direkt in das Modell integriert sind, sondern auf die vorliegenden Erwartungen wirken. Ob generalisierte Einstellungen als externe, die Erwartungen strukturierende Variablen oder als aus Erwartungen gebildete Variablen in das Modell eingehen, soll an dieser Stelle nicht weiter thematisiert werden. Dies erscheint gerechtfertigt, da es nicht Ziel der Arbeit ist, die Theorie geplanten Verhaltens in ihren Einzelaspekten zu falsifizieren. Vielmehr wird sie als Instrument verwendet, um mögliche Variablen zu erkennen, bei denen man aufgrund der theoretischen Konzeption einen Einfluss auf die Teilnahme oder Nicht-Teilnahme an Umfragen annimmt. Dafür wird angenommen, dass generalisierte Einstellungen ebenso wie spezifische Einstellungen die Handlungsentscheidung beeinflussen können. 99

Auch die Annahme von Interaktionseffekten findet sich bei Kühnel, der feststellt, dass zur Verbesserung der Prognosequalität „über die Wertausprägung externer Variablen Subgruppen definiert werden“ (Kühnel 1987: 68) sollten, da für diese unterschiedliche Verteilungen zur Salienz von Verhaltens-, Kontroll- und normativen Erwartungen gelten könnten (vgl. Kühnel 1993: 68ff.).

100

4 Die Teilnahme an politischen Umfragen

Ob dies direkt oder indirekt geschieht, ist zur Beantwortung der Fragestellung weitgehend unerheblich.

4.3.2 Die Kompatibilität der Theorie geplanten Verhaltens und der SEU-Theorie Manche Forscher bezweifeln, dass sich die Theorie geplanten Verhaltens (TpB) und die Wert-Erwartungstheorie (SEU-Theorie) unter einen gemeinsamen Rational Choice-Ansatz stellen lassen (vgl. etwa Kühnel 1993). Diese Arbeit vertritt jedoch die Auffassung, dass beide Theorien im Ansatz einer weiten RC-Modellierung verortet werden können (vgl. etwa Esser 2001: 294; Mayerl 2009: 192). Dies geschieht vor dem Hintergrund der Annahme, dass sich „Rational Choice“ wie zuvor ausgeführt nur auf die Rationalität des Verfahrens bezieht. Unter dieser Prämisse wird angenommen, dass es sich bei der TpB um eine Erweiterung und Ergänzung der SEU-Theorie handelt. Beide Theorien basieren zunächst auf identischen Grundannahmen und unterscheiden sich lediglich im Schwerpunkt ihres Erkenntnisinteresses. Sie sind beide zunächst sparsam konzipiert. Die TpB ist aber geeignet, „blinde“ Stellen der SEU-Theorie zu füllen. Im Folgenden sollen die Unterschiede und Gemeinsamkeiten beider Theorien kurz erläutert und der Frage nachgegangen werden, inwiefern die TpB eine Explikation der SEU-Theorie ist. In den Publikationen von Fishbein und Ajzen formulieren die beiden Autoren selbst, dass innerhalb der Theorie geplanten Verhaltens ein „Erwartungs-WertModell“ die Bildung einer Einstellung gegenüber einem Verhalten erklärt (vgl. Fishbein/Ajzen 1975: 30; auch Ajzen/Gilbert Cote 2008: 290).100 Eine Analyse beider theoretischen Modelle zeigt, dass der Nutzen einer Handlungsalternative innerhalb der SEU-Theorie, ebenso wie die Einstellung gegenüber einer Handlung in der TpB, als Produktsumme aus Bewertungen und Erwartungen bi*ei gebildet wird (vgl. Kühnel 1993: 78). Für Kühnel (1993: 77ff.) reicht dies jedoch nicht, um beide Theorien im gleichen Ansatz zu verorten, da es seines Erachtens zwischen den beiden Theorien dennoch Unterschiede gibt. Seine zentralen Argumente sollen hier kurz aufgezeigt und, in Anbetracht der zuvor aufgestellten Annahmen zur SEU-Theorie, weitestgehend widerlegt werden. Kühnel nennt verschiedene Argumente, die ihn von der Inkompatibilität der Theorien ausgehen lassen. Erstens beschreibt er als zentralen Unterschied, dass es sich bei der Wert-Erwartungstheorie um eine deterministische und bei der Theorie geplanten Verhaltens um eine stochastische Theorie handele. Die SEU-Theorie wurde jedoch – wie Kühnel selbst erwähnt (vgl. Kühnel 1993: 78) – von Esser (1990) und Lindenberg (1989) bereits als stochastische Theorie reformuliert. Zweitens weist Kühnel darauf hin, dass in den beiden Theorien unterschiedliche Handlungskonsequenzen in die Bewertung mit eingehen. Bei der TpB nur die bedeutsa100

Auch andere Studien unterstützen diese Verknüpfung der beiden theoretischen Modelle innerhalb eines Ansatzes (vgl. Muller 1979; Stephan 1990).

4.3 Theorie geplanten Verhaltens und Kompatibilität zu bisherigen Annahmen 101 men, bei der SEU-Theorie hingegen alle Handlungskonsequenzen. Dabei liegt jedoch ein Missverständnis vor: Innerhalb der SEU-Theorie wird nicht angenommen, dass alle potenziellen Handlungskonsequenzen berücksichtigt werden. Da auch im Rahmen der SEU-Theorie von beschränkten Informationsverarbeitungskapazitäten von Individuen ausgegangen wird, ist in ihr angelegt, dass nur bestimmte Konsequenzen – diejenigen nämlich, die subjektiv verfügbar sind – mit in die Entscheidung eingehen. Bei Esser findet man dies in dem expliziten Hinweis auf die Subjektivität der Randbedingungen, welche die Rationalität der Selektionsregel nicht beeinflussen (vgl. Esser 1999: 216). Als weiteren Unterschied erwähnt Kühnel die beiden Konstrukte der sozialen Norm und der Kontrollerwartung in der TpB, die er in der Nutzentheorie nicht wiederfindet. Bereits in den Ausführungen von Lindenberg (1985) und Esser (1985) wird jedoch darauf hingewiesen, dass ein rationaler Akteur auch nach gesellschaftlichen Normen handeln kann. Soziale Normen sind zwar nicht explizit im Rahmen des SEU-Ansatzes als Determinanten der Handlungsentscheidung modelliert, können aber implizit mit ins Entscheidungskalkül einfließen. In der TpB wird zwischen der Einstellung gegenüber dem Verhalten und der subjektiven Norm getrennt. Sie differenziert damit lediglich stärker als die SEU-Theorie. Innerhalb der einzelnen Konstrukte gelten bei der Bildung der Einstellungen jedoch wieder die Mechanismen der Wert-Erwartungstheorie. Empirisch bleibt offen, ob zwischen der Norm und der Einstellung gegenüber dem Verhalten tatsächlich unterschieden werden kann. Kühnel selbst weist an anderer Stelle darauf hin, dass dies nicht unbedingt der Fall ist (vgl. Kühnel 1993: 23; auch Fishbein/Ajzen 1975: 304). Dies ist aber auch nicht unbedingt notwendig, um die Kompatibilität der beiden Theorien annehmen zu können. Letztlich ist es damit ein definitorischer Unterschied, ob man die beiden Konzepte trennt, wie bei der TpB, oder nicht, wie bei der SEU-Modellierung. Vor dem Hintergrund eines detaillierteren Begriffsverständnisses ist eine Trennung der normativen Einflüsse von der Einstellung gegenüber dem Verhalten durchaus legitim. Wie bereits erwähnt, haben die beiden Theorien ein jeweils unterschiedliches Erkenntnisinteresse. Die TpB bezieht sich zunächst explizit auf die Erklärung der Herausbildung einer Handlungsintention, die dann direkte Determinante der Handlungsausführung ist. Die SEU-Theorie bezieht sich hingegen auf die direkte Erklärung einer Handlungswahl zwischen verschiedenen Handlungsalternativen. Sie bildet damit einen Rahmen grundlegender Prinzipien der Handlungsentscheidung. Die TpB ist dann geeignet, die Erklärung auf der theoretischen Ebene zu vervollständigen, indem sie die Blackbox zwischen Einstellungen und Verhalten beleuchtet, auf die bei der SEU-Theorie nicht detaillierter eingegangen wird. In der Literatur wird jedoch häufig kritisiert, dass bei der TpB die Auswahl verschiedener Handlungsalternativen nicht modelliert wird. Es wird konstatiert, dass ihr eine explizite Selektionsregel fehle, was wiederum die SEU-Theorie leisten kann (vgl. Mayerl 2009: 75). Dennoch kann man, wie bereits beschrieben, immer zwischen der Intention, eine Handlung auszuführen oder sie zu unterlassen, unterscheiden

102

4 Die Teilnahme an politischen Umfragen

und damit zwischen mindestens zwei Handlungsalternativen diskriminieren. Die TpB lässt sich damit problemlos als Handlungstheorie modellieren und in den Kontext des weiten RC-Ansatzes stellen. In Kombination mit den Annahmen der SEUTheorie, bei der die Selektionsregel eindeutig formuliert ist, kommt man somit zu einer vollständigeren Erklärung. Ein weiterer Unterschied zwischen den Theorien besteht im Umgang mit generellen Einstellungen. In der SEU-Modellierung werden sie direkt mit aufgenommen, in der TpB meist als „externe Variablen“ (vgl. Ajzen/Fishbein 1980: 84; Kühnel 1993) angesehen. Diese können in der TpB zu den „bedeutsamen Attributen der Einstellung zum Verhalten“ (Kühnel 1993: 119) gehören, müssen es aber nicht. Das bedeutet, politische Einstellungen könnten in dieser Formulierung nur indirekt auf die Einstellung gegenüber der Teilnahme an einer politischen Befragung wirken, während sie bei der SEU-Modellierung als direkte Kosten/Nutzenanreize im Modell integriert wären. In der empirischen Überprüfung wird jedoch nicht zwischen direkten und indirekten Determinanten unterschieden. Aus diesem Grund ist dieser Aspekt von untergeordneter Relevanz. Insgesamt kann man daher festhalten, dass die von Kühnel genannten Argumente nicht ausreichen, um von zwei völlig getrennten theoretischen Konzepten zu sprechen. Erweitert man die TpB um die Idee der Wahl zwischen Handlungsalternativen, kann man sie sehr gut als „Variante der Wert-Erwartungs-Erklärung des Verhaltens“ (Esser 2001: 248) ansehen. In diesem Fall stellt sie die detailliertere Theorie dar, die präzisere Erklärungen postuliert, die Determinanten strukturiert und zugleich höhere Anforderungen an die Daten stellt (vgl. dazu auch die methodologischen Anweisungen zur Überprüfung der Theorie von Ajzen/Fishbein 1980). Die Grundidee entspricht aber der einer SEU-Modellierung. Im weiteren Verlauf dieser Arbeit wird aus den genannten Gründen von einer weitgehenden Kompatibilität der theoretischen Annahmen ausgegangen. Beide lassen sich in den Rahmen einer weiten RC-Perspektive einordnen. Zur Strukturierung der potenziellen Determinanten ist die TpB die geeignetere Modellierung. Da die Handlungsintention bei den vorliegenden Daten empirisch jedoch nicht getrennt erfasst wurde, sondern lediglich die Handlung selbst erhoben wurde, wird – wie bei klassischen SEUModellierungen – die Handlung an sich als zentrale zu erklärende abhängige Variable eingeführt. Dabei wird theoretisch nicht ausgeschlossen, dass dieser Handlungsentscheidung eine Handlungsintention vorausgeht, jedoch kann diese Detailebene empirisch nicht mit den vorliegenden Daten untersucht werden. Da sich die zentrale Fragestellung der Arbeit aber auch auf den Aspekt der möglichen Unterschiede zwischen Respondenten und Nonrespondenten bezieht, stehen nicht die theoretischen Modellierungen (Handlung vs. Handlungsintention) im Mittelpunkt des Erkenntnisinteresses. Die Theorien werden vielmehr als Instrumente herangezogen, um relevante Variablen herauszuarbeiten, bei denen Unterschiede zwischen Verweigerern und Kooperativen angenommen werden. Dieses Forschungsziel

4.4 Zwischenfazit

103

rechtfertigt den „gröberen“ Zugang auf theoretischer Ebene, der gewisse Detailfragen der Modellierung ausklammert.

4.4 Zwischenfazit Als Zwischenfazit lässt sich festhalten, dass ein Modell zur Erklärung der Kooperation bei politischen Umfragen auf der Individualebene zunächst auf klassische Handlungstheorien zurückgreift. Kooperation oder Verweigerung werden dabei als zwei Handlungsalternativen (Handlung und Unterlassung derselbigen) konzeptualisiert. Die Wahl der Alternative erfolgt nach den Regeln der subjektiven WertErwartungstheorie. In der Forschung werden meist zwei grundlegende Strömungen zur Erklärung der Handlungsentscheidung unterschieden: sozialpsychologische Modelle, die Einstellungen als zentrale Determinanten diskutieren, und Theorien, die die Entscheidung als Kosten-Nutzen-Abwägung erklären. Im vorangegangenen Kapitel wurde gezeigt, dass sich diese beiden nicht entgegenstehen oder widersprechen. Dazu wurde zum einen von einem weiten Nutzenbegriff ausgegangen und angenommen, dass spezifische Einstellungen als Kosten- oder Nutzenmotive in die Abwägung eines Individuums eingehen. Zum anderen wurden die Ideen des dualen Prozessierens aufgenommen und verschiedene Entscheidungsmodi unterschieden. Dabei wird angenommen, dass die Entscheidung eines Individuums für eine Handlungsalternative, je nach Grad der Informationsverarbeitung, stärker überlegt-reflektiert oder automatisch-spontan bzw. heuristisch ablaufen kann. Im ersten Fall wirken stärker spezifische Einstellungen und/oder materielle Kosten-NutzenÜberlegungen, im zweiten Fall beeinflussen eher generalisierte Einstellungen, Wertvorstellungen und Normen die Handlungsentscheidung. Dabei wird argumentiert, dass aufgrund der begrenzten Informationsverarbeitungskapazitäten von Individuen ein dauerhaft reflektiertes Vorgehen und eine intensive Kosten-Nutzen-Abwägung nicht in jeder Handlungssituation möglich ist. Daher werden zunächst generalisierte Einstellungen auf die Wahl der Alternativen wirken. Erst wenn bestimmte Bedingungen eine Situation kennzeichnen, sind stärker reflektierte Kosten-Nutzen-Abwägungen anzunehmen. In der Literatur werden verschiedene Determinanten genannt, die beeinflussen, welcher Entscheidungsmodus gewählt wird. Diskutiert wurden im vorangegangenen Abschnitt vor allem diejenigen Merkmale, die sich als empirisch erklärungsstark herausgestellt haben: Ein Akteur wird stärker überlegt-rational agieren, wenn er merkt, dass es sich nicht um eine Alltagssituation handelt, wenn seine Standardhandlung nicht genau passt oder wenn die wahrgenommenen Informationen nicht zu bestehenden Handlungsmodellen passen. Gerade für eine in Befragungssituationen unerfahrene Zielperson ist anzunehmen, dass es kaum eine Standardhandlung für die Situation einer Interviewanfrage gibt. Dies kann sogar noch gesteigert wer-

104

4 Die Teilnahme an politischen Umfragen

den, wenn ein hohes Incentive ausgezahlt wird, das in der deutschen empirischen Sozialforschung einen gewissen Seltenheitswert hat. Zudem muss der Akteur auch motiviert sein, die Kosten einer nicht spontanen Handlung auszugleichen und er braucht ein notwendiges Maß an Zeit und kognitive Kapazitäten, um überhaupt rationale Überlegungen anstellen zu können. Alle diese Merkmale können als moderierende Variablen genannt werden. Je stärker diese Voraussetzungen gegeben sind, desto eher bildet der Akteur auf der Grundlage von stärker situativen Anreizen und Kostenfaktoren spezifische Einstellungen gegenüber einem bestimmten Verhalten heraus. Die Motivation eines Akteurs hängt, so die Annahme, hauptsächlich mit der Schwere der individuellen Handlungskonsequenzen zusammen. Diese wird in der Literatur über die Klassifikation der Situation als Low- oder High-Cost-Situation abgebildet: In Low-Cost-Situationen „lohnen“ sich keine reflektierten Überlegungen, in Situationen mit höheren Kosten und höherer Relevanz dagegen schon. Dabei wird jedoch nicht davon ausgegangen, dass es sich um zwei alternative Situationstypen handelt, sondern vielmehr um ein Kontinuum, in dem Situationen angesiedelt sein können. Auf diesen Grundlagen wurde schließlich die Theorie geplanten Verhaltens herangezogen und ihre Nähe zum SEU-Ansatz aufgezeigt. Sie ist geeignet, um die Merkmale zu strukturieren, die die Handlungsentscheidung des Individuums beeinflussen. Dies sind im Wesentlichen drei Kategorien von Determinanten: die Einstellung gegenüber dem Verhalten, die subjektive Norm und die Handlungskontrolle, wobei man noch einmal zwischen der subjektiv wahrgenommenen und der objektiven Handlungskontrolle unterscheiden kann. Die Grundannahme bleibt, dass ein Zusammenspiel von situativen Faktoren („states“) und situationsunabhängigen Einstellungen („traits“) die Entscheidungssituation beeinflusst (vgl. Schnauber/Daschmann 2008). Bevor im nächsten Abschnitt die Merkmale, für die ein Einfluss auf die Entscheidung zwischen Kooperation und Verweigerung angenommen werden kann, diskutiert werden, sollen an dieser Stelle noch zwei Anmerkungen erfolgen: Bei der Wert-Erwartungstheorie handelt es sich zunächst um ein Konzept zur Erklärung parametrischer Entscheidungssituationen. Dabei wird angenommen, dass ein Akteur in einer unbelebten, nicht reaktiven Handlungsumgebung agiert (vgl. Frings 2008: 133; Spohn 1994: 198). Daher wird häufig argumentiert, dass zur Erklärung von Interaktionssituationen und damit zur Erklärung von sozialem Handeln spieltheoretische Modellierungen notwendig seien. Verschiedene Autoren zeigen jedoch, dass auch die subjektiven Wert-Erwartungstheorien geeignet sind, Interaktionssituationen, d.h. Situationen, in denen die Handlungskonsequenzen der beteiligten Akteure mit kontrolliert und die potenziellen Reaktionen des Gegenübers mit einkalkuliert werden müssen, zu modellieren (vgl. Frings 2008: 134; Hennen/Kunz 2002: 613). Dies ermöglichen explizit subjektive Wahrscheinlichkeitsschätzungen, die in der TpB in den subjektiven Erwartungen abgebildet sind, die in die Bildung der Einstellung gegenüber dem Verhalten, der subjektiven Norm

4.4 Zwischenfazit

105

und der wahrgenommenen Handlungskontrolle eingehen. Aus diesem Grund ist die Modellierung über die TpB auch für eine Situation strategischer Interdependenz vertretbar. Die zweite Anmerkung bezieht sich auf die Frage, ob es sich bei der Teilnahme an einer politischen Umfrage nicht einfach um eine Form politischer Partizipation handelt. Aus diesem Grund, könnte man argumentieren, sind keine neuen theoretischen Modellierungen notwendig, sondern die Auswahl der Determinanten kann auf der breiten theoretischen und empirisch gesicherten Forschungsbasis zur Erklärung politischer Partizipation erfolgen (vgl. neben vielen anderen Ajzen/Fishbein 1980; Barnes et al. 1979; Gabriel 2004; Kaase/Marsh 1979; Koch et al. 2001; Parry et al. 1992; Pattie et al. 2004; Teorell et al. 2007; Uehlinger 1988; Verba et al. 1978; Verba et al. 1995; Verba/Nie 1972). Dazu wird in dieser Arbeit eine differenzierte Position bezogen, die nun kurz dargestellt werden soll. Wie im vorangegangenen Kapitel gezeigt, handelt es sich bei der Entscheidung zu Kooperation oder Verweigerung um eine Form sozialen Handelns. Bei einer Umfrage zu politischen Themen kann man zusätzlich annehmen, dass es sich um eine Form politischen Handelns handelt. Brehm (1993: 69) vermutet: „The respondent’s decision to participate in surveys may share common factors with a citizen’s decision to participate in politics. [...] [S]ome respondents may view participation in the survey as a political act“. Ob es sich um „politische Partizipation“ oder lediglich um „Reden über Politik“ und damit politische Kommunikation handelt, hängt von den Begrifflichkeiten und Definitionen der beiden zentralen Konzepte „Politische Partizipation“ und „Umfrageteilnahme“ ab. Diese müssen daher präzisiert werden. Unter politischer Partizipation wird jede freiwillige Handlung verstanden, die mit dem Ziel durchgeführt wird, politische Entscheidungen zu beeinflussen (vgl. etwa Kaase/Marsh 1979: 42; Verba/Nie 1972: 2).101 Die Teilnahme an Umfragen wäre gemäß dieser Definition genau dann politische Partizipation, wenn die Befragten darauf abzielten, Repräsentanten zu beeinflussen, sich öffentlich zu artikulieren und die Ablehnung bzw. Zustimmung zu Entscheidungen und gesetzlichen Regelungen kundzutun. Studien, insbesondere aus dem angelsächsischen Raum, zeigen, dass Politiker und ihre Entscheidungen durch Umfragen („Volksbefragungen“) entweder direkt oder indirekt über die Medien beeinflusst werden 101

Es existieren daneben Definitionen von politischer Partizipation, die den Begriff deutlich weiter fassen. Radtke (1976: 16) versteht unter politischer Partizipation etwa jede Beschäftigung mit Politik. Dann wären Umfragen eine Form politischer Partizipation. Eine derart umfassende Begriffsdefinition erscheint jedoch nicht geeignet, da die Verwendung des Begriffs unpräzise ist und notwendige Abgrenzungen zu verschiedenen Formen von Partizipation nicht mehr möglich erscheinen. Eine derartige Unschärfe trägt nicht zum Erkenntnisgewinn bei. Ein enges instrumentelles Verständnis findet man z.B. bei Verba/Nie (1972: 3), die unter politischer Partizipation nur zielgerichtete Aktivitäten verstehen und von „those activities […] that are more or less aimed at influencing the selection of governmental personnel and/or the actions they take“ sprechen. Davon unterscheiden lassen sich Konzepte, die auch nicht-zielgerichtete Tätigkeiten mit politischen Auswirkungen einbeziehen, z.B. symbolische Akte. Diese Auffassung vertreten z.B. Milbrath/Goel, wenn sie zu politischer Partizipation feststellen: „[I]t includes not only active roles that people pursue in order to influence political outcomes but also ceremonial and support activities“ (Milbrath/Goel 1977: 2).

106

4 Die Teilnahme an politischen Umfragen

(vgl. Paletz et al. 1980: 508f.; auch Burstein 2003; Cohen 1997; Druckman/Jacobs 2006; Erikson et al. 2002; Jacobs/Page 2005; Manza et al. 2002; Page/Shapiro 1983; Soroka/Wlezien 2005).102 Man könnte daher annehmen, dass Bürger über eine Teilnahme auch diesen Zweck verfolgten. Dann wäre die Teilnahme eine Form politischer Partizipation, ähnlich wie beispielsweise eine Unterschriftensammlung. Andererseits kann man jedoch auch argumentieren, dass den Zielpersonen die Beeinflussung der Politik gar nicht bewusst ist und sie annehmen, dass es sich bei einer Umfrage um reinen Zeitvertreib beziehungsweise Kommunikation über politische Themen handelt. Dann läge keine politische Partizipation im zuvor definierten Sinne vor. Es könnte sich zwar um eine Voraussetzung späterer politischer Partizipation handeln, wäre selbst aber keine gezielte Einflussnahme. Man kann versuchen, die Zielpersonen in Richtung der ersten Annahme zu beeinflussen, indem beispielsweise bereits im Anschreiben explizit auf die Möglichkeit der Beeinflussung von Politik und Politikern Bezug genommen wird. Empirisch lässt sich die Frage: „Sind Umfragen mit politischen Inhalten politische Partizipation oder Beschäftigung mit Politik?“ jedoch nicht eindeutig klären, wenn man die Zielpersonen nicht explizit danach gefragt hat, was sie mit der Teilnahme beabsichtigen. Die allgemeinere Vorstellung „Die Teilnahme an einer Umfrage zu politischen Themen ist politische Kommunikation“ basiert auf weniger strengen Annahmen über die Zielpersonen. Sie kann in diesem Fall intentional und damit politische Partizipation sein, sie muss es aber nicht unbedingt. Man kann ebenso an Umfragen teilnehmen, ohne gezielt politische Prozesse beeinflussen zu wollen. Ob, und wenn ja wie viele, Personen ihre Umfragebeteiligung tatsächlich als politische Beteiligung wahrnehmen, ist eine empirische Frage, zu der bislang leider keine Daten erhoben wurden.103 So lässt sich weder empirisch noch theoretisch entscheiden, wie die Zielpersonen die Teilnahme an Umfragen einordnen. Für die vorliegende Arbeit wird daher zunächst vom allgemeineren Fall „politischer Kommunikation“ ausgegangen und angenommen, dass mit der Teilnahme nicht notwendigerweise ein bestimmtes politisches Ziel verfolgt wird. Klassische Erklärungsfaktoren politischer Partizipation können dennoch gut in ein Erklärungsmodell integriert werden, da sich viele davon nicht nur explizit auf den intentionalen Aspekt beziehen, sondern auf politisches und soziales Handeln allgemein (vgl. Esser 1973: 220ff.). Dies zeigt das Beispiel des Interesses am Thema. Allgemein wird davon ausgegangen, dass Interesse am Thema einer Studie die Teilnahmebereitschaft positiv beeinflusst (vgl. Baumgartner et al. 1998). Bei politischen Umfragen kann man daraus ableiten, dass politisches Interesse die Teilnahmewahrscheinlichkeit erhöht. Politisches Interesse wird in der Forschung gleichzeitig als relevanter Einflussfaktor für politi-

102

Siehe dazu auch das Interview mit Pappi in der Zeitschrift für Politikberatung (2008: 93-100) zum Einfluss von Umfragen auf Politiker in der Bundesrepublik Deutschland. 103 Hier wäre eine Frage der Art „Ist die Teilnahme an einer politischen Umfrage für Sie eine Möglichkeit, sich politisch zu beteiligen?“ nötig.

4.5 Die Modellierung

107

sche Partizipation diskutiert (vgl. etwa Brehm 1993: 70; Vetter/Maier 2005: 52; Voogt/Saris 2003; Voogt 2004). Der Vorteil bei dieser Vorgehensweise ist, dass man sich nicht auf ein zu weites Begriffsverständnis politischer Partizipation einlassen muss. Das vorgestellte Konzept der Teilnahme an Umfragen als „Reden über Politik“ basiert auf weniger Prämissen und ist nicht in dem Moment hinfällig, in dem gezeigt wird, dass die Befragten mit ihrer Teilnahme nicht auf die Beeinflussung der Politik abzielen. Hinzu kommt, dass sich in einem darauf basierenden Kausalmodell auch nichtpolitische Handlungsmotive (wie beispielsweise Einstellungen gegenüber Umfragen und Reaktionen auf einzelne Designelemente) zur Erklärung der Handlungsentscheidung aufnehmen lassen. Diese werden in den klassischen Erklärungsmodellen politischer Partizipation nicht berücksichtigt, können jedoch für die Teilnahme an Umfragen relevant sein. Wenn sich anschließend im allgemeinen Modell zeigt, dass zentrale politische Variablen, die sich bereits in der Literatur als relevante Determinanten von politischer Partizipation erwiesen haben, auch auf die Teilnahmeentscheidung bei einer Umfrage wirken, gelten diese Zusammenhänge erst recht unter der Prämisse, dass die Teilnahme an politischen Umfragen einen Spezialfall der politischen Partizipation darstellt. Allgemein formuliert wird damit angenommen: „Both forms of participation may be seen as participation in society“ (Brehm 1993: 70), für die ähnliche, aber nicht identische Mechanismen gelten.

4.5 Die Modellierung In diesem Kapitel wird nun auf der Grundlage der Theorie geplanten Verhaltens und den dazu kompatiblen Regeln der SEU-Theorie ein Modell zur Erklärung von Verweigerungen in politischen Umfragen entwickelt. Das bedeutet, es wird keine neue Theorie formuliert, sondern bestehende Erklärungsansätze auf die spezifische Fragestellung der Teilnahme an einer politischen Befragung angepasst, um anschließend Hypothesen zu Unterschieden zwischen den Merkmalen von Verweigerern und Kooperativen aufzustellen. Dazu werden zunächst Merkmale diskutiert, von denen ein Einfluss auf die Kooperationsentscheidung angenommen wird. Anschließend werden diese im Rahmen der genannten theoretischen Ansätze zu einem Gesamtmodell zusammengefügt. Die Grundannahme dabei ist, dass die Entscheidung zur Teilnahme an Befragungen auf der Individualebene fällt und ein komplexer Entscheidungsprozess ist, bei dem sowohl stärker situative Faktoren als auch stärker situationsunabhängige Merkmale zusammenwirken (vgl. Esser 1999; Schnauber/Daschmann 2008).

108

4 Die Teilnahme an politischen Umfragen

4.5.1 Determinanten von Verweigerungen in politischen Umfragen Die Kernfrage, warum Personen die Teilnahme an einer politischen Befragung verweigern, lässt sich in Anlehnung an einen Klassiker der politischen Partizipationsforschung mit: „Because they can’t, because they don’t want to, or because nobody asked“104 (Brady et al. 1995: 271) beantworten. Zur Erklärung der Teilnahme an Umfragen werden daher verschiedene Faktoren einbezogen: Die Zielperson muss zunächst teilnehmen können, d.h. über gewisse Ressourcen105 und Fähigkeiten verfügen. Zugleich muss sie sich dieser Ressourcen auch bewusst sein. Dabei geht es nicht um allgemeine Ressourcen, wie etwa Geld oder Besitz, sondern um die für die Situation einer persönlich-mündlichen Befragung zu politischen Themen relevanten Ressourcen, wie Zeit, Wissen oder Kommunikationsfähigkeit. Diese sind in der Theorie des geplanten Verhaltens als objektive und subjektiv wahrgenommene Kontrollmöglichkeiten integriert. Zwischen der objektiven und der subjektiven Kontrollmöglichkeit können deutliche Differenzen auftreten, d.h. die tatsächlichen Ressourcen müssen nicht immer mit dem Selbstbild übereinstimmen. Es reicht aber nicht aus, dass eine Zielperson an einer Befragung teilnehmen kann. Darüber hinaus muss sie auch an einer konkreten Umfrage teilnehmen wollen, d.h. eine positive Einstellung gegenüber der Handlungsausführung haben, wofür sie über positive Nutzenanreize motiviert werden kann (vgl. neben vielen anderen Esser 1986a). Bei der Bildung der Einstellung gegenüber den Handlungsalternativen „Kooperation oder Verweigerung bei einer politischen Umfrage“ können verschiedene Aspekte relevant sein: Einerseits stärker situative Faktoren, wie die Wahrnehmung und Bewertung der konkreten Umfrage bzw. des konkreten Interviewers, andererseits aber auch generellere Einstellungen, wie das interpersonale Vertrauen, die Umfrageeinstellung, die Einstellung gegenüber Beteiligungsnormen an sich sowie die Einstellungen einer Person gegenüber dem politischen System. Neben dem „Teilnehmen-Können“ und dem „Teilnehmen-Wollen“ bezieht sich das zuvor erwähnte Zitat von Brady et al. (1995) noch auf das „GefragtWerden“. Im Ursprungszitat, das sich auf die Erklärung von politischer Partizipati104

Neben den rein linearen Effekten kann man zudem annehmen, dass zwischen den Faktoren Wechselwirkungen existieren. Auch in der politischen Partizipationsforschung wurde bereits gezeigt, dass ein gewisses Maß an Ressourcen die Voraussetzung ist, um sich überhaupt an Netzwerken beteiligen zu können (vgl. Verba et al. 1995: 270, 343; Hansen 2009). Diese Interaktionseffekte werden jedoch zunächst bewusst vernachlässigt, um die Komplexität des Modells nicht zu groß werden zu lassen. 105 In der politischen Partizipationsforschung werden Ressourcen meist nur über sozialstrukturelle Merkmale wie Bildung, Schichteinstufung oder Einkommen erhoben (vgl. Uehlinger 1988: 170). Daher wird das Ressourcenmodell in der Literatur häufig auch als „socio-economic-status-model“ (Brady et al. 1995: 271) bezeichnet. Das Modell basiert auf der indirekten Annahme, dass Individuen mit einem höheren sozioökonomischen Status auch ein höheres Maß an Bürgerkompetenzen besitzen, die sich dann wiederum positiv auf die Partizipationsbereitschaft auswirken (vgl. Verba/Nie 1972: 126). Diese „civic skills“ (ebd.) erleichtern politische Partizipation ebenso wie die Teilnahme an einer Befragung zu politischen Themen (vgl. Brehm 1993: 50ff.; Goyder 1986, 1987). Auf dieser Grundlage wird z.B. häufig versucht, den „Mittelschichtbias“ – die Überrepräsentation mittlerer Schichten – bei Befragungen zu erklären (vgl. Esser 1986a; Hartmann/Schimpl-Neimanns 1992).

4.5 Die Modellierung

109

on bezieht, geht es dabei um die Rekrutierung von politisch Aktiven durch das eigene soziale Umfeld. Bei Meinungsumfragen auf der Grundlage von Zufallsstichproben ist das soziale Umfeld als Rekrutierungsweg nicht von Bedeutung. In der Situation einer persönlich-mündlichen Befragung wird die Zielperson zufällig ausgewählt und anschließend vom Interviewer direkt angesprochen, ob sie teilnehmen möchte. In einer weiter gefassten Interpretation des Zitats könnte man mit dem „Gefragt-Werden“ aber auf das Konstrukt der subjektiven Norm innerhalb der TpB rekurrieren. Dann bezieht es sich auf die Wertschätzung des sozialen Umfelds, die das Individuum antizipiert, wenn es vor der Entscheidung steht, an einer Umfrage teilzunehmen. Dafür wird ebenfalls ein Einfluss auf die Handlungsentscheidung angenommen. Die subjektive Norm wird aus der Abwägung normativer Erwartungen gebildet. Dabei kann man vermuten, dass sowohl die soziale als auch die politische Einbindung eines Individuums auf die Kooperationsintention eines Individuums einwirkt. Wenn Individuen in einem hohen Maße sozial und/oder politisch involviert sind, werden sie eher annehmen, dass eine Kooperation an einer Umfrage vom Umfeld positiv honoriert wird. In den folgenden Abschnitten sollen nun die einzelnen möglichen Determinanten eines Modells zur Erklärung der Teilnahme an politischen Umfragen diskutiert werden. Dabei wird auf die objektiven und subjektiven Kontrollmöglichkeiten (Kap. 4.5.1.1), die Einstellung gegenüber der Teilnahme (Kap. 4.5.1.2) und auf die subjektive Norm (Kap. 4.5.1.3) Bezug genommen und es werden die Merkmale herausgearbeitet, die deren Bildung beeinflussen. Der Fokus des Modells liegt dabei auf der Erklärung individuellen Handelns und damit ausschließlich auf der Individualebene. Gesellschaftliche Einflüsse oder Einflüsse des Forschungsdesigns auf der Makroebene (z.B. der Verstädterungsgrad eines Landes oder die soziale Kohärenz eines Gebiets), wie sie in den zuvor vorgestellten Modellen z.B. bei Groves/Couper (1998) diskutiert wurden, werden theoretisch zwar nicht ausgeschlossen, jedoch gleichzeitig auch nicht explizit empirisch analysiert. Die Fragestellung bezieht sich im Kern auf die Handlungsentscheidung des Individuums und es wird angenommen, dass die Einflüsse auf den anderen Ebenen im empirisch untersuchten gesellschaftlichen Umfeld entweder weitgehend konstant sind oder indirekt über die modellierten Einstellungen des Individuums, wie z.B. das soziale Vertrauen, wirken (vgl. Voogt 2004: 4; ähnlich auch Groves/Couper 1998).

4.5.1.1 Objektive und subjektive Kontrollmöglichkeiten als Determinanten der Teilnahmeentscheidung Damit sich eine Zielperson an einer Umfrage beteiligen kann, wird zunächst angenommen, dass sie über bestimmte objektive, partizipationsrelevante Ressourcen verfügen muss (vgl. u.a. Esser 1973: 245; siehe auch schon Gaudet/Wilson 1940:

110

4 Die Teilnahme an politischen Umfragen

775). Dabei lassen sich sowohl kognitive Fähigkeiten als auch soziale und zeitliche Ressourcen unterscheiden. Um eine Interviewanfrage verstehen und richtig einordnen sowie sie gegenüber anderen Anfragen abgrenzen zu können, braucht eine Zielperson zunächst ein gewisses Maß an kognitiven Fähigkeiten. Gleichzeitig fällt die Beantwortung von Fragen zu politischen und gesellschaftlichen Themen umso leichter, je höher die kognitive Ressourcenausstattung ist. Deren Einfluss auf die Kooperationsbereitschaft lässt sich damit gut innerhalb einer Kosten-Nutzen-Vorstellung modellieren: Wenn eine Zielperson eine Teilnahme in Betracht zieht, entstehen Informationskosten. Nachdem sie über ein Anschreiben oder den Interviewer von der Teilnahmebitte erfahren hat, muss sie sich über die Studie, den Sponsor oder auch das Thema informieren, um das Vorhaben einschätzen und bewerten zu können. Die Informationskosten sind bei einer anspruchsvollen politischen Befragung umso höher, je weniger kognitive Ressourcen die Zielperson besitzt. In diesem Bereich kann man zwischen langfristig und mittelfristig erworbenen Fähigkeiten differenzieren. Zu den langfristigen Ressourcen zählt z.B. das Bildungsniveau einer Person, das im Laufe der Bildungssozialisation erworben wird und anschließend weitgehend konstant bleibt. Ein gewisses Maß an Bildung ist nötig, um überhaupt der Situation einer Teilnahme gewachsen zu sein. Die langfristigen kognitiven Ressourcen sind aber gleichzeitig auch relevant für das Erkennen der kollektiven Nutzenanreize einer wissenschaftlichen Befragung: Bei Personen mit einem hohen Bildungsniveau kann man im Gegensatz zu niedrig Gebildeten annehmen, dass sie wissenschaftliche Umfragen als etwas Relevantes einschätzen (vgl. Cannell/Kahn 1968: 535; allgemein zum Einfluss von kognitiven Ressourcen auf Partizipation vgl. Dalton 2002: 56; Jones et al. 1979: 69). Das ist eine Voraussetzung dafür, dass die Zielperson solche kollektiven Anreize auch in die individuelle Kosten-Nutzen-Abwägung mit einbeziehen kann. Eher als mittelfristig106 zu bezeichnende kognitive Ressourcen sind themenspezifische Ressourcen. Dabei ist weniger zu fragen, ob eine Person überhaupt an einer Umfrage teilnehmen kann, sondern ob sich eine Person an einer bestimmten Befragung zum Thema Politik beteiligen kann. Für eine politische Umfrage bedeutet dies konkret, dass politische Informiertheit das Beantworten der Fragen vereinfacht. Dieses Argument gewinnt insbesondere vor dem Hintergrund des zuvor angesprochenen Einstellungsbegriffs an Bedeutung: Man kann annehmen, dass politisch informierte Zielpersonen zuvor schon häufiger mit den angesprochenen Themen konfrontiert wurden und daher auf eine größere Anzahl von Eindrücken und Überlegungen zu diesem Gebiet zurückgreifen können. Daher können Einstellungen einfacher, d.h. ohne großen Aufwand, gebildet und weitergegeben werden. Expertise auf einem Gebiet – in diesem Fall im Bereich der Politik – führt dazu, 106 Hierbei wird von mittelfristigen und nicht von kurzfristigen Ressourcen gesprochen, weil nicht angenommen wird, dass sie spontan erworben werden können, sondern auch hierbei ein „Lernprozess“ nötig ist, der jedoch, im Unterschied zu den langfristigen Ressourcen, nicht unbedingt während der Bildungssozialisation erworben wird.

4.5 Die Modellierung

111

dass bei diesen Personen viele, leicht aktivierbare Vorstellungsbündel zu Institutionen, Personen oder Themen vorliegen. Wenn man sich über Politik informiert, kennt man Politiker, aktuelle Fragestellungen und Probleme. Hat sich hingegen jemand bislang nicht mit dem Bereich beschäftigt, sind keine Assoziationen zu der angesprochenen Materie präsent. Dann ist es deutlich aufwändiger und schwieriger, eine Einstellung zu einem bestimmten unbekannten Objekt neu zu bilden und diese dem Interviewer mitzuteilen (vgl. Schoen 2006: 91; siehe auch Bassili/Krosnick 2000; Billiet et al. 2004; Bizer et al. 2004; Lavine et al. 2000). Die Anstrengung bei der Beantwortung von Fragen wird in der Literatur zu den zentralen Kostenfaktoren einer Befragung gezählt (vgl. Riphahn/Serfling 2005: 524). Man könnte annehmen, dass neben der politischen Informiertheit auch objektives politisches Wissen zu den kognitiven Ressourcen gehört, die in der Situation einer politischen Befragung benötigt werden. Da jedoch in Umfragen in der Regel kein Wissen, sondern Einstellungen abgefragt werden, wird nicht angenommen, dass objektives politisches Wissen eine Teilnahme an den üblichen sozialwissenschaftlichen Befragungsstudien tatsächlich erleichtert. Vielmehr wird angenommen, dass eine Zielperson subjektives politisches Wissen besitzen muss – doch darauf wird später im Bereich der wahrgenommenen Verhaltenskontrolle noch einmal eingegangen (zur Unterscheidung der verschiedenen Konzepte subjektiven und objektiven politischen Wissens vgl. Vetter/Maier 2005: 55). Neben den kognitiven Fähigkeiten vereinfachen auch soziale Kompetenzen („civic skills“) eine Interviewteilnahme. Zu den sozialen Kompetenzen gehören dabei sowohl die Organisationsfähigkeit als auch die Kommunikationsfähigkeit einer Zielperson. Gerade in persönlich-mündlichen Interviews erfordert die Befragungssituation ein hohes Maß dieser kommunikativen und organisatorischen Fähigkeiten (vgl. Brehm 1993: 50ff.; Brady et al. 1995; Goyder 1986; Verba et al. 1995): Man muss eine (meist) fremde Person in die eigene Wohnung lassen und mit dieser über politische und soziale Themen kommunizieren. Auch zuvor finden bereits kommunikative Interaktionsprozesse zwischen Interviewer und Zielperson statt, beispielsweise an der Haustür. Die benannten Ressourcen wird eine Zielperson in der Regel zuvor in anderen sozialen Interaktionssituationen, etwa in sozialen Netzwerken107, erworben haben. Aus diesem Grund wird angenommen, dass von dem Maß an sozialer Einbindung positive Effekte auf die Kooperationsbereitschaft ausgehen (vgl. bereits Esser 1973: 121; Groves/Couper 1998: 131ff.). Dies ist die zentrale Annahme der sozialen Integrations- bzw. Isolationsthese.108 107

Unter einem Netzwerk wird dabei eine soziale Struktur verstanden, die auf Dauer angelegt ist und in der mehr als zwei Akteure agieren. Gleichzeitig wird angenommen, dass es sich um informelle Gebilde handelt. Die eindeutige Abgrenzung von Organisationen und Gruppen ist jedoch meist schwierig (vgl. Frings 2008: 224f.; siehe Coleman 1990, 1991, der die Begriffe synonym verwendet). 108 In klassischen Modellen aus der politischen Partizipationsforschung, bspw. im „Civic Voluntarism Model“, wird die Aktivität eines Individuums in sozialen und politischen Netzwerken als unabhängige Determinante neben den Ressourcen eingeführt (vgl. Kwak et al. 2004; McClurg 2003; Schlozman 2002). Im Gegensatz dazu wird hier

112

4 Die Teilnahme an politischen Umfragen

Mit zunehmender sozialer Einbindung erwirbt das Individuum sowohl soziale als auch kognitive Ressourcen, weswegen sich die soziale Einbindung positiv auf die Kooperationsbereitschaft auswirken sollte: Zunächst kann man feststellen, dass mit zunehmender Aktivität innerhalb des politischen und gesellschaftlichen Systems relevante Ressourcen, wie etwa kommunikative Fähigkeiten bei gesellschaftlichen Aktivitäten, erlernt bzw. geübt und erweitert werden (vgl. McClurg 2003: 449; Olsen 1972: 318). Zugleich wird über die Aktivität sowohl das Interesse an Zusammenhängen als auch das Wissen über politische und soziale Vorgänge steigen, da über die Kommunikation in den Gruppen Informationen ausgetauscht und geteilt werden können. Aus der Aktivität in Netzwerken und dem Grad der sozialen Einbindung resultieren damit direkte und indirekte Effekte über die sozialen und kognitiven Ressourcen. Für Personen mit hoher sozialer Ressourcenausstattung kann man aber auch argumentieren, dass deren Opportunitätskosten sehr hoch sind (vgl. Mehlkop/Becker 2007: 9; van Deth 2001). Das Interview nimmt eine gewisse Zeit und Energie in Anspruch, die der Zielperson für andere Tätigkeiten verloren geht. Ein in zahlreichen Vereinen aktiver Mensch, der gleichzeitig eine Vielzahl an Freunden und Kollegen hat, verliert während der Interviewteilnahme wertvolle Zeit, die er stattdessen für die Pflege seines Netzwerks hätte nutzen können (vgl. Verba et al. 1995). Statt am Interview teilzunehmen, könnte er daher in der gleichen Zeit vielen anderen Tätigkeiten nachgehen, die er ebenso als Pflicht ansieht und (eventuell) sogar priorisiert (vgl. auch Hirschman 1979). Diese Annahme hoher Opportunitätskosten würde für eine Verringerung der Teilnahmebereitschaft und damit für einen negativen Zusammenhang zwischen hohen sozialen Ressourcen und der Kooperationsbereitschaft sprechen. Durch Designelemente, wie etwa eine flexible Termingestaltung und Mehrfachkontakte, kann den Zielpersonen allerdings die Möglichkeit gegeben werden, zu einem Zeitpunkt teilzunehmen, an dem keine anderen dringenden Tätigkeiten erledigt werden müssen. Das bedeutet, für die Opportunitätskosten wird angenommen, dass es sich in erster Linie um sehr situative Kosten handelt. Wenn eine Teilnahme zu einem bestimmten Zeitpunkt als „zu teuer“ bewertet wird, könnte ein anderer Zeitpunkt in Form eines Termins, an dem der Interviewer wiederkommt, vereinbart werden, der „günstiger“ ist. Bei der Teilnahme an Umfragen handelt es sich zudem auch nicht um ein längerfristiges Engagement, das erforderlich ist, sondern um ein meist einmaliges Ereignis, das zeitlich flexibel absolviert werden kann. Der negative Effekt der hohen Opportunitätskosten bei sozial eingebundenen Zielpersonen sollte daher bei flexiblen Forschungsdesigns empirisch kaum einen Einfluss besitzen. Daher wird zunächst ein jedoch nicht angenommen, dass es sich bei dem Einfluss der Netzwerke um eigenständige Effekte handelt. Vielmehr wird davon ausgegangen, dass der Einfluss von Netzwerken sowohl über die objektiven und subjektiven kognitiven und sozialen Ressourcen als auch über gesellschaftliche Einstellungen (siehe das nächste Kapitel 4.5.1.2) verläuft. Daher wird die Aktivität in Netzwerken nicht als weiterer autonomer Faktor eingeführt, sondern innerhalb der anderen Konzepte verortet.

4.5 Die Modellierung

113

positiver Effekt der zuvor genannten Ressourcen auf die Kooperationsbereitschaft vermutet. Um das Opportunitätskostenargument zu berücksichtigen, wird aber auch die Hypothese eines negativen Einflusses überprüft. Das gerade angeführte Argument der Opportunitätskosten zeigt, dass neben kognitiven und sozialen Kompetenzen auch der Faktor Zeit eine wichtige Voraussetzung für die Kooperationsbereitschaft ist. Um sich an einer umfangreichen sozialwissenschaftlichen Studie beteiligen zu können, muss die Zielperson ausreichend Zeitressourcen besitzen. Gerade für vielbeschäftigte Menschen ist Zeit ein wertvolles Gut. Man kann daher annehmen, dass die Belastung durch das Interview umso höher ist, je geringer die zeitliche Ressourcenausstattung eines Befragten ist. Wenn einer Zielperson dauerhaft nur wenig Zeit zur Verfügung steht, weil sie etwa ganztags berufstätig ist und eine große Familie hat, ist die zeitliche Belastung eines 30minütigen Interviews deutlich höher einzuschätzen als bei einer alleinstehenden, nichterwerbstätigen Zielperson. Damit ist die zeitliche Belastung durch ein Interview auch nicht unbedingt über den tatsächlichen Aufwand (etwa in Minuten) abzubilden, sondern in Relation zur zeitlichen Ressourcenausstattung zu sehen. Kurzfristigere situative Zeiteffekte können durch die bereits geschilderte flexible Termingestaltung in Verbindung mit langen Feldzeiten abgemildert werden. Dennoch wird für gewisse Merkmale, wie etwa die Berufstätigkeit, angenommen, dass sie dauerhaft die frei verfügbare Zeit einer Zielperson reduzieren und man kann aus diesem Grund einen negativen Effekt auf die Kooperationsbereitschaft vermuten. In das Modell werden damit nicht nur langfristige Ressourcen einbezogen, die im Sozialisationsprozess einmal erworben werden und anschließend stabil bleiben. Es können vielmehr auch mittel- und kurzfristigere Resourcen, die in der Situation der Interviewanfrage relevant sind, zur Erklärung herangezogen werden. Die zentrale Annahme lautet: „Eine Zielperson benötigt kognitive, soziale und zeitliche Ressourcen, um sich an einer politischen Befragung beteiligen zu können.“ Allerdings wird dabei nicht angenommen, dass es sich bei den Ressourcen um einen Einfluss handelt, bei dem es nur darauf ankommt, dass er vorhanden ist oder nicht. Vielmehr wird für den Einfluss ein ansteigender Verlauf angenommen und mit Wahrscheinlichkeiten argumentiert: „Je höher die Ausstattung einer Zielperson mit partizipationsrelevanten Ressourcen, desto wahrscheinlicher ist sie bereit, sich an einer politischen Befragung zu beteiligen.“ Das bedeutet für den Unterschied von Teilnehmern und Verweigerern einer politischen Befragung, dass Verweigerer ein niedrigeres Maß an kognitiven, sozialen und zeitlichen Ressourcen aufweisen sollten als kooperationsbereite Zielpersonen. Die Annahmen beziehen sich dabei auf ansonsten konstante Bedingungen. Ressourcen als Bestimmungsfaktoren sozialen Handelns können recht gut erklären, warum sich Gesellschaftsgruppen, die eine geringe Ressourcenausstattung aufweisen, nicht an Befragungen beteiligen. Ein auf Ressourcen basierendes Erklärungsmodell kann jedoch nicht unbedingt zeigen, warum sich das Verhalten einer Zielperson trotz gleichbleibender Ressourcenausstattung über die Zeit verändern

114

4 Die Teilnahme an politischen Umfragen

kann. Ebenfalls lässt sich damit nicht begründen, warum sich zwei Zielpersonen mit der gleichen Ressourcenausstattung, die aufgrund dieser Ressourcen an einer Befragung teilnehmen könnten, dennoch unterschiedlich verhalten: Die einen kooperieren, die anderen verweigern eine Beteiligung. Daher soll nun in Anlehnung an die zuvor ausgeführten Überlegungen zur Theorie des geplanten Verhaltens die wahrgenommene Kontrollmöglichkeit als weiterer Faktor in das Modell integriert werden, um die Entscheidung einer Zielperson, an einer politischen Umfrage teilzunehmen oder nicht, besser erklären zu können. Bei der subjektiv wahrgenommenen Verhaltenskontrolle geht es nicht darum, ob eine Zielperson an einem Interview teilnehmen kann, sondern ob sie sich dieser Fähigkeiten auch bewusst ist. Damit wird dem Gegenstand Rechnung getragen, dass es nicht ausreicht, dass eine gut gebildete, politisch informierte Zielperson theoretisch in der Lage ist, an einer Umfrage teilzunehmen. Wenn sie nur ein geringes Selbstbewusstsein aufweist und sich die Teilnahme nicht zutraut, wird sie diese trotzdem verweigern. Das Selbstbild einer Person trägt damit ebenso zu der Entscheidung bei, ob sie an einer Befragung teilnehmen will oder nicht. Die subjektive Einschätzung der eigenen Kompetenz beeinflusst die Bewertung einer Handlungsoption: Nur wenn man davon überzeugt ist, eine gestellte Anfrage zufriedenstellend erfüllen zu können, wird man an einer Befragung teilnehmen. Wenn man hingegen annimmt, den gestellten Anforderungen nicht gerecht zu werden, ist eine Verweigerung wahrscheinlicher, weil negative Konsequenzen bspw. in Form von Schamgefühl drohen (vgl. Brehm 1993: 63). Bei einer Befragung zu politischen Themen muss die Zielperson daher annehmen, die Fragen beantworten zu können, sich vor dem Interviewer nicht zu blamieren und nichts vermeintlich Falsches zu sagen. Aus diesem Grund kann nicht nur die tatsächliche politische Informiertheit, sondern auch die subjektive politische Kompetenz die Kooperationsbereitschaft bei politischen Befragungen beeinflussen. Dazu zählt beispielsweise, ob man sich selbst zutraut, über die Artikulation der eigenen politischen Einstellungen Einfluss nehmen zu können. An dieser Stelle ist erneut ein zentrales Konzept der politischen Einstellungsforschung zu erkennen, nämlich die interne politische Efficacy (vgl. Vetter 1997a, 1997b). Insgesamt gilt: „Je eher ein Individuum glaubt, die gestellte Anfrage erfüllen zu können, je größer also der Glaube an sich selbst und die eigene politische Kompetenz, desto eher wird es an der politischen Befragung teilnehmen.“

4.5.1.2 Einstellungen zur Handlung als Determinanten der Teilnahmeentscheidung Die objektive und subjektiv wahrgenommene Verhaltenskontrolle eines Individuums kann erklären, warum es für manche Zielpersonen mit geringeren und für andere mit höheren Kosten verbunden ist, sich an einer Umfrage zu beteiligen. Dies bedeutet jedoch noch nicht, dass sich diejenigen, für die es einfacher wäre teilzu-

4.5 Die Modellierung

115

nehmen, auch an einer bestimmten politischen Umfrage beteiligen möchten und der Kooperation positiv gegenüberstehen. Neben dem „Teilnehmen-Können“ muss daher auch das „Teilnehmen-Wollen“ in der Erklärung berücksichtigt werden. In theoretischen Modellen aus der politischen Partizipationsforschung werden dabei sowohl die politische Involvierung als auch die Unterstützung verschiedener Objekte des politischen Systems sowie gesellschaftliche Normen und Werte als relevante Determinanten der Beteiligungsbereitschaft diskutiert (vgl. Barnes et al. 1979; Farah et al. 1979; siehe auch Easton 1975).109 Wenn man diese Erkenntnisse nun auf die Erklärung des Teilnahmeverhaltens bei politischen Befragungen übertragen möchte, geht es zunächst darum, zu verstehen, um welche Form der Partizipation es sich bei der Teilnahme an Umfragen handelt. Wie zuvor in Kapitel 4.4 gezeigt, wird davon ausgegangen, dass es sich dabei im weiteren Sinne um „Reden über Politik“ handelt, was eine gesellschaftliche, eine politische und eine UmfrageKomponente impliziert. Das bedeutet, es sind nicht nur die Einstellungen eines Individuums gegenüber dem konkreten Thema der Umfrage, d.h. gegenüber dem politischen System, relevant. Die politische Involvierung ist nur eines von mehreren Bündeln potenziell relevanter Einstellungsobjekte. Daneben wird auch für Einstellungen gegenüber Umfragen im Allgemeinen (vgl. Schwartz 1964; Dran/Hildreth 1995) und Einstellungen gegenüber der Gesellschaft bzw. den Mitmenschen ein Einfluss auf die Absicht teilzunehmen oder zu verweigern angenommen.110 Hier zeigen sich die von Brehm (1993) bereits in seinem Vier-EbenenModell aufgeführten Einstellungen gegenüber Umfragen im Allgemeinen und der konkreten Umfrage im Speziellen sowie gegenüber dem Interviewer und Fremden. Die einzelnen Dimensionen wirken alle über das Konzept der „Einstellung gegenüber dem Verhalten“ in der Theorie geplanten Verhaltens und werden im Folgenden vorgestellt. Zunächst wird angenommen, dass eine Zielperson umso eher kooperieren wird, je involvierter sie in das Thema einer Umfrage ist (vgl. Stocké/Becker 2004: 95). Das bedeutet für politische Umfragen, dass sich das Politikinteresse – in der Literatur wird auch von steigender „political awareness“ (Zaller 1992) gesprochen 109

In der politischen Partizipationsforschung weisen verschiedene Autoren (vgl. etwa Verba et al. 1995: 272; Whiteley/Seyd 1996: 217) darauf hin, dass das „politische Handeln-Wollen“ hauptsächlich über die politischen Einstellungen eines Individuums erklärt werden kann (siehe etwa Ajzen/Fishbein 1980; Ajzen 1985; Brady et al. 1995; Verba et al. 1995; Zaller 1992; für die Bundesrepublik auch Gabriel/Völkl 2008). Zu den diskutierten relevanten Einstellungen, die die politische Partizipation beeinflussen, gehören sowohl das politische Interesse als auch die politische Informiertheit sowie die subjektive politische Kompetenz und die Bindung an Parteien. Verba et al. fassen diese unter den Begriff des „political engagement“ zusammen (vgl. Verba et al. 1995: 272), bei Gabriel/Völkl (2008: 290) wird dies als „social involvement“ bezeichnet. Dabei wird angenommen, dass mit steigendem „political engagement“ auch das Partizipationsniveau zunimmt. Andere Autoren beziehen den Medienkonsum, die subjektive Salienz des Themas oder auch Normen (wie etwa Beteiligung als Bürgerpflicht) als sozialpsychologische Determinanten mit in ihre Analysen ein (vgl. etwa van Deth 2004). 110 Diese Faktoren auf der Einstellungsebene sind in der Theorie geplanten Verhaltens keine direkten Determinanten, sondern indirekt als „externe Faktoren“ eingebettet, die auf die Evaluation der behavioralen Erwartungen und damit die Bildung einer Einstellung gegenüber einer Handlungsoption wirken. In der SEU-Modellierung wird nicht zwischen internen und externen Faktoren unterschieden.

116

4 Die Teilnahme an politischen Umfragen

– positiv auf die Kooperationsbereitschaft auswirken sollte (vgl. etwa Groves et al. 2004a; Voogt/Saris 2003; Voogt 2004). Menschen wenden sich gerne Themen zu, die sie als wichtig, spannend, interessant und abwechslungsreich empfinden. Dazu haben sie dann auch verschiedene vorliegende Assoziationen, die einfach abrufbar sind. Themen, die von Zielpersonen als unwichtig, uninteressant, langweilig oder sogar als unangenehm oder zu privat empfunden werden, versuchen sie hingegen zu vermeiden, da auf diese Weise emotionale Kosten entstehen können (vgl. Harris-Kojetin/Tucker 1999: 169; Jones et al. 1979: 69; Riphahn/Serfling 2002: 5; Stocké/Langfeldt 2003: 59; siehe auch das Konzept der Vermeidung kognitiver Dissonanz nach Festinger 1957). Zu den politischen Orientierungen der Zielpersonen, bei denen man – über den Weg der Herausbildung einer Einstellung gegenüber der Teilnahme – von einem Einfluss auf die Teilnahmebereitschaft ausgehen kann, gehören neben dem politischen Interesse diffuse und spezifische Einstellungen und Bewertungen der Demokratie, der politischen Institutionen und der Akteure (vgl. Fuchs 2002: 37; Norris 1999: 10; Westle 1989: 100).111 Es wird angenommen, dass eine Zielperson die Teilnahme an einer Studie zum Thema Politik umso eher erwägen wird, je positiver diese Einstellungen sind. Je negativer die Bewertungen, etwa nach einem politischen Skandal, ausfallen, desto eher wird eine Teilnahme verweigert (vgl. Couper et al. 1998; Harris-Kojetin/Tucker 1999: 169; Mathiowetz et al. 1991). Neben den politischen Einstellungen kann aber auch die allgemeine Umfrageeinstellung einen Einfluss auf die Kooperationsbereitschaft haben. Hierzu wird angenommen, dass die Erfahrung mit Umfragen die Kosten einer Teilnahme reduzieren kann (vgl. Brehm 1993: 159; Erbslöh/Koch 1988; Goyder 1986; Nederhof 1981: 111, 1986: 282; Porst 1998: 10; Stinchcombe et al. 1981; Stocké/Langfeldt 2003; aber auch Hox et al. 1996: 104112). Je häufiger man bereits an Befragungen teilgenommen hat – im Idealfall mit positiven Erfahrungen – und je eher man das Prinzip der Beantwortung von standardisierten Fragen oder der anonymen Auswertung erhobener Informationen verstanden hat, desto niedriger ist der Aufwand, den eine Teilnahme mit sich bringt. Man weiß in einem solchen Fall, was auf einen zukommt und kann die Folgen der Teilnahme besser abschätzen, d.h. die Informationskosten sind geringer. Ein weiterer, instrumenteller Einflussfaktor auf der Ebene der Umfrageeinstellung, der die Kooperationsbereitschaft erhöht, ist die wahrgenommene Wichtigkeit von Umfragen für die Gesellschaft (vgl. Bradburn 1978; Dran/Hildreth 1995; Erbslöh/Koch 1988: 42; Stocké/Langfeldt 2003: 59). Wenn man annimmt, Umfragen könnten nichts bewirken und seien überflüssig, nimmt man nicht daran teil (vgl. Brehm 1993). Dahinter verbirgt sich in Bezug auf die 111

Hierbei findet eine Anlehnung an das „support“-Konzept von Easton statt (vgl. Easton 1965b: 160). Hox et al. (1996: 104) zeigen in einer experimentellen Studie unter Studenten, dass die generelle Umfrageeinstellung keinen Effekt auf die Teilnahmeintention hat, die Einstellung gegenüber einer spezifischen Umfrage hingegen schon. Es könnte jedoch sein, dass es sich dabei um ein Artefakt der speziellen Population handelt, da Studenten insgesamt eine sehr positive Umfrageeinstellung aufweisen. 112

4.5 Die Modellierung

117

Kosten-Nutzen-Abwägung die Vorstellung, dass die Höhe der Opportunitätskosten mit dem Wert zusammenhängt, den eine Zielperson Umfragen beimisst. Je relevanter Umfragen eingeschätzt werden, desto weniger entsteht das Gefühl, dass man in der Zwischenzeit Wichtigeres erledigen könnte. Wenn man Umfragen als wertlos ansieht, ist hingegen jede andere Tätigkeit wichtiger. Um von einer Relevanz politischer Umfragen auszugehen, muss eine Zielperson glauben, dass die Politik auf Umfrageergebnisse reagiert. Dies setzt voraus, dass das politische System responsiv ist, d.h. dass die politischen Eliten auf das von den Bürgern Geäußerte reagieren. Wenn man daher annimmt, über die Teilnahme an einer politischen Umfrage etwas bewegen zu können, ist eine Teilnahme wahrscheinlicher (vgl. Bradburn 1978; Goyder 1986).113 Schließlich könnte man auch rein expressive Motive annehmen, dass diejenigen Zielpersonen, die Spaß daran haben, Fragen des Interviewers zu beantworten und mit ihm zu kommunizieren, dies auch gerne tun. Neben der Umfrageeinstellung und der Einstellung gegenüber dem politischen System können auch Einstellungen gegenüber Mitmenschen, wie z.B. das interpersonale Vertrauen, auf die Bewertung der Handlungsoptionen Kooperation oder Verweigerung wirken. Für diejenigen Menschen, die einer anderen – obgleich in der Regel fremden – Person generell zunächst positiv entgegentreten und ihm vertrauen, sind die Handlungskosten, die in einer solchen Situation durch Misstrauen oder Unsicherheit entstehen können, geringer. Misstrauische Menschen haben hingegen höhere Kosten, sollten sie sich für eine Teilnahme entscheiden. Aus diesem Grund wird angenommen, dass die Wahrscheinlichkeit einer Teilnahme mit zunehmendem interpersonalen Vertrauen steigt. Bei der Wirkung des interpersonalen Vertrauens geht es in der Situation der Interviewanfrage primär um die konkrete Einstellung gegenüber dem Interviewer. Dabei zeigt sich, wie bereits zuvor bei den subjektiven und objektiven Kontrollmöglichkeiten, der dahinterliegende Einfluss der Integrationsthese (vgl. Brehm 1993; Groves/Couper 1998: 131ff.; Voogt/Saris 2003). Ein hohes Maß gesellschaftlicher Integration, also die Einbindung in Netzwerke, kann eine positive Einstellung gegenüber anderen Menschen fördern (vgl. Groves/Couper 1998: 131ff.; Olsen 1972: 318). Die Annahmen der Austauschtheorie und die theoretischen Überlegungen der Sozialkapitalforschung (siehe Bourdieu 1983; Burt 2005; Coleman 1988, 1990, 1991; Lin 2001; Putnam 1993, 1995) sind sich dabei sehr ähnlich. Es wird angenommen, dass durch Netzwerke gegenseitiges Vertrauen generiert werden kann (vgl. Kwak et al. 2004: 644; McClurg 2003: 450; Schlozman 2002: 435). Dieses wirkt sich, wie erste empirische Studien zeigen, wiederum positiv auf die Beteiligungsbereitschaft in Gesellschaften aus (vgl. Couper et al. 1998; 113 Dahinter verbirgt sich nicht nur die konkrete Umfrageeinstellung, sondern auch das Konzept der externen politischen Efficacy (vgl. Vetter 1997a, 1997b). Dieses Konzept bezieht sich nicht explizit auf die Teilnahme an Umfragen, sondern allgemein auf das Gefühl einer Person, dass das politische System überhaupt responsiv auf die Aktivitäten der Bürger reagiert. Aus diesem Grund wird ein positiver Zusammenhang zwischen dem Gefühl der externen politischen Efficacy und der Kooperationsbereitschaft vermutet, wie nachfolgend bei der Operationalisierung noch detaillierter beschrieben wird (Kap. 6).

118

4 Die Teilnahme an politischen Umfragen

Eveland/Scheufele 2000; Knack 1992; Knack/Kropf 1998; Mathiowetz et al. 1991; Putnam 1995; Straits 1991; Wolfinger/Rosenstone 1980). Gesellschaftlich eingebundene Menschen haben häufiger die Möglichkeit, mit Fremden zu interagieren. Diejenigen, die aktiv sind und dies auch über einen längeren Zeitraum bleiben, haben wahrscheinlich nur wenige negative und viele positive Erfahrungen, da sie ihre Kontakte im Fall vieler negativer Erfahrungen vermutlich abgebrochen hätten. Daraus resultiert, dass die Eingebundenen auf ein größeres Reservoir positiver Erfahrungen zurückgreifen können. Diese positiven Erfahrungen generieren Vertrauen in andere Menschen und können darum Transaktionskosten, die durch Misstrauen entstehen, reduzieren (vgl. Brehm/Rahn 1997; Putnam 1993; Putnam 1995: 49ff.; van Deth et al. 1999). So lässt sich, analog zu den Annahmen der sozialen Austauschtheorie, bei den „aktiven Netzwerkern“ ein hohes Maß an Vertrauen in Mitmenschen sowie gemeinsame Normen und Werte annehmen (vgl. Blau 1964; Homanns 1961; aber auch Groves/Couper 1998; Dillman et al. 2002). Netzwerke können dabei sowohl aufgrund einer Mitgliedschaft in formellen Organisationenals auch durch informelle soziale Kontakte entstehen. Die Integrationsthese impliziert aber noch ein anderes Argument: Mit zunehmender Integration nimmt die Bewertung der Relevanz der gesellschaftlichen Entwicklung zu, da sich die integrierte Zielperson selbst als Teil davon ansieht. Daher wird sie sich eher aktiv am gesellschaftlichen Diskurs beteiligen als eine pessimistische, entfremdete Zielperson. Die Teilnahme an Umfragen ist eine solche Möglichkeit, am gesellschaftlichen Diskurs teilzunehmen. Für Menschen mit einem starken Zugehörigkeitsgefühl zur Gesellschaft ist die Teilnahme daher auch mit einem kollektiven Anreiz verbunden, da die Ergebnisse der Umfragen wiederum allen Mitgliedern der Gesellschaft zur Verfügung stehen. Zeichnet sich eine Zielperson hingegen durch ein hohes Maß an gesellschaftlicher Entfremdung aus, hat sie ein allgemeines Gefühl der Verunsicherung und Orientierungslosigkeit, der sozialen Desintegration und Machtlosigkeit. Dann ist eine Teilnahme am gesellschaftlichen Diskurs, und damit auch an Umfragen, unwahrscheinlicher (vgl. Goyder 1987; Groves/Couper 1998: 170f.; zum Konzept der Entfremdung bzw. „Anomia“ siehe Srole 1956114). In dieser Argumentation spielen auch internalisierte Werte und Normen eine Rolle, für die ebenfalls angenommen wird, dass sie die Kooperationsbereitschaft beeinflussen. Wenn eine Zielperson der Beteiligung an sich einen hohen Wert zuschreibt und Beteiligungsnormen internalisiert hat, ist davon auszugehen, dass sie wahrscheinlicher an einer Befragung teilnimmt als eine Person, die der gesellschaftlichen Beteiligung weniger Wert beimisst (vgl. eine ähnliche Argumentation 114 Hierbei wird nicht auf das von Durkheim (1977) oder auch Merton (1995) eingeführte Phänomen sozialer Desintegration auf der Makroebene Bezug genommen, sondern auf das von Srole (1956) eingeführte sozialpsychologische Phänomen der individuellen Empfindung fehlender gesellschaftlicher Integration. Daher ist es an der Schnittstelle zwischen Selbstbild und Einstellungen gegenüber der Gesellschaft angesiedelt (vgl. dazu auch McClosky/Schaar 1965; Srole 1965).

4.5 Die Modellierung

119

für die Erklärung politischer Beteiligung bei Gabriel/Völkl 2008; Lüdemann 2001: 53; Opp 1990). Die Einbindung in die Gesellschaft, die mit dem Teilen von Normen einhergeht, führt demnach dazu, dass ein Individuum eher kooperiert, um die geteilten Normen und Werte weiter zu stützen (vgl. van Deth 2004: 295ff.). Dies gilt eben, wie zuvor ausgeführt, umso mehr, wenn die Zielperson den kollektiven Nutzen annimmt und glaubt, dass die erörterten Fragen und die daraus resultierenden Erkenntnisse der Gesamtgesellschaft nutzen können (vgl. Dillman 1978; Gallup 1940; Goyder 1987; Groves et al. 2000: 302f.; siehe auch Esser 1973: 94; Porst/von Briel 1995: 10; Schleifer 1986: 24). In diesem Fall könnte man die Motive auch als „altruistische“ Anreize bezeichnen, die dazu führen, dass eine Zielperson kooperiert (vgl. Daschmann/Schnauber 2008: 100). Gleichzeitig lässt sich im Sinne sozialpsychologischer Compliance-Ansätze argumentieren, dass man bei geteilten gesellschaftlichen Normen und Werten den Mitmenschen insgesamt positiver gegenübersteht und einer Bitte – etwa der Bitte teilzunehmen – eher nachkommt (vgl. Cialdini et al. 1975; Dillman et al. 1976; Dillman 2000: 14; Groves et al. 1992: 480; Groves/Couper 1998: 131; Regan 1971).115 Das bedeutet, eine Person muss sich aktiv an der Gesellschaft beteiligen wollen und eine positive Einstellung gegenüber der Teilnahme an einer Befragung entwickeln. Im Verhältnis zwischen der Zielperson und dem gesellschaftlichen Umfeld kommt ein weiterer Aspekt hinzu, von dem ein Einfluss auf die Handlungsentscheidung angenommen wird, auf den im nächsten Abschnitt eingegangen wird: die subjektive Norm.

4.5.1.3 Normative Orientierungen als Determinanten der Teilnahmeentscheidung Personen, die Beteiligungsnormen internalisiert haben, werden die Teilnahme an einer Befragung eher als soziale Pflicht und als sozial erwünscht wahrnehmen. Einer derartigen Pflicht kommt man nach, um einen Dienst an der Gesellschaft zu verrichten (=kollektiver Nutzen) und um daraus für sich selbst ein positives Gefühl zu ziehen (=individueller Nutzen). Eine Nicht-Teilnahme wäre in diesem Fall mit psychischem Druck verbunden, weil man mit negativen Sanktionen des Umfelds, wie z.B. Missbilligung oder Abwendung rechnet (vgl. Opp/Finkel 2001: 76). Wenn sich jemand also diesen Normen und Werten verpflichtet fühlt, wird er eher an einer Umfrage teilnehmen als eine Person, die diese nicht internalisiert hat (vgl. Sniderman 1975: 254ff.). An dieser Stelle wird erneut die Verknüpfung zur sozialen Integrationsthese deutlich: Je integrierter eine Person in die Gesellschaft ist, desto eher teilt sie soziale Normen und Werte und nimmt an, dass dies in ihrem 115

Dafür sprechen beispielsweise auch empirische Aggregatbefunde zum Zusammenhang zwischen sozialer Ähnlichkeit und sozialer Verantwortung und der Kooperationsbereitschaft. Je höher der soziale Zusammenhalt in einem Gebiet, desto höher sind die Kooperationsraten in einer Region (vgl. Groves/Couper 1998: 31, 170f.; Goyder 1987).

120

4 Die Teilnahme an politischen Umfragen

Umfeld ebenso gilt. Je integrierter sie ist, desto wichtiger ist ihr auch das soziale Umfeld und dessen Reaktionen, und desto eher wird sie auch an einer Befragung teilnehmen. Die aktive Beteiligung für die Gesellschaft stützt in diesem Fall den Erhalt der gemeinsam wahrgenommenen Normen und Werte. Gleichzeitig kann man annehmen, dass aktive Menschen in Netzwerken mit anderen aktiven Menschen zusammentreffen. Dadurch erwarten sie, dass Aktivität im eigenen Umfeld positiv bewertet wird. Das Gefühl der Bürgerpflicht, etwas für die Gesellschaft tun zu sollen, ist daher bei sozial integrierten, aktiven Menschen ausgeprägter und der Integrationsgrad einer Zielperson kann als Indikator zur Messung des Konzepts des verinnerlichten Pflichtbewusstseins herangezogen werden (vgl. das Konzept der „Civic Duty“ bei Groves et al. 2000: 302, mehr zur Operationalisierung der zentralen Konzepte in Kap. 6). Auch die Einschätzung der eigenen politischen Positionen in Relation zur wahrgenommenen Position der Gesamtgesellschaft kann die Teilnahmebereitschaft beeinflussen. Was ist darunter zu verstehen? Bei Umfragen zu politischen Einstellungen gibt es bei den meisten Fragen kein objektives „richtig“ oder „falsch“. Die Kooperationsbereitschaft der Zielperson kann jedoch auch davon beeinflusst werden, ob sie annimmt, die „sozial erwünschten“ Antworten auf die gestellten Fragen zu geben. Eine Zielperson, die die eigene Position als Minderheit einschätzt, wird sich nicht in eine Situation begeben wollen, in der sie unerwünschte Antworten gibt. Man möchte dem Interviewer gegenüber nicht negativ auffallen, so dass man nur teilnimmt, wenn man selbst glaubt, die normativen Erwartungen auch erfüllen zu können. Bei sozial unerwünschten Antworten steigen die emotionalen Kosten, die man auch als „normative Kosten“ bezeichnen kann: Gerade Personen, die sich selbst als vom gesellschaftlichen und politischen System isoliert, als entfremdet oder auch in den eigenen Einstellungen als extrem wahrnehmen, könnten daher annehmen, dass ihre Antworten unpassend sind. Um diese Situation zu umgehen, so könnte man annehmen, verweigern sie eine Teilnahme.116 Sozialpsychologisch ist dies mit dem Phänomen der Isolationsfurcht zu erklären (vgl. Noelle-Neumann 2001: 59ff.): Wenn man eine Position vertritt, die von der empfundenen Mehrheitsmeinung abweicht, äußert man diese nicht, um nicht in soziale Isolation zu geraten. Für die Teilnahme an der Befragung resultiert daraus die Annahme, dass Menschen mit extremen Minderheitspositionen eher die Teilnahme an politischen Umfragen verweigern als diejenigen, die sich in ihrer Position als gemäßigt ansehen.

116

Zum Konzept der sozialen Erwünschtheit siehe auch Paulhus (1984) und Winkler et al. (2006).

4.5 Die Modellierung

121

4.5.2 Kooperation und Verweigerung bei politischen Umfragen Aus den obigen Annahmen ergibt sich ein Modell zur Erklärung von Verweigerung und Kooperation (siehe Abb. 9). Die Entscheidung zur Teilnahme („Kooperiere ich oder nicht“) wird dabei als „rationales Handeln“ der Zielperson angesehen, es erfolgt also eine subjektive Bewertung der Handlungsalternativen. Die Theorie geplanten Verhaltens führt die Handlungsentscheidung auf drei zentrale Konzepte zurück, die einen Einfluss auf die Herausbildung der Handlungsintention einer Zielperson haben: Erstens die Evaluation von positiven und negativen Konsequenzen und damit die Bewertung der Handlungsalternativen, zweitens die subjektive Norm und damit verbunden die antizipierten positiven und negativen Sanktionen sowie drittens die Frage, ob das Individuum glaubt, die Handlung in einer bestimmten Situation auch ausführen zu können (vgl. Ajzen 1991: 181; Ajzen/Fishbein 1980, 2000). Hinzu kommt der Aspekt der objektiven Kontrollmöglichkeit, d.h. der Frage, ob das Individuum die Handlung auch tatsächlich ausführen kann. Eine Zielperson wird die Ausführung einer Handlung – in diesem Fall die Teilnahme an einer politischen Befragung – genau dann beabsichtigen, wenn sie die Teilnahme positiver bewertet als eine Verweigerung. In den letzten Abschnitten wurden nun die Merkmale herausgearbeitet, von denen ein Einfluss auf diese Abwägung angenommen wird. Diese sind in der Theorie des geplanten Verhaltens nicht als direkte Determinanten, sondern indirekt als „externe Faktoren“ eingebettet, die auf die Evaluation der behavioralen Erwartungen und damit die Bildung einer Einstellung gegenüber einer Handlungsoption wirken. In der vorliegenden Arbeit wird jedoch nicht zwischen internen und externen Faktoren unterschieden. Analog zu den Annahmen der subjektiven Wert-Erwartungstheorie wird allgemeiner argumentiert. Im Fokus des Interesses steht im Folgenden nicht der konkrete Weg der Handlungsentscheidung, sondern die Verknüpfung der Merkmale auf der Einstellungsebene mit der Handlungsentscheidung. Die Handlungsentscheidung wird situationsspezifisch modelliert (vgl. auch Ajzen/Fishbein 2000: 13) und angenommen, dass sowohl generalisierte als auch spezifische Einstellungen die Abwägung beeinflussen können. Welche Einstellungen stärker zum Tragen kommen, hängt von dem Entscheidungsmodus ab, in dem sich die Zielperson befindet. Die Bildung einer Einstellung gegenüber der Teilnahme kann entweder eher automatisch-spontan ablaufen, indem bedeutsame Einstellungen zu Objekten, die mit der Befragung zusammen hängen, hervortreten und bestimmte automatisch ablaufende Skripte aktiviert werden. Oder die Bildung der Einstellung und die darauf folgende Entscheidung, teilzunehmen oder die Teilnahme zu verweigern laufen stärker auf der Grundlage überlegter Bewertungen ab. Dabei handelt es sich nicht um zwei sich ausschließende Entscheidungstypen, sondern eher um ein Kontinuum, in dem sich die tatsächliche Entscheidung bewegt. Aus theoretischer Sicht bleibt zunächst unklar, wie die Gewichtung der einzelnen Anreizstrukturen ist, d.h. welche Motive über welchen

122

4 Die Teilnahme an politischen Umfragen

Modus letztlich zur Entscheidung des Individuums führen. Dieser Aspekt ist jedoch auch für die Beantwortung der Fragestellung von untergeordnetem Interesse. Vielmehr wird auf der Grundlage von probabilistischen Aussagen argumentiert, dass bestimmte Eigenschaften einer Zielperson die Wahrscheinlichkeit, die Teilnahme zu verweigern, steigern oder beeinträchtigen können (vgl. Ajzen/Fishbein 1980; siehe eine ähnliche theoretische Argumentation, obgleich zu einem anderen Erklärungsgegenstand bei Arzheimer 2008: 58). Insgesamt ist das Modell damit ein Instrument, das geeignet ist, um Unterschiede zwischen Kooperativen und Verweigerern im Sinne des Survey Variable Cause-Modells zu erklären. Aus diesem Grund ist die Frage, wann genau eine Entscheidung stärker reflektiert oder stärker automatisch-spontan abläuft, von nachrangigem Interesse. Im Fokus steht vielmehr die Frage, bei welchen Variablen ein Zusammenhang mit der Wahrscheinlichkeit, eine Teilnahme zu verweigern oder zu kooperieren, angenommen werden kann. Die Beziehungen innerhalb des Modells, d.h. der Kausalzusammenhang zwischen den zentralen Konzepten, der in der Theorie geplanten Verhaltens postuliert ist, wird nicht überprüft, sondern unterstellt. Das Ajzen-Fishbein-Modell ist in den einzelnen Schritten (Erwartungen–Einstellungen–Handlungsintention–Handlung) schon deshalb nicht überprüfbar, da die Handlungsintention und die zentralen vorgelagerten Konstrukte nicht direkt und nur ein Teil der relevanten Orientierungen überhaupt erhoben wurden. Aus diesem Grund sind die inneren Elemente in der Darstellung des Modells auch grau eingefärbt (siehe Abb. 9). Der theoretische Hintergrund und das Erklärungsmodell sollen aber auch nicht in allen Einzelschritten überprüft werden. Sie werden vielmehr zur Beantwortung der zentralen Fragestellung zu den Unterschieden zwischen Respondenten und Nonrespondenten herangezogen. Damit werden mögliche Determinanten der Handlungsentscheidung herausgearbeitet und strukturiert und daraus Erwartungen abgeleitet: So kann analysiert werden, bei welchen Merkmalen im Sinne des Survey Variable Cause-Modells unterschiedliche Verteilungen bei Teilnehmern und Nicht-Teilnehmern und damit Verzerrungen zu erwarten sind. Die Ebene der Orientierungen und Erwartungen, die den Einstellungen jeweils noch einmal vorgeschaltet ist, wurde nicht visualisiert, um die Abbildung möglichst einfach zu halten. Für die Beziehungen zwischen den einzelnen Konstrukten gilt, dass diese zwar theoretisch plausibel sind, jedoch aus den folgenden statistischen Berechnungen keine Aussagen über tatsächliche Kausalität abgeleitet werden können (vgl. zur Problematik des Nachweises von Kausalität Schnell et al. 2008: 463; für einen Überblick über Kausalanalysen mit nicht-experimentellen Daten siehe King et al. 1994; Winship/Morgan 1999; vgl. zu Kausalschlüssen auch Berk 2004: 223ff.). Unter dem Begriff der „Erklärung“ werden daher keine Kausalerklärungen im strengen Sinne, sondern eher „formalisierte Plausibilitätsüberlegungen“ (Arzheimer 2008: 131) verstanden.117 117

Schließlich muss auch berücksichtigt werden, dass die Indikatoren im Datensatz nicht eindeutig sind. Sie können nicht unbedingt die „wahren“ Konzepte allumfassend messbar machen, sondern stellen lediglich Annähe-

4.5 Die Modellierung Abbildung 9:

123

Das Erklärungsmodell auf der Ebene des Individuums

Pol. Interesse Vertrauen in Institutionen

Einstellungen ggü. Politik

Zufriedenheit mit dem politischen System Externe Efficacy Erfahrung mit Umfragen

Einstellungen gegenüber Umfragen

Einst. ggü. der Teilnahme an einer politischen Umfrage

Interesse an Umfragen / Spaß Beteiligungsnormen Geteilte Normen und Werte

Einstellung. ggü. der Gesell-

subjektive Norm

Selbstbild

wahrgen. Verhaltenskontrolle

Handlungsentscheidung: Kooperation / Verweigerung

Intention

Interpersonales Vertrauen Anomie Extreme pol.

tatsächliche Kontrolle: Ressourcen

Interne Efficacy Pol. Wissen

Kognitive Ressourcen

Soziale Ressourcen

Bildung

Kommunikation

pol. Informiertheit

Organisation

ZeitRessourcen

Erwerbstätigkeit

Quelle: Eigene Darstellung.

rungen dar, die die relevanten Erwartungen abbilden sollen. Sie haben grundsätzlich mit der MessfehlerProblematik zu kämpfen. Viele der Indikatoren sind zudem rein nach theoretischen Gesichtspunkten ausgewählt (vgl. Kap. 5). Hinzu kommt, dass – wie bereits angedeutet – die Analysen auf Grundlage der Querschnittsdaten nicht experimenteller Natur sind und damit sowieso keine Aussagen über Kausalitäten erlauben.

124

4 Die Teilnahme an politischen Umfragen

4.6 Zusammenfassung und Integration des Common Cause-Modells 4.6.1 Zusammenfassung Ziel dieser Arbeit ist es, zu untersuchen, ob sich diejenigen Personen, die nicht an Studien mit politikwissenschaftlichen Fragestellungen teilnehmen, von den Teilnehmern unterscheiden. Der Fokus liegt dabei auf der Gruppe der Teilnahmeverweigerer, bei denen eine aktive Handlungsentscheidung vorausgesetzt wird. Diese sollen mit der Gruppe der Teilnehmer verglichen werden. Bereits in der Einleitung der Arbeit wurde darauf hingewiesen, dass Unterschiede zwischen den Teilnehmern und den Nicht-Teilnehmern prinzipiell aufgrund zweier verschiedener Konstellationen entstehen können (siehe Kap. 1, Abb. 2): Entweder entstehen Unterschiede, weil bestimmte Merkmale direkt die Teilnahmebereitschaft beeinflussen („Survey Variable Cause-Modell“) oder weil gemeinsame Determinanten der Merkmale und der Entscheidung zu Kooperation und Verweigerung existieren („Common Cause-Modell“). Um entscheiden zu können, bei welchen Merkmalen Verzerrungen zu erwarten sind und ob diese auf das erste oder das zweite Modell zurückzuführen sind, ist zunächst ein theoretisches Verständnis des Ausfallprozesses notwendig. Man muss zunächst den Prozess der Teilnahmeentscheidung an sich verstehen, um anschließend mögliche Scheinkorrelationen aufzudecken. Um ein anschlussfähiges Modell zu den Ausfallgründen aufzustellen, wurde dazu im dritten Kapitel zunächst der Forschungsstand berichtet. Verschiedene Modelle zur Erklärung von Teilnahmeverhalten wurden mit ihren jeweiligen Stärken und Schwächen aufgezeigt. Aus der Perspektive des methodologischen Individualismus wurde nun im vierten Kapitel ein handlungstheoretisches Modell formuliert, das die Entscheidung zu Kooperation oder Verweigerung als subjektive, in ein soziales Umfeld eingebettete Kosten-Nutzen-Abwägung des Individuums ansieht. Damit wird von einem weiten Verständnis von Rational Choice ausgegangen, das nicht das Menschenbild eines homo oeconomicus, sondern das eines RREEMM mit begrenzter Rationalität zugrundelegt. Dieses weite Verständnis von Rational Choice erlaubt zunächst einen weiten Nutzenbegriff. Sowohl materielle als auch psychologische Anreize, die sich aus verschiedenen Erwartungsstrukturen bilden können, gehen in die Entscheidung zu Kooperation oder Verweigerung ein. Eine weitere Zusatzannahme betrifft den Modus der Handlungsentscheidung. Das Individuum besitzt demnach verschiedene Entscheidungsmodi, die stärker rationalreflektiert bzw. stärker automatisch-heuristisch ablaufen. Im ersten Fall wirken eher spezifischere Überlegungen zur Bewertung der Handlungsalternativen, die sowohl materieller als auch nicht-materieller Natur sein können. Die Handlung erfolgt spontan und weniger reflektiert, wenn stärker generalisierte Einstellungen wirken. Welcher Modus gewählt wird, hängt von der Situation ab. Für die Situation, dass eine Zielperson gebeten wird, an einer persönlich-mündlichen Befragung mit einem hohen Incentive teilzunehmen, wird angenommen, dass die Entschei-

4.6 Zusammenfassung und Integration des Common Cause-Modells

125

dung in der Regel stärker reflektiert verläuft. Da jedoch von einem Entscheidungskontinuum ausgegangen wird, können sowohl generalisierte Orientierungen als auch situationsspezifische Erwartungen wirken.

4.6.2 Das Common Cause-Modell Mit der Formulierung des Modells zur Erklärung von Kooperation und Verweigerung sind die Variablen angegeben, bei denen aufgrund des „Survey Variable Cause-Modells“ Unterschiede zwischen Respondenten und Nonrespondenten erwartet werden, die auf direkte Effekte zurückzuführen sind (siehe Merkmale X1 in Abb. 10). Bei Merkmalen, die direkt auf die Handlungsentscheidung des Individuums (TN) wirken, ist anzunehmen, dass sie bei Kooperativen und Verweigerern in unterschiedlichem Ausmaß auftreten. Abbildung 10: Das Common Cause-Modell X1

X2

TN

Quelle: Eigene Darstellung nach Groves/Peytcheva (2008: 168).

Das im vorigen Abschnitt aufgestellte Modell zur Erklärung von Kooperation und Verweigerung bei politischen Umfragen weist in seiner Grundstruktur deutliche Parallelen zu klassischen Erklärungsmodellen der politischen Partizipationsforschung auf. Dort werden ebenfalls Effekte der individuellen Ressourcenausstattung, der politischen Einstellungen sowie der Integration in Netzwerke und den damit verbundenen Konsequenzen auf die politische Partizipation diskutiert (vgl. etwa Barnes et al. 1979; Dalton 2002; Parry et al. 1992; Verba et al. 1995: 269; Verba/Nie 1972). Diese Merkmale, wie bspw. das politische Interesse, die Entfremdung oder das Institutionenvertrauen, sind demnach nicht nur als Variablen im Modell zur Erklärung von Kooperationsverhalten bei politischen Umfragen enthalten, sondern auch dazu geeignet, verschiedene Formen politischer Partizipation zu erklären. Die Ausstattung mit objektiven und subjektiv wahrgenommenen Ressourcen sowie die politischen, sozialen und umfragespezifischen Einstellungen würden daher im Sinne des „Survey Variable Cause-Modells“ direkt verzerrt geschätzt (siehe X1, Abb. 10). Unterschiede zwischen Kooperativen und Verweigerern bei Variablen der politischen Partizipation (siehe X2, Abb. 10) sind jedoch nach dem „Common Cause-Modell“ ebenso zu erwarten, da die gleichen erklärenden Varriablen auf beide Konzepte wirken.

126

4 Die Teilnahme an politischen Umfragen

Abbildung 11 visualisiert die Integration der politischen Partizipation in das zuvor aufgestellte Erklärungsmodell. Dabei sieht man zunächst im unteren Bereich der Abbildung das bereits im vorigen Kapitel aufgestellte Modell zur Erklärung von Kooperation und Verweigerung bei Umfragen. Drei der vier Gruppen von Einstellungen, nämlich das Selbstbild, die Einstellungen gegenüber der Gesellschaft und die politischen Einstellungen sind aber nicht nur für die Teilnahmeentscheidung an Umfragen von Bedeutung. Von ihnen wird gleichzeitig angenommen, dass sie relevante Determinanten der politischen Partizipation sind. Dies ist im oberen Teil der Abbildung dargestellt und wird durch die gestrichelten Linien angedeutet. Abbildung 11: Die Integration des Common Cause-Modells Einstellung ggü. pol. Partizipation

subjektive Norm

Intention

wahrg. Verhaltenskontrolle Einstellungeng gü. Politik

ZeitRessourcen objektive Kontrolle: Ressourcen

Einstellungen gegenüber Umfragen

Einst. ggü. der Teilnahme an einer politischen Umfrage

Einstellung ggü. der Gesellschaft

subjektive Norm

politische Partizipation

soziale Ressourcen kognitive Ressourcen

Intention

Kooperation / Verweigerung pol. Umfrage

= Erklärungsmodell pol. Partizipation Selbstbild

Quelle: Eigene Darstellung.

wahrg. Verhaltens-kontrolle

= Erklärungsmodell Teilnahme an pol. Befragung

4.6 Zusammenfassung und Integration des Common Cause-Modells

127

Nach den Grundannahmen der Theorie geplanten Verhaltens wird auch für die politische Partizipation angenommen, dass der tatsächlichen Handlung die Intention zu partizipieren vorgeschaltet ist. Diese wird wiederum durch die Einstellung gegenüber dem konkreten Partizipationsverhalten, durch die subjektive Norm und die wahrgenommene Verhaltenskontrolle beeinflusst. Gleichzeitig beeinflusst auch die objektive Ressourcenausstattung die aktive Teilnahme im politischen System. Nun zeigt sich, dass manche der im Modell vorliegenden generalisierten und spezifischen Einstellungen, wie z.B. das Politikinteresse, die Zufriedenheit mit dem politischen System, das interpersonale Vertrauen oder auch die interne und externe Efficacy (nur um exemplarisch einzelne Beispiele zu nennen), nicht nur auf die Umfrageteilnahme, sondern auch auf die politische Partizipation wirken. Daher werden, im Sinne der Annahme gemeinsamer Hintergrundvariablen, auch in diesem Bereich Verzerrungen durch Nonresponse angenommen. Um die Aussage zu den potenziellen Verzerrungen im Bereich der politischen Partizipation zu differenzieren, werden nun die relevantesten Dimensionen politischer Beteiligung herausgearbeitet und einer genaueren Betrachtung in Bezug auf die genannten Merkmale unterzogen. Dabei erhebt die Untersuchung nicht den Anspruch, alle möglichen Formen politischer Partizipation zu diskutieren. Vielmehr werden zunächst auf der Grundlage theoretischer Überlegungen und empirischer Daten verschiedene Partizipationstypen ermittelt und im Anschluss daran die Erwartungen zu potenziellen Verzerrungen dieser Merkmale formuliert. Zunächst wird zwischen dem Wahlverhalten und anderen Formen politischer Beteiligung unterschieden. Beim Wahlverhalten handelt es sich um die am stärksten etablierte Form politischer Partizipation. Dies gilt nicht nur, aber auch, für die Bundesrepublik Deutschland und schlägt sich hier in den hohen Wahlbeteiligungsraten nieder: Für viele Bürger ist Wählen die einzige Form politischer Beteiligung, derer sie sich bedienen (vgl. Caballero 2005: 327; Wolfinger/Rosenstone 1980: 1). Wahlen finden nur zu bestimmten Zeitpunkten statt und sind in ihrer Bedeutung, sowohl medial als auch demokratietheoretisch, hervorgehoben sowie in hohem Maße institutionalisiert (vgl. Aldrich 1993: 246; Verba/Nie 1972: 44ff.; Schmitt 2005: 11ff.). Bei der Entscheidung eines Bürgers, zur Wahl zu gehen oder nicht, können prinzipiell ähnliche Determinanten wirken wie bei der Entscheidung zur Umfrageteilnahme (vgl. Bolstein 1991; Brehm 1993: 138; Caballero 2005: 334; Clausen 1968; Granberg/Holmberg 1991: 450; Kleinhenz 1995: 75). Dies gilt insbesondere für die Wirkung politischer Einstellungen, wie z.B. dem politischen Interesse und der Systemunterstützung. Zudem wirkt aber auch die Wahrnehmung des sozialen Umfelds, in Form der Wahlnorm, auf die Wahlbeteiligung. Je stärker ein Individuum glaubt, das soziale Umfeld erwarte eine Teilnahme, desto eher wird es teilnehmen. Diese normative Erwartung hat sich empirisch als erklärungsstärkste Determinante der Wahlbeteiligung erwiesen (vgl. Caballero 2005: 345; Rattinger/Krämer 1995: 279). Die Wahlnorm kann zugleich aber auch als Indikator für gesellschaftliches Pflicht-

128

4 Die Teilnahme an politischen Umfragen

bewusstsein herangezogen werden, das einen direkten Einfluss auf die Umfrageteilnahme hat. Nicht nur die Wahlbeteiligung lässt sich auf ähnliche Determinanten wie eine Umfrageteilnahme zurückführen. Auch für die Parteiwahl kann man Unterschiede zwischen Kooperativen und Verweigerern vermuten, die sich auf gemeinsame Hintergrundvariablen zurückführen lassen. In der Wahlforschung existieren verschiedene Theorien zur Erklärung von Parteipräferenzen und der Parteiwahl, in denen die Einflussfaktoren sowohl auf Mikro- als auch auf Makroebene angesiedelt sind (für einen Überblick siehe Falter/Schoen 2005). Zur Erklärung individuellen Wahlverhaltens haben sich dabei in der Forschung besonders soziologische, sozialpsychologische und rationale Ansätze etabliert. Ohne die einzelnen Theorien detaillierter zu beleuchten, lassen sich daraus verschiedene Hypothesen ableiten, von denen exemplarisch drei Annahmen ausgesucht und überprüft werden. Erstens kann man annehmen, dass die Orientierungen gegenüber gewissen Sachfragen sowohl die Kooperation bei Umfragen als auch die Wahlentscheidung beeinflussen können. Eine derartige Sachfrage, die in direktem Zusammenhang mit einer Umfrageteilnahme und der Parteiwahl steht, ist der Umgang mit Daten bzw. der Datenschutz. Die Einstellung gegenüber dem Datenschutz wäre damit die gemeinsame Hintergrundvariable einer Umfrageteilnahme und der Wahl bestimmter Parteien. Auf der Angebotsseite der Parteien machen sich in der Bundesrepublik Deutschland insbesondere die FDP und Büdnis 90/Grünen für dieses Thema stark. Man kann vermuten, dass Parteien, die für Bürgerrechte, Datenschutz und die Wahrung der Privatsphäre eintreten, deutlich stärker von denjenigen gewählt werden, die auch eine Teilnahme verweigern, weil sie eine gewisse Einstellung gegenüber dieser Frage haben. In der Konsequenz müsste damit auf der Grundlage der kooperativen Zielpersonen das Wahlergebnis derjenigen Parteien unterschätzt werden, deren Wähler gehäuft nicht an Umfragen teilnehmen. Dies würde in besonderem Maß die beiden Parteien FDP und Bündnis 90/Die Grünen betreffen. Man könnte nun vermuten, dass sich dieser Effekt über die Vielzahl an relevanten Themen in einem Wahlkampf wieder aufhebt, allerdings ist damit gerade bei den FDPWählern nicht nur eine Einstellung gegenüber einer Sachfrage, sondern eine gewisse liberale Werthaltung verbunden. Aus diesem Grund wird angenommen, dass der Effekt gerade bei diesem Thema doch zu Verzerrungen führen kann. Ein zweiter Zusammenhang, der insbesondere in der angelsächsischen Literatur diskutiert wird, besteht zwischen der Wahl konservativer Parteien und der Verweigerung einer Umfrageteilnahme. Das Wahlergebnis konservativer Parteien wurde in der Vergangenheit bereits mehrfach in Prognosen unterschätzt. Gerade nach ungenauen Wahlprognosen, wie z.B. 1992 in Großbritannien oder 2004 bei den Präsidentschaftswahlen in den USA, werden – meist a posteriori – Erklärungen dafür gesucht (vgl. Jowell et al. 1993: 251; Martin et al. 2005; Pew Research Center for the People and the Press 1998). Verschiedene Merkmale kommen als gemeinsame Hintergrundvariablen der konservativen Wahl und der Umfrageverwei-

4.6 Zusammenfassung und Integration des Common Cause-Modells

129

gerung in Betracht, die eine Unterschätzung konservativer Parteien und Kandidaten erklären könnten. Sherkat (2007) argumentiert bspw. auf der Grundlage der religiösen Überzeugungen konservativer Wähler, die zu sozialer Exklusivität und damit zu einer geringeren sozialen Integration führten. Da die soziale Integration nicht nur auf das Wahlverhalten, sondern auch auf die Teilnahme an einer Umfrage wirke, gehörten die konservativen Wähler eher zu den Verweigerern. Eckberg (1992) argumentiert über die Religiösität als gemeinsame Hintergrundvariable und konstatiert, dass der Zusammenhang zwischen konservativer Wahl und Umfrageteilnahme über die Bedeutung und Wahrnehmung der Wissenschaft vermittelt sei: Streng religiöse Menschen seien der Wissenschaft gegenüber negativer eingestellt und nähmen aus diesem Grund seltener an wissenschaftlichen Umfragen teil. Die Umfrageeinstellung dieser Kernwähler konservativer Parteien sei daher negativer (vgl. auch Sherkat 2007: 84).118 Die Argumentationen können in ihren Einzelschritten nur sehr begrenzt empirisch nachgewiesen werden. Bei allen Analysen wird jedoch der Einfluss des individuellen politischen und gesellschaftlichen Kontextes deutlich: Gerade in Bezug auf die Rolle der Religion für die Wahlentscheidung und den Zusammenhang zwischen Wissenschaftsskeptizismus und Religiösität existieren bspw. deutliche Unterschiede zwischen dem politischen System der USA und dem der Bundesrepublik Deutschland. Ein Blick auf das deutsche politische System zeigt, dass die klassische Verbindung zwischen der Kirchenbindung und der Wahlentscheidung zwar ebenfalls existiert, aber an Relevanz verloren hat, da immer weniger Bürger eine Kirchenbindung aufweisen (vgl. Arzheimer/Schoen 2007). Zudem werden in Wahlprognosen in der Bundesrepublik Deutschland konservative Wähler in der Regel nicht unter-, sondern überschätzt, was eventuell auf die verstärkte soziale Integration zurückzuführen ist. Der empirische Teil wird zeigen, inwiefern hier Effekte auftreten und wie diese im Anschluss erklärt werden können. Ein dritter Befund ist, dass in Befragungen meist Wähler extremer Parteien unterrepräsentiert sind. Daher wird davon ausgegangen, dass auch die Wahl extremer Parteien und die Verweigerung der Teilnahme an einer politischen Befragung auf gemeinsame Hintergrundvariablen zurückzuführen sind. Für beide Verhaltensformen kann ein Zusammenhang mit dem Grad sozialer Desintegration vermutet werden (vgl. Arzheimer 2005: 400). Zudem könnten beide Verhaltensweisen aus einer Unzufriedenheit mit dem System entstehen. Der Zusammenhang zwischen der Unzufriedenheit mit dem System und der Wahl extremer Parteien ist im Rahmen der Protestwahlhypothese bereits gezeigt worden (vgl. Arzheimer 2002, 2005; Falter 1994). Wenn Unzufriedene nun auch seltener an politischen Befragungen teilnehmen, ist die Unterrepräsentation in Umfragen zu verstehen. In diesem Fall würde auf der Grundlage der kooperativen Zielpersonen die Wahl extremer Parteien 118

An dieser Stelle muss jedoch darauf hingewiesen werden, dass auch die konträre Position Anhänger findet, wonach angenommen wird, religiöse Menschen seien „nice people“ mit einem hohen Maß an Integration und Kooperation (vgl. Brennan/London 2001).

130

4 Die Teilnahme an politischen Umfragen

unterschätzt. Neben der Protestwahlhypothese wird in der Extremismus-forschung auch die Überzeugungswahlhypothese zur Erklärung extremen Wahlverhaltens diskutiert. Auch aus dieser Perspektive heraus lässt sich jedoch argumentieren, warum Wähler extremer Parteien zugleich eher Befragungsverweigerer sind: Eine gemeinsame Hintergrundvariable ist dabei die extreme Einstellung. Das Vorliegen extremer Einstellungen führt zur Überzeugungswahl extremer Parteien. Ebenso können extreme Einstellungen zu einer Verweigerung einer Umfrageteilnahme führen, weil die Zielpersonen nicht in soziale Isolation geraten wollen und annehmen, dass ihre Einstellungen sozial nicht erwünscht sind. Dies gilt in der Bundesrepublik Deutschland besonders für rechtsextreme Einstellungen, gegen die es einen breiten gesellschaftlichen und medialen Konsens gibt. Neben Effekten im Hinblick auf das Wahlverhalten lassen sich zugleich auch für andere politische Partizipationsformen Zusammenhänge mit der Teilnahmeentscheidung finden, die auf gemeinsame Hintergrundvariablen zurückzuführen sind. Dabei sind gemeinsame Ursachen im Bereich der Ressourcenausstattung und der politischen Einstellungen anzunehmen, für die positive Effekte im Hinblick auf die politische Partizipation empirisch bewährt sind (vgl. Ajzen/Fishbein 1980; Ajzen 1985; Barnes et al. 1979; Brady et al. 1995; Farah et al. 1979; Gabriel/Völkl 2008; Verba et al. 1995; Whiteley/Seyd 1996; Zaller 1992) und im Erklärungsmodell zur Kooperationsentscheidung Effekte postuliert wurden. Diejenigen, die sich im politischen System aktiv beteiligen, wären nach dieser Prämisse auch diejenigen, die sich kooperativ verhalten und sich gerne befragen lassen. Dies sollte zumindest für „konstruktive“ Partizipationsformen gelten. Eine Ausnahme wird jedoch für das Protestverhalten angenommen: Hier sind vielmehr entgegengesetzte, negative Zusammenhänge zu erwarten. Diejenigen, die mit dem politischen System unzufrieden sind, sind diejenigen, die stärker zu Protestverhalten tendieren und beispielsweise eher an nicht genehmigten Demonstrationen teilnehmen. Gleichzeitig wird angenommen, dass sich die Unzufriedenen aus den zuvor ausgeführten Gründen eher nicht befragen lassen. Die Bereitschaft zu Protestverhalten, die durchaus als Krisenindikator eines politischen Systems gelten kann, würde daher in Umfragen tendenziell unterschätzt. Mit den verschiedenen Facetten politischen Partizipationsverhaltens wurden nun exemplarisch einige Merkmale genannt, für die im Sinne des Common CauseModells Verzerrungen angenommen werden, wenn auf der Grundlage von Umfragedaten empirische Aussagen getroffen werden. Im nächsten Abschnitt sollen der Übersichtlichkeit halber noch einmal alle Hypothesen, die sich aus den theoretischen Ausführungen in diesem Kapitel ableiten lassen, dargestellt werden. Die Auflistung erhebt dabei keinen Anspruch auf Vollständigkeit: Gerade im Bereich des Common Cause-Modells wurden nur einzelne Merkmale herausgenommen, um die Mechanismen der Entstehung von Verzerrungen aufzuzeigen.

4.7 Hypothesenübersicht

131

4.7 Hypothesenübersicht Bevor die zentralen Konzepte im nächsten Abschnitt operationalisiert werden und das Forschungsdesign detaillierter dargestellt wird, sollen die aus dem Modell abgeleiteten Arbeitshypothesen zunächst noch einmal in einer Gesamtübersicht aufgezeigt werden. Dabei lassen sich Hypothesen unterscheiden, die unterschiedliche Reichweiten haben. Zunächst lautet die Basishypothese: H1.1: Es existieren signifikante Unterschiede zwischen Teilnehmern und NichtTeilnehmern einer politischen Befragung. Um den Begriff der Nicht-Teilnehmer einzugrenzen und den Fokus auf die inhaltlich interessanten Verweigerer zu legen, wird diese Hypothese spezifiziert: H1.2: Es existieren signifikante Unterschiede zwischen Kooperativen und Verweigerern einer Teilnahme an einer politischen Befragung. Da im Laufe des vierten Kapitels ein Erklärungsmodell aufgestellt wurde, das relevante Variablen der Wahl- und Einstellungsforschung als Bestimmungsfaktoren der Handlungsentscheidung aufzeigt, kann die Hypothese weiter konkretisiert werden: H1.3: Diese Unterschiede zwischen Verweigerern und Kooperativen treten auch bei den für die politische Wahl- und Einstellungsforschung inhaltlich relevanten politischen Einstellungs- und Verhaltensvariablen auf. Wie gezeigt, wird theoretisch angenommen, dass sich Unterschiede sowohl auf direkte als auch auf indirekte Effekte zurückführen lassen. Die direkten Effekte sind von der Grundidee einer handlungsleitenden Kosten-Nutzen-Analyse des Individuums abgeleitet. Über eine Kosten-Nutzen-Analyse im Sinne der WertErwartungstheorie bildet das Individuum gegenüber beiden Handlungsoptionen (Kooperation und Verweigerung) eine Einstellung aus, die einen bestimmten Wert besitzt. Neben der Einstellung gegenüber der Handlungsoption wirken die subjektive Norm und die subjektiv wahrgenommene Verhaltenskontrolle. Außerdem muss das Individuum eine Handlung tatsächlich auch ausführen können, d.h. auch objektiv die Kontrollmöglichkeit besitzen. Folgende Hypothesen ergeben sich daraus: H2: Je höher die objektive Ressourcenausstattung einer Zielperson ist, desto eher wird sie sich an einer Befragung beteiligen können.

132

4 Die Teilnahme an politischen Umfragen

Bei den Ressourcen lassen sich verschiedene Dimensionen unterscheiden. H2.1: Je höher die kognitive Ressourcenausstattung einer Zielperson ist, desto wahrscheinlicher wird sie sich an einer Befragung beteiligen können. H2.2a: Je höher die soziale Ressourcenausstattung einer Zielperson ist, desto wahrscheinlicher wird sie sich an einer Befragung beteiligen können. Für diese Hypothese existiert jedoch auch die gegenteilige Annahme eines negativen Zusammenhangs aufgrund des Opportunitätskosten-Arguments. Daher wird die Hypothese ebenso mit umgekehrter Wirkungsrichtung formuliert: H2.2b: Je höher die soziale Ressourcenausstattung einer Zielperson ist, desto unwahrscheinlicher ist es, dass sie sich an einer Befragung beteiligen kann. H2.3: Je größer die zeitliche Ressourcenausstattung einer Zielperson ist, desto wahrscheinlicher wird sie sich an einer Befragung beteiligen können. Neben den objektiven Ressourcen, die sich auf die tatsächliche Verhaltenskontrolle beziehen, wirkt aber auch die subjektiv wahrgenommene Kontrollmöglichkeit, d.h. das Ausmaß, in dem das Individuum selbst daran glaubt, an der Befragung teilnehmen zu können (=Selbstbild). Daraus ergibt sich: H3: Je eher eine Zielperson annimmt, die gestellte Aufgabe auch tatsächlich erfüllen zu können und je positiver damit das Selbstbild einer Person ist, desto eher wird sie an einer politischen Befragung teilnehmen. Diese Hypothese lässt sich wiederum konkretisieren, im Hinblick auf die beiden zentralen Merkmale, die das Selbstbild der Person in Bezug auf die Teilnahme an einer politischen Umfrage beeinflussen: H3.1: Je höher die Zielperson ihr eigenes politisches Wissen einschätzt, desto eher wird sie an einer politischen Befragung teilnehmen. H3.2: Je eher eine Zielperson glaubt, politisch Einfluss nehmen zu können (d.h. je höher die interne politische Efficacy einer Zielperson ist), desto eher wird sie an einer politischen Befragung teilnehmen. Neben der wahrgenommenen und objektiven Handlungskontrolle werden für weitere Merkmale auf der Ebene der Einstellungen Einflüsse auf die Handlungsentscheidung angenommen. Allgemein gesprochen gilt:

4.7 Hypothesenübersicht

133

H4: Je positiver eine Zielperson gegenüber der Teilnahme an einer politischen Befragung eingestellt ist, desto eher wird sie sich an einer derartigen Umfrage beteiligen. Verschiedene Erwartungen können in die Bildung der Einstellung gegenüber der Teilnahme an einer politischen Umfrage eingehen. Unterschieden werden politische, umfragespezifische und gesellschaftliche Einstellungen. H4.1: Je positiver die politischen Einstellungen einer Zielperson sind, desto eher wird sie an einer politischen Befragung teilnehmen. Die politischen Einstellungen lassen sich noch weiter konkretisieren, indem man die drei als zentral erachteten Merkmale Interesse am Thema, Akteure und Institutionen sowie Systemzufriedenheit fokussiert: H4.1.1: Je stärker das Politikinteresse einer Zielperson ist, desto eher wird sie an einer politischen Befragung teilnehmen. H4.1.2: Je größer das Institutionenvertrauen einer Zielperson ist, desto eher wird sie an einer politischen Befragung teilnehmen. H4.1.3: Je höher die Zufriedenheit einer Zielperson mit dem politischen System, desto eher wird sie an einer politischen Befragung teilnehmen. Neben den politischen Einstellungen hat auch die Umfrageeinstellung einen Einfluss auf die Teilnahmebereitschaft. H4.2: Je positiver die Einstellung einer Zielperson gegenüber Umfragen ist, desto wahrscheinlicher wird sie an einer Befragung teilnehmen. H4.2.1: Je höher eine Zielperson die Relevanz von Umfragen einschätzt (d.h. je responsiver sie das politische System wahrnimmt), desto wahrscheinlicher wird sie an einer Befragung teilnehmen. H4.2.2: Je stärker die Zielperson Beteiligungsnormen internalisiert hat, desto eher wird sie sich an einer Befragung beteiligen, weil sie ihr wichtig erscheint. H4.2.3: Je eher eine Person positive Erfahrungen mit Umfragen gemacht hat, desto eher wird sie sich daran beteiligen. H4.2.4: Je mehr die Zielperson annimmt, durch die Teilnahme Spaß und Abwechslung zu erhalten, desto wahrscheinlicher wird sie an der Befragung teilnehmen.

134

4 Die Teilnahme an politischen Umfragen

Auch bei den sozialen Orientierungen, die auf die Einstellung gegenüber der Teilnahme an einer Befragung wirken, können verschiedene Einstellungen unterschieden werden. Zunächst wird allgemein angenommen, dass positive Einstellungen gegenüber der Gesellschaft die Teilnahmewahrscheinlichkeit erhöhen. H4.3: Je größer das soziale Vertrauen einer Zielperson ist, desto eher wird sie an einer Befragung teilnehmen. Schließlich wirken die sozialen Einstellungen nicht nur auf die Herausbildung der Einstellung gegenüber dem Verhalten, sondern auch im Sinne der subjektiven Norm. H5: Je stärker ein Individuum annimmt, dass das soziale Umfeld eine Teilnahme erwartet oder sogar positiv bewertet, desto eher wird es kooperieren. Da zudem angenommen wird, dass mit zunehmender Integration in die Gesellschaft Normen und Werte (auch im Hinblick auf die Teilnahme an einer Befragung) stärker geteilt werden, ergeben sich folgende Hypothesen: H5.1: Je integrierter ein Individuum in die Gesellschaft ist, desto eher wird es an einer politischen Befragung teilnehmen. H5.2: Je weniger entfremdet eine Zielperson ist, desto eher teilt sie die Werte der Gesellschaft und desto eher wird sie an einer Befragung teilnehmen. H5.3: Je eher ein Individuum es als Pflicht empfindet, an einer Befragung teilzunehmen, desto eher wird es an einer politischen Befragung teilnehmen. H5.4: Je extremer die politischen Einstellungen eines Individuums sind, desto eher wird es aus Gründen der sozialen Erwünschtheit die Teilnahme an einer politischen Befragung ablehnen. Neben den Effekten, die aufgrund des Survey Variable Cause-Modells auftreten, werden aber auch Unterschiede zwischen Kooperativen und Verweigerern vermutet, die auf indirekte Effekte zurückzuführen sind. Das bedeutet, es wird angenommen: H6: Es gibt Unterschiede zwischen Verweigerern und Kooperativen in Bezug auf ihr politisches Partizipationsverhalten.

4.7 Hypothesenübersicht

135

Das politische Partizipationsverhalten wird dabei exemplarisch anhand verschiedener Dimensionen konkretisiert. H6.1: Es treten Unterschiede zwischen Kooperativen und Verweigerern in Bezug auf ihr Wahlverhalten auf. H6.1.1: Unter den Verweigerern sind mehr Nicht-Wähler vertreten als unter den Kooperativen. H6.1.2: In der Gruppe der Verweigerer erzielen die kleinen Parteien, die programmatisch für eine Stärkung des Datenschutzes und der Bürgerrechte stehen (FDP und Bündnis 90/Die Grünen), überdurchschnittliche Wahlergebnisse. H6.1.3: In der Gruppe der Verweigerer sind mehr Wähler extremer Parteien vertreten als in der Gruppe der Kooperativen. Schließlich wird angenommen: H6.2: Es existiert ein Zusammenhang zwischen politischer Partizipation und der Teilnahmebereitschaft. H6.2.1: Es existiert ein positiver Zusammenhang zwischen öffentlicher politischer Partizipation und der Teilnahmebereitschaft. H6.2.2: Es existierte ein positiver Zusammenhang zwischen nicht-öffentlicher politischer Partizipation und der Teilnahmebereitschaft. H6.2.3: Es existiert ein negativer Zusammenhang zwischen Partizipationsformen des politischen Protests und der Teilnahmebereitschaft. Um die indirekten Effekte aufzuzeigen, wird zunächst der Zusammenhang zwischen den Partizipationsvariablen und der Teilnahmebereitschaft überprüft (H6). Sollte sich dieser zeigen, werden die relevanten Hintergrundvariablen aus den Hypothesengruppen H2 bis H5 multivariat mit in die Analyse eingeführt. Dies müsste dann dazu führen, dass der Zusammenhang verschwindet. Im empirischen Teil dieser Arbeit soll daher zunächst geprüft werden, ob Unterschiede zwischen Kooperativen und Verweigerern in Bezug auf die Ressourcenausstattung, die Einstellungen gegenüber Politik, Gesellschaft, Umfragen und das Selbstbild sowie in Bezug auf politische Partizipation existieren. Anschließend werden, um die Ursachen für die Unterschiede zu erklären, die Teilmodelle multivariat getestet. Die Suche nach den Ursachen sozialwissenschaftlicher Phänomene ist mit einer Vielzahl von Problemen verbunden, die man bei der Interpretation der empiri-

136

4 Die Teilnahme an politischen Umfragen

schen Ergebnisse berücksichtigen muss (vgl. exemplarisch Arzheimer 2008: 129f.; Falter 1977). Auf einige dieser Probleme soll in den beiden folgenden Kapiteln intensiver eingegangen werden. Sozialwissenschaftliche Merkmale sind meist latente Konstrukte und somit nicht direkt beobachtbar. Um diese messen zu können, müssen geeignete Operationalisierungen gefunden werden. Zudem sind aufgrund praktischer Restriktionen (z.B. die Fragebogenlänge, die nur eine bestimmte Anzahl an Items erlaubt, das Interviewerverhalten, etc.) Einschränkungen in Bezug auf die Anzahl der abfragbaren Indikatoren in Kauf zu nehmen. Nicht alle wünschenswerten Indikatoren können – gerade in einem Forschungsdesign, in dem das zentrale Ziel ist, möglichst viele Zielpersonen tatsächlich zu befragen – in die Befragung aufgenommen werden, da z.B. der Fragebogen möglichst kurz gestaltet werden sollte. Dies betrifft insbesondere die Erhebung von Einstellungen, da man in der Einstellungsforschung annimmt, dass multiple Indikatoren am geeignetsten sind, um komplexe Strukturen abzubilden. Daher können nicht alle Elemente der Theorie ausführlich berücksichtigt werden. Gerade bei einer Parallelstudie zu einer der größten sozialwissenschaftlichen Studien in Deutschland, die bereits seit den 1980er Jahren existiert, gibt es weitere Restriktionen in Bezug auf die Frage, welche Variablen über welche Indikatoren erhoben werden können. Die endgültige Entscheidung über den Fragebogen des ALLBUS und damit auch die Grundstruktur der Nonresponse-Studie lag beim wissenschaftlichen Beirat der Studie und damit außerhalb der Kontrolle der Forscherin. Um die Unsicherheit, die sich aus den Merkmalen des Forschungsdesigns und der Auswahl der Indikatoren ergibt, besser einschätzen zu können, wird sich der nächste Abschnitt zunächst mit dem Forschungsdesign, das sechste Kapitel anschließend mit der Operationalisierung der relevanten Konzepte beschäftigen.

II Empirischer Teil

5 Das Design der Studie

Bevor das im vierten Kapitel entwickelte Modell und die daraus abgeleiteten Hypothesen empirisch überprüft werden, soll nun zunächst das Forschungsdesign der empirischen Nonresponsestudie beschrieben werden. Die Details der Datenerhebung sind relevant, um anschließend die Validität und die Reliabilität der Aussagen sowie die Reichweite der Untersuchung einschätzen zu können. Bei einer Fragestellung wie der hier vorliegenden nimmt die Entwicklung des Forschungsdesigns einen großen Stellenwert ein, da sie die Erkenntnisse in großem Ausmaß beeinflusst. Um das Problem der Antwortverweigerung und die Konsequenzen daraus zu untersuchen, ist eine präzise Datenerhebung eine Grundvoraussetzung. Diese muss sich sowohl durch ein hohes Maß an interner Validität und damit Kontrolle als auch durch ein hohes Maß an externer Validität und damit Übertragbarkeit auszeichnen. Damit steht man bei der Entwicklung des Forschungsdesigns vor einem Optimierungsproblem. Recht schnell wurde deutlich, dass zur Überprüfung der Hypothesen keine Sekundäranalyse durchgeführt werden konnte, um die Frage nach den politikwissenschaftlich relevanten Determinanten von Verweigerungen bei Umfragen zu beantworten. Für das politische und gesellschaftliche Umfeld der Bundesrepublik Deutschland liegen keine entsprechenden Daten vor. Wie bereits im dritten Kapitel gezeigt, existieren nur einige wenige Nonresponse-Studien (siehe etwa Bosnjak 2002; Erbslöh/Koch 1988; Kaczmirek 2008; Neller 2005; Reuband/Blasius 1996, 2000; Schnauber/Daschmann 2008; Schneekloth/Leven 2003; Schnell 1997), die sich für den deutschen Sprachraum überhaupt mit Antwortverweigerungen bei Umfragen beschäftigen. Mit Ausnahme der Studie von Neller zum ESS stammen die Arbeiten dabei nicht aus dem Bereich der Politikwissenschaft. Daher untersuchen sie in der Regel soziodemographische Merkmale der Verweigerer, die Analyse von politischen Einstellungen und politischem Verhalten von Verweigerern bleibt weitgehend ausgeklammert. Zudem basieren die meisten Untersuchungen nicht auf persönlich-mündlichen Befragungen und/oder arbeiten mit zum Teil wenig kontrollierbaren Stichprobendesigns. Bei internationalen Studien zu Nonresponse treten – unabhängig vom Problem der Datenbeschaffung – ähnliche Probleme auf. Auch dabei handelt es sich meist um Untersuchungen aus den Bereichen der Wirtschaftswissenschaften, Psychologie oder Soziologie, mit variierenden Stichprobenverfahren und unterschiedlichen Datenerhebungsmodi. Zwei weitere Aspekte erschweren eine Übertragbarkeit dieser Ergebnisse auf die Bundesrepublik Deutschland: Erstens kann man davon ausgehen, dass das Auftreten und die Erklä-

H. Proner, Ist keine Antwort auch eine Antwort?, DOI 10.1007/978-3-531-92721-3_5, © VS Verlag für Sozialwissenschaften | Springer Fachmedien Wiesbaden GmbH 2011

140

5 Das Design der Studie

rung von Nonresponse an sich bereits kontextabhängig sind, weil beispielsweise unterschiedliche Umfragekulturen existieren (vgl. Billiet et al. 2007; Stoop 2005).119 Verschärft wird das Problem durch den Fokus auf politische Einstellungen und Verhaltensweisen. Gerade diese Merkmale sind eng mit der politischen Kultur des jeweiligen Landes verbunden und daher in besonderem Maße vom gesellschaftlichen und politischen Umfeld abhängig. Aus den genannten Gründen wurde entschieden, eine eigene Daten zu erheben. Dazu wurde im Rahmen eines DFG-Projekts eine Nonresponse-Studie in Anlehnung an den ALLBUS 2008 konzipiert, deren Schwerpunkt auf der Analyse politikwissenschaftlich relevanter Merkmale und Konzepte liegt. In der vorliegenden Arbeit soll untersucht werden, ob es inhaltliche Unterschiede zwischen denen, die sofort an einer Umfrage teilnehmen, und denen, die eine Teilnahme zunächst verweigern, gibt. Um diese Frage zu beantworten, müssen möglichst viele Personen erreicht werden, die unter Standardbedingungen nicht an einer derartigen Studie teilnehmen würden. Zunächst muss daher ein Studiendesign entwickelt werden, das dies ermöglicht. Für die Gruppe der „befragten Verweigerer“ soll anschließend untersucht werden, wie sie politisch denken und handeln. Dieser Teil der empirischen Analyse ist damit vorrangig deskriptiver Art. Es geht darum, etwas über die Verteilung von Merkmalen in zwei Teilpopulationen der Gesamtbevölkerung zu erfahren und Unterschiede aufzuzeigen. Zur Erklärung der Unterschiede zwischen Teilnehmern und Verweigerern werden anschließend die Erklärungsmodelle und die daraus abgeleiteten Hypothesen, die im vierten Kapitel aufgestellt wurden, überprüft. In diesem Teil der empirischen Analyse geht es nicht mehr um die Beschreibung von unterschiedlichen Verteilungen, sondern um die Untersuchung von Zusammenhangshypothesen bzw. komplexeren Wirkungsbeziehungen. Der empirische Teil der Arbeit lässt sich damit in drei Teile gliedern: 1.

Studiendesign: Anhand der Erkenntnisse zum Einsatz verschiedener Designelemente in persönlich-mündlichen Umfragen soll zunächst eine auf die deutsche Gesamtbevölkerung bezogene Studie entwickelt werden, in der die Ausschöpfung im Vergleich zu den Standardbedingungen deutlich erhöht wird.

2.

Datenbeschreibung: Die Konsequenzen dieser Ausschöpfungssteigerung sollen anschließend auf der Ebene von Anteils- und Mittelwerten beschrieben werden.

119

„[T]he uncritical adoption of theoretical perspectives and methods which have arisen in response to the conditions and problems in another society does not always help to generate relevant knowledge about your own” (Lamy 1976: 109, zitiert nach Goyder 1985b: 232).

5 Das Design der Studie 3.

141

Hypothesenüberprüfung: Die im vorigen Kapitel aufgestellten Hypothesen und das Erklärungsmodell sollen getestet und damit Erklärungen für möglicherweise auftretende Unterschiede zwischen Kooperativen und Verweigerern gefunden werden.

Wie bereits im zweiten Kapitel dargestellt, lässt sich das Grundproblem, dass von einem bestimmten Teil der Zielpersonen keine Informationen erhoben werden können, nicht lösen. Da die Teilnahme an einer Befragung – aus normativ betrachtet „guten“ Gründen – freiwillig ist, steht es jeder Zielperson frei zu kooperieren oder eine Teilnahme zu verweigern (vgl. etwa die Richtlinien der ICC/ESOMAR 2007: 2). Dennoch lassen sich verschiedene Grade von Widerstand gegen eine Teilnahme unterscheiden, die als Verweigerungswahrscheinlichkeit gedeutet werden können. Es gibt diejenigen Zielpersonen, die bei einer Befragung sofort bereit sind teilzunehmen und die man in einer „Normalstudie“ befragen würde. Andere Zielpersonen kooperieren erst unter bestimmten Voraussetzungen, was bedeutet, dass sie unter Standardbedingungen Nonrespondenten wären. Aus der LeverageSalience-Theorie (vgl. Kap. 3) lässt sich ableiten, dass auf der Ebene des Designs verschiedene ausschöpfungssteigernde Mittel eingesetzt werden können, um zunächst nicht befragungsbereite Personen noch zu konvertieren. Wenn man in dem von Groves et al. (2000) angeführten Bild der Waage bleiben will, kann man formulieren, dass dabei entweder zusätzliche Gewichte in die Waagschale auf der Seite der Kooperation gelegt werden und/oder versucht wird, das Gewicht auf der Seite der Verweigerung zu reduzieren. Diesen Weg verfolgen die meisten empirischen Nonresponse-Studien (vgl. etwa Groves et al. 1992; Keeter et al. 2000; Neller 2005; Smith 1984).120 Um eine möglichst hohe Aussagekraft der Ergebnisse bei gleichzeitig hoher Datenqualität zu garantieren, wurde die Datenerhebung parallel zur bundesweit angelegten Allgemeinen Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS) durchgeführt. Aus diesem Grund wird die Studie im Folgenden auch als „ALLBUS+“ bezeichnet. Der reguläre ALLBUS ist eine Trendstudie, die seit 1980 bei Einwohnern der Bundesrepublik alle zwei Jahre Daten zu sozialwissenschaftlich relevanten Themen erhebt.121 Sie ist für die Durchführung der Nonresponse-Studie aus mehreren Gründen besonders geeignet. Das Stichprobendesign als Registerstichprobe122 ermöglicht eine präzise und eindeutige Definition 120

Wenn man auf dieser Grundlage Aussagen über Nonrespondenten treffen möchte, verbirgt sich dahinter eine kontinuierliche Vorstellung von Nonresponse (vgl. Kap. 2). Man nimmt an, dass diejenigen, die unter Standardbedingungen nicht teilnehmen, aber in einer späteren Phase doch noch überzeugt werden können, den endgültigen Verweigerern ähnlicher sind als den Kooperativen. Daher werden die Erkenntnisse aus der Analyse der Konvertierten als Annäherung an die endgültigen Nonrespondenten verwendet. Ob eine solche kontinuierliche Annahme von Nonresponse gerechtfertigt ist, werden die empirischen Analysen zeigen. 121 Siehe auch http://www.gesis.org/das-institut/wissenschaftliche-arbeitsbereiche/dauerbeobachtung-dergesellschaft/survey-programme/allbus (Referenzdatum: 10.03.2010). 122 Der ALLBUS basiert seit 1996 auf einer Registerstichprobe (mit Ausnahme der Erhebungswelle des Jahres 1998, die aus Kostengründen noch einmal als Random Walk realisiert wurde) (vgl. Wasmer et al. 2007).

142

5 Das Design der Studie

der Grundgesamtheit, der Zielpersonen, der Respondenten und Nonrespondenten. Zugleich ist damit die größtmögliche Kontrolle der durchgeführten Interviews gewährleistet. Andere Studien, die z.B. bei der Stichprobenziehung auf Random Walk-Designs basieren, bieten (meist) weniger Kontrollmöglichkeiten (siehe auch Kap. 5.1.1). Hinzu kommt, dass der Schwerpunkt des ALLBUS im Jahr 2008 im Bereich der politischen Einstellungen und politischer Partizipation lag. Damit waren auch die inhaltlichen Voraussetzungen gegeben, um mögliche Unterschiede zwischen Kooperierenden und Verweigerern bezüglich ihrer politischen Einstellungen und Verhaltensweisen zu untersuchen (vgl. Brehm 1993; Groves/Couper 1998; Voogt/Saris 2003; Wasmer et al. 2007). Außerdem hatte diese Konzeption einen weiteren positiven Nebeneffekt: Beim ALLBUS handelt es sich um eine der größten sozialwissenschaftlichen Primärerhebungen, auf der zahlreiche Sekundäranalysen basieren. Eine umfassende Nonresponse-Studie kann damit neben der Erklärung von Nonresponse dazu beitragen, ein genaueres Bild von den möglichen Verzerrungen im regulären ALLBUS zu erhalten. Gleichzeitig muss damit in Kauf genommen werden, dass aufgrund der Größe und der Positionierung des ALLBUS in der Scientific Community (z.B. dem „Call for Questions“ und der damit verbundenen Beschränkung auf einen gewissen Kanon von Fragen) Probleme bei der Operationalisierung und Überprüfung der theoretischen Modelle auftreten können. Aufgrund der Replikation eines Teils der Fragen aus den Vorjahren und einer reduzierten Befragungszeit war es nur begrenzt möglich, neue Items in den Fragebogen einzubauen. Daher konnten nicht alle theoretisch relevanten Merkmale erhoben werden, was sich insbesondere im Bereich des Einflusses der Umfrageeinstellung und der Kontrolle der Persönlichkeitsmerkmale der Befragten zeigt.123 Um Aussagen über die Wirkung der einzelnen eingesetzten Designelemente treffen zu können, wäre deren experimentelle Kontrolle wünschenswert gewesen. Aus forschungspraktischen Gründen war diese aber nicht vollständig umsetzbar, so dass im Endergebnis nicht genau angegeben werden kann, welches Designelement welche Wirkung auf die Ausschöpfung hatte.124 Für die Klärung der Forschungsfrage ist diese Perspektive aber auch nur von untergeordneter Relevanz, da der Fokus nicht auf der experimentellen Erklärung verschiedener Designeffekte, son-

123 Die Persönlichkeitsmerkmale scheinen aber auch nur begrenzt einen Einfluss auf die Teilnahmebereitschaft zu haben, wie eine Studie von Hox et al. (1996: 110) zeigt. Die Autoren testeten 14 Persönlichkeitsmerkmale und fanden keinen Unterschied zwischen Respondenten und Nonrespondenten. Sie konstatieren: „[C]ontrary to popular belief, there appears to be no such thing as a ‚responding personality‘“ (Hox et al. 1996: 110). 124 Nimmt man lediglich eine Variation von je zwei Bedingungen beim Einsatz des Incentives (ja/nein), bei der Befragungszeit (kurz/lang), der Interviewerperformance (gut/schlecht) und dem Sponsor (Universität/Kommerz) an, hätte man bereits ein 2x2x2x2-Design, d.h. bei vollständiger Kontrolle 16 Experimentalgruppen. Bei einer Brutto-Ausgangsstichprobe, die aus Kostengründen bei maximal etwa 1200 bis 1600 Personen liegen kann, hätte man in jeder Gruppe, bei einer Ausschöpfung von 80 bis 85 Prozent, nur noch ca. 80 Befragte. Da aber die Analyse inhaltlicher Merkmale im Vordergrund steht und dabei u.a. auch die Verteilung extremer politischer Einstellungen untersucht werden soll, würden die Fallzahlen zu klein werden. In den Experimentalgruppen mit den „schlechteren“ Bedingungen würde man Zielpersonen verlieren, die man eventuell hätte befragen können.

5.1 Rahmenbedingungen: Stichprobenziehung und Feldzeit

143

dern auf der inhaltlichen Analyse der Unterschiede zwischen Teilnehmern und Nicht-Teilnehmern liegt. Bei der Entwicklung des Forschungsdesigns der Nonresponse-Studie wurden umfassende Erkenntnisse der Methodenforschung zur Wirkung verschiedener Designelemente auf Nonresponse eingesetzt, um eine möglichst hohe Ausschöpfung zu erreichen. Das bedeutet, es wurde zunächst versucht, den Anteil aller Nonresponse-Typen (Verweigerer, Nicht-Befragbare und Nicht-Erreichte) zu minimieren. Der Fokus lag nicht nur auf den expliziten Verweigerern, da angenommen wurde, dass ein gewisser Anteil der Nicht-Erreichten nur deshalb nicht erreicht werden kann, weil er nicht erreicht werden will. Empirisch verschwimmen damit die Grenzen zwischen den (theoretisch trennscharfen) Kategorien Erreichbarkeit und Teilnahmebereitschaft (siehe Kap. 2; vgl. Schnell 1997: 18). Die theoretischen Grundlagen und empirischen Forschungserkenntnisse zur Wirkung verschiedener Designelemente auf die erwartete Ausschöpfung werden nun zunächst referiert, um die Auswahl des Forschungsdesigns zu begründen. Im Einzelnen wird auf die Stichprobenziehung und Feldzeit (Kap. 5.1) sowie auf Kontaktmodalitäten, Incentives, Interviewereinsatz, den Umfang der Befragung, die Salienz des Themas und die Nennung von Sponsoren (Kap. 5.2) eingegangen. Im Anschluss wird das Gesamtdesign der Studie vorgestellt (Kap. 5.3).

5.1 Rahmenbedingungen: Stichprobenziehung und Feldzeit 5.1.1 Stichprobenziehung Die erste Entscheidung bezieht sich auf die Form der Stichprobenziehung, von der ein Einfluss auf die Ausschöpfung angenommen wird. Die Responsequote ist – vordergründig betrachtet – umso höher, je freier die Zielperson in einem Haushalt ausgesucht werden darf (vgl. die „respondent rule“ bei Groves et al. 1992: 477). Offensichtlich wird dies bei willkürlichen bzw. bewussten Auswahlverfahren, wie beispielweise bei Quotenverfahren, bei denen es „auf dem Papier“ so gut wie keine Nicht-Erreichten gibt. Diese Verfahren sind bei den großen bundesweiten Befragungsstudien in Deutschland eher die Ausnahme125, sollen aber zumindest Erwähnung finden, da sie international (z.B. in den USA) zur Befragung der Gesamtbevölkerung durchaus üblich sind. Dies gilt auch bei der Prognose von Wahlergebnissen (vgl. Lynn/Jowell 1996). Da die Interviewer im Rahmen ihrer Quotenvorgaben ihre Befragten völlig frei auswählen können, werden – wenn überhaupt Ausschöpfungen berichtet werden – meist sehr hohe Erfolgsquoten von fast 100 Prozent erreicht. Es wird dabei aber auch nicht notiert, wie viele Personen angefragt wurden und nicht bereit waren, teilzunehmen, sondern lediglich analysiert, welche 125

Eine „Ausnahme dieser Ausnahme“ stellen die Wahlstudien des Instituts für Demoskopie in Allensbach dar, die in der Regel über Quotenstichproben erhoben werden.

144

5 Das Design der Studie

Quoten nicht erfüllt werden konnten. Das Problem ist, dass das fehlende Zufallsprinzip der Auswahl dazu führt, dass man nicht weiß, über wen man über die „Stichprobe“ hinaus auf dieser Grundlage Schlussfolgerungen ziehen kann. Die theoretischen Voraussetzungen der Stichprobentheorie zur Anwendung von Inferenzstatistik sind nicht erfüllt. Das Grundproblem, dass es Personen gibt, die nicht antworten wollen oder können bzw. die nicht erreicht werden, ist auf diese Weise selbstverständlich auch nicht beseitigt, sondern nur kaschiert und schlägt sich in den gleichen verzerrten Ergebnissen nieder (vgl. neben vielen anderen Lynn/Jowell 1996: 22). Echte Zufallsverfahren erfüllen hingegen die Voraussetzung der Stichprobentheorie, dass die Elemente der Grundgesamtheit bekannt sind und mit einer bestimmten „angebbaren“ Wahrscheinlichkeit in die Stichprobe gelangen können (vgl. Behnke et al. 2006: 139; Schumann 2006: 86).126 Eine derartige Zufallsstichprobe ist, gerade bei allgemeinen Bevölkerungsstichproben, zunächst ein theoretisches Konstrukt, dem man sich empirisch lediglich annähern kann. Dabei existieren, je nach Erhebungsmodus (telefonisch, schriftlich-postalisch, online, persönlich-mündlich) und Grundgesamtheit (allgemeine Bevölkerungsumfragen oder Spezialpopulationen), unterschiedliche Auswahlverfahren, die in der Umfragepraxis angewandt werden. Bei persönlich-mündlichen allgemeinen Bevölkerungsbefragungen sind die beiden am häufigsten verwendeten Prozeduren Random Routeund Registerstichprobenverfahren. Bei beiden geht es darum, in einem bestimmten abgegrenzten Gebiet (Gemeinde, Sample Point127 o.Ä.) Adressen von Zielpersonen zu ermitteln, die anschließend befragt werden sollen. Bei den Registerstichproben geht man davon aus, dass die Daten in den Einwohnermelderegistern eine optimale Annäherung an die Auflistung der Gesamtbevölkerung darstellen. Beim Random Route-Verfahren liegt keine Liste der Gesamtbevölkerung vor, sondern man nimmt an, durch eine Kombination von bestimmten Auswahlregeln eine Wahrscheinlichkeitsauswahl zu approximieren (vgl. Behnke et al. 2006: 140). Beide Verfahren besitzen Vor- und Nachteile in der praktischen Umsetzung, die nun kurz erläutert werden sollen. In den vergangenen Erhebungswellen des ALLBUS wurden beide Verfahren bereits eingesetzt und die Unterschiede analysiert. Da beide Verfahren in der Theorie reine Zufallsverfahren sind, dürften sich die Ergebnisse in der Praxis – bei konstanten Rahmenbedingungen – nicht sonderlich unterscheiden. Koch (2002) und Sodeur (2007) beschreiben jedoch, dass die Ausschöpfungen in den Jahren mit

126 Es existieren auch andere Definitionen, die besagen, dass bei einer Zufallsstichprobe „für jedes Element der Grundgesamtheit die Wahrscheinlichkeit, dass es in der Stichprobe enthalten ist, gleich groß“ (Behnke/Behnke 2006: 282) sein muss. Dies gilt aber nur für einfache und nicht für mehrstufige Zufallsstichproben (vgl. Schumann 2006: 88ff.; Kalton 1983: 38ff.). 127 Sample Points sind exakt definierte, räumlich abgegrenzte Gebiete mit möglichst gleicher Bevölkerungszahl (ca. 600 bis 700 Haushalte), die auf der Einteilung der Wahlbezirke basieren (vgl. Häder 2006: 151).

5.1 Rahmenbedingungen: Stichprobenziehung und Feldzeit

145

Random Route-Verfahren (Standard- und Adress-Random128, angewendet in den Erhebungsjahren 1980 bis 1992 und 1998) deutlich höher lagen als in den Jahren mit Registerstichproben der Einwohnermeldeämter (1994, 1996 und seit 2000). Ein empirisch gesicherter Beleg, dass die Unterschiede beim ALLBUS in den einzelnen Erhebungsjahren auf die unterschiedlichen Stichprobenverfahren zurückzuführen sind, ist dies jedoch noch nicht, da sich neben der Stichprobenziehung auch andere Bedingungen verändert haben. Ähnliche Ergebnisse eines signifikanten Unterschieds in der Ausschöpfung zeigten sich jedoch auch bei experimentellen Studien, bei denen bei einer Erhebung die Stichprobe zum Teil über Register, zum Teil über Random Route gezogen wurde. Die Ausschöpfung bei Studien auf der Grundlage von Registerstichproben ist niedriger (vgl. Alt et al. 1991: 66; Diekmann 2004: 25; Sodeur 2007). Der Einfluss des Verfahrens der Stichprobenziehung resultiert nicht aus der Entscheidung der Zielperson. Vielmehr zeigen sich an dieser Stelle Interviewereinflüsse und der Unterschied zwischen theoretisch geplanter Wahrscheinlichkeitsauswahl und Praxis der Umfrageforschung, die sich mit zahlreichen praktischen Problemen bei der Umsetzung der theoretischen Konzepte auseinandersetzen muss (vgl. Wasmer et al. 2010: 6). Beim Random Route-Verfahren erhalten die Interviewer eine zufällige Startadresse in Kombination mit Begehungsregeln zum Auffinden von Adressen und Auswahlregeln – wie z.B. Geburtstagsmethode oder Schwedenschlüssel – zur Auswahl einer Person im jeweiligen Haushalt (vgl. Gehring/Weins 2004: 178f.; Kromrey 2006: 309f.; Schumann 2006: 100ff.). Auf diese Art und Weise soll annähernd eine Zufallsauswahl realisiert werden. Dabei muss man jedoch berücksichtigen, dass auf der letzten Stufe allein die Interviewer das Stichprobenverfahren umsetzen. Eine mögliche Erklärung der höheren Ausschöpfungen bei Random Route-Verfahren liegt damit in der Person des Interviewers. Bei Random Route werden von den Interviewern häufiger befragungsbereite Personen statt den eigentlichen Zielpersonen befragt, weil die Interviewer wissen, dass die Kontrollen für die Institute und den Auftraggeber nicht so einfach sind (vgl. Koch 2002; Sodeur 2007). Bei Registerstichproben liegen die Namen und Adressen der Zielpersonen im Institut bzw. beim Forscher vor, so dass eine Kontrolle einfacher ist. Um die Auswahl der Zielpersonen so genau wie möglich zu kontrollieren und dem Interviewer nur wenig Raum für Fälschungen zu geben, wurde daher für die Datenerhebung der hier entwickelten Nonresponse-Studie, analog zur Stichprobenziehung des regulären ALLBUS, das Verfahren einer disproportional geschichteten Einwohnermeldeamts-Registerstichprobe gewählt (vgl. Häder 2006: 157). Diese hat den Vorteil, dass die Zielpersonen eindeutig definiert sind und überprüft wer128

Die beiden Verfahren unterscheiden sich: Bei Standard-Random-Verfahren werden in einem Schritt die Adressen ermittelt und die Daten erhoben. Beim Adress-Random-Verfahren werden die Adressen und die Daten von unterschiedlichen Personen ermittelt. Damit ist es weniger fälschungsanfällig. Gleichzeitig ist es jedoch auch deutlich teurer in der Umsetzung als das Standard-Random (vgl. Schumann 2006: 100).

146

5 Das Design der Studie

den können. Hinzu kommt, dass einige Informationen, zumindest Geschlecht, Alter, Wohnumgebung, z.T. auch die Staatbürgerschaft, von allen Stichprobenelementen vorliegen, auch wenn kein Interview stattfinden kann. Die Stichprobe wurde disproportional geschichtet, um auch in Ostdeutschland eine ausreichende Anzahl Interviews zu generieren (vgl. Wasmer et al. 2010: 6). Damit sind auch regional getrennte Analysen möglich. Die Stichprobenziehung erfolgte für beide Studien (ALLBUS und ALLBUS+) zunächst gemeinsam. In einem ersten Schritt wurden, nach Ost und West getrennt, 162 Sample Points in 148 deutschen Gemeinden gezogen.129 Diese Gemeinden wurden angeschrieben und gebeten, eine Zufallsauswahl von je 124 Adressen aus ihrem Melderegister zu ziehen.130 Die gelieferten Adressen wurden zunächst bereinigt und kontrolliert und anschließend daraus noch einmal je 91 Adressen pro Sample Point geschichtet nach Alter und Geschlecht gezogen. Diese wurde zufällig auf zwei Teilstichproben verteilt, eine für den regulären ALLBUS (52+28 Adressen pro Point131) und eine für den ALLBUS+ (11 Adressen pro Point), so dass in jeder der beiden Studien genügend Adressen für die Brutto-Ausgangsstichproben zur Verfügung standen und zugleich noch ein gewisser Bestand an Restadressen die Ersetzung qualitätsneutraler Ausfälle ermöglichte. Mit der Stichprobenziehung aus den Einwohnermeldeamtsregistern sind verschiedene Einschränkungen verknüpft, die bei der Interpretation der Ergebnisse berücksichtigt werden müssen: Erstens besteht das Problem der bei den Einwohnermeldeämtern nicht registrierten Personen. Diese haben überhaupt keine Möglichkeit, in die Stichprobe zu gelangen (vgl. Schnell 1991: 107). Da es sich dabei im Sinne der hier verwendeten Definition nicht um Nonresponse, sondern um das Phänomen des „undercoverage“ handelt (siehe dazu auch Kap. 2), wird diese Personengruppe jedoch nicht weiter diskutiert. Dennoch darf nicht vergessen werden, dass auch diese Personen eine Quelle potenzieller Verzerrungen in Umfragen 129 Die Ziehung erfolgte proportional zu den Gemeindegrößen. Dazu wurde die seit 2000 entwickelte, nach den Entwicklern benannte, BIK-Systematik verwendet (siehe BIK Aschpurwis+Behrens 2000). Diese Systematik beinhaltet ein Regionalmodell, das auf der Stadtregions-Systematik von Boustedt aus den 1950er Jahren basiert. Für die Region West wurde eine dreidimensionale Allokation Bundesland x Regierungsbezirk x BIK mit 111 Sample Points durchgeführt, für die Region Ost wurde das Verfahren analog dazu mit 51 Sample Points durchgeführt. Für jede Zelle wurde anschließend eine Allokation mit der Matrix Kreis x BIK durchgeführt. Als Ergebnis resultierten 148 Gemeinden mit insgesamt 162 Sample Points, die ein repräsentatives Abbild aller deutschen Gemeinden liefern. Großstädte wie Berlin oder Hamburg sind dabei mit mehr als einem Sample Point vertreten. Da beide Erhebungen, regulärer ALLBUS und ALLBUS+, parallel zueinander in den gleichen Gemeinden stattfanden, aber unterschiedliche Befragungsbedingungen hatten, wurde zudem entschieden, Kleinstgemeinden mit einer Einwohnerzahl unter 2000 Personen im ALLBUS+ durch so genannte Spiegelgemeinden zu ersetzen. Dies sind Gemeinden identischer Größe und ähnlicher regionaler Lage. Damit sollte verhindert werden, dass sich die Zielpersonen in der gleichen Gemeinde untereinander austauschen und die unterschiedlichen Befragungsbedingungen (mit und ohne Incentive) feststellen. 130 Bei den Spiegelgemeinden, die nur im ALLBUS+ vertreten waren, wurden 36 Adressen bestellt. 131 Im regulären ALLBUS wird eine Basisstichprobe aus 52 Adressen und eine Aufstockungsstichprobe aus 28 Adressen gebildet. Aus der Aufstockungsstichprobe können am Ende der Studienzeit noch Adressen eingesetzt werden, wenn die angestrebte Fallzahl von 3.500 Fällen aus den Adressen der Basisstichprobe nicht erreicht werden kann. Für diese Arbeit wird die Aufstockungsstichprobe im weiteren Verlauf nicht weiter beachtet.

5.1 Rahmenbedingungen: Stichprobenziehung und Feldzeit

147

sind.132 Hinzu kommt, dass aus organisatorischen Gründen eine zeitliche Lücke zwischen Stichprobenziehung (im September 2007) und Datenerhebung (ab März 2008) liegt, aufgrund derer so genannte qualitätsneutrale Ausfälle133 auftreten können: Menschen ziehen um, ohne ihre Registerdaten zu ändern; wieder andere sterben in der Zwischenzeit oder sind aus anderen Gründen nicht mehr unter der angegebenen Adresse erreichbar. Ein gewisser Teil der Zielpersonen fällt daher aus der Stichprobe heraus, weil die Adresse zwar zur Zeit der Stichprobenziehung, nicht aber zum Zeitpunkt der Erhebung, existiert und nicht nachrecherchiert werden kann. Empirisch wurden für solche Fälle in jedem Sample Point des ALLBUS+ drei zufällig gezogene Ersatz-Adressen zur Verfügung gestellt, um die Ausfälle zu ersetzen (vgl. TNS-Infratest Sozialforschung 2008: 11f.). Die Brutto-Ausgangsstichprobe für den ALLBUS+ beläuft sich demnach auf je acht Adressen in 162 Sample Points, also 1.296 Adressen. Hinzu kommen 486 Ersatzadressen. Wenn in einem Sample Point mehr als drei Adressen qualitätsneutral ausfallen, können sie nicht weiter ersetzt werden, was jedoch nur in Einzelfällen zu erwarten ist. Ein weiteres Problem stellen Gemeinden dar, die eine Auskunft aus ihren Melderegistern komplett verweigern. Damit entsteht Nonresponse auf einem höheren Niveau, nämlich auf der Makroebene. Da es sich um eine zweistufige Stichprobe handelt, in der erst Sample Points und danach Zielpersonen ausgewählt werden, können ganze Sample Points ausfallen, ohne dass die darin lebenden Zielpersonen die Teilnahme verweigern würden. Beim ALLBUS+ trat dieses Phänomen bei neun Gemeinden auf. Da diese Arbeit jedoch der Frage nachgeht, wie sich diejenigen, die an einer Befragung teilnehmen von denjenigen unterscheiden, die eine Teilnahme verweigern, und damit eine Erklärung auf Individualebene angestrebt wird, wird auch diese Form der Ausfälle für die empirische Analyse nicht weiter berücksichtigt. Es wird angenommen, dass es keine systematischen Zusammenhänge zwischen den Gemeinden, die eine Auskunft verweigern, und den darin lebenden Personen gibt.

5.1.2 Feldzeit Neben dem Verfahren der Stichprobenziehung musste die Länge der Feldzeit festgelegt werden. Die Forschung zeigt, dass eine Verlängerung der Feldzeit zunächst dazu führt, dass mehr Personen erreicht werden können, die z.B. kurzzeitig verreist oder erkrankt sind (vgl. Groves/Couper 1998: 272ff.). Allerdings existiert ein Schwellenwert, im Sinne eines Grenznutzens, an dem eine weitere Verlängerung 132

Bei der Schätzung des Wahlverhaltens kann man beispielsweise annehmen, dass diese Personen zwar nicht in dem örtlichen Wahlregister der untersuchten Gemeinde, aber eventuell in einer anderen Gemeinde registriert sind. Dies könnte in der anderen Gemeinde zu Verzerrungen führen. 133 Die Formulierung „qualitätsneutral“ ist selbstverständlich nicht unproblematisch. Auch diese Ausfälle können zu systematischen Verzerrungen führen, wenn es z.B. Zusammenhänge zwischen der Mobilität der Zielpersonen und den untersuchten politischen Einstellungen gibt.

148

5 Das Design der Studie

der Feldzeit nicht mehr zu einer höheren Ausschöpfung führt (vgl. Groves et al. 2004b: 191). Bei Studien wie dem ALLBUS, der sich bereits im Standardverfahren durch eine lange Feldzeit von mehreren Monaten auszeichnet (vgl. Wasmer et al. 2007: 62), ist bei einer weiteren Verlängerung der Erhebungszeit nur von einem begrenzten Nutzen auszugehen. Man könnte zunächst vermuten, dass es bei der Diskussion um den Einfluss der Feldzeit eher um Erreichbarkeit als um Kooperationsbereitschaft geht. Studien zeigen jedoch, dass auch der „Workload“, d.h. die Arbeitsbelastung der Interviewer, eng mit dem Einfluss der Feldzeit verbunden ist. Diese Arbeitsbelastung wirkt sich sowohl auf den Anteil Erreichter als auch, und dies ist für die Fragestellung dieser Arbeit interessanter, auf den Anteil der expliziten Verweigerer aus. Sie kann bspw. über die Anzahl der Adressen, die in einer bestimmten Zeit bearbeitet werden müssen, gemessen werden.134 Die Methodenforschung belegt: Je weniger Adressen von einem Interviewer in der vorgegebenen Feldzeit abgearbeitet werden müssen, desto höher ist deren Ausschöpfung. Dazu trägt einerseits bei, dass Adressen von zunächst nicht Erreichten noch erfolgreich nachbearbeitet werden können (vgl. Groves/Couper 1998: 274; Groves et al. 2004b: 192). Andererseits kann man auch für die Kooperationsbereitschaft von Zielpersonen einen Effekt annehmen: Je intensiver ein Interviewer Adressen bearbeiten kann (und muss), desto eher bemüht er sich, zunächst nicht kooperative Zielpersonen doch noch von einer Teilnahme zu überzeugen.135 Um die Arbeitsbelastung in beiden Studienbedingungen (ALLBUS und ALLBUS+) möglichst gering zu halten, die Interviewer dennoch zu motivieren und gleichzeitig alle Zielpersonen zu erreichen, fiel die Entscheidung zugunsten einer relativ langen Feldzeit, die etappenweise an die Interviewer kommuniziert wurde. Die Hauptbearbeitung dauerte zehn Wochen, die Nachbearbeitung noch einmal etwa sechs Wochen, woraus eine Feldzeit von über vier Monaten (23 Wochen) für diese beiden Phasen resultierte. Bei den Interviewern des ALLBUS+, die sowohl im ALLBUS als auch im ALLBUS+ eingesetzt wurden, handelte es sich in der

134

Zudem muss berücksichtigt werden, dass viele Interviewer meist nicht nur in einem, sondern in mehreren Projekten gleichzeitig arbeiten. Das bedeutet, es muss zusätzlich die Anzahl der Projekte, in die der einzelne Interviewer involviert ist, berücksichtigt werden. 135 Da die meisten Honorare auf Provisionsbasis bezahlt werden, muss ein Interviewer sein Honorar auf der Basis der ihm zur Verfügung stehenden Adressen erwirtschaften. Das bedeutet, dass man bei zu vielen Adressen von einer niedrigeren Motivation pro Adresse und daher einer niedrigeren Ausschöpfung ausgehen würde. Gleichzeitig könnte man argumentieren, dass ein Interviewer nur dann motiviert arbeitet, wenn er annimmt, in einer Studie auch Geld verdienen zu können. Daher darf die Adresszahl auch nicht zu gering sein. Zu den letztgenannten Annahmen existieren jedoch keine empirischen Untersuchungen, weswegen sie sich im Bereich von (obgleich plausiblen) Spekulationen bewegen. Die Feldabteilung von Infratest erläutert, dass diese Adressverteilung von erfahrenen Mitarbeitern der Feldabteilungen, in enger Absprache mit den Regionalleitern, die die einzelnen Interviewer und ihre private Situation persönlich kennen, organisiert wird. Erfahrung, enge Absprache, Kommunikation und Fingerspitzengefühl seien dabei notwendige Bedingungen, um ein Optimum zwischen Motivation und Belastung zu erreichen (Gespräch mit Sylvia Schönberger, Feldabteilung Infratest am 11.02.2008 in Frankfurt).

5.2 Auschöpfungssteigernde Maßnahmen

149

Regel um hauptberufliche Interviewer, so genannte Fulltimer. Die meisten erhielten ein bis zwei Sample Points zur Bearbeitung, d.h. zwischen 48 und 96 Adressen. Um bei einer derart langen Feldzeit eventuell auftretende Periodeneffekte, z.B. durch wichtige politische Ereignisse, in beiden Studien konstant zu halten, wurden ALLBUS und ALLBUS+ nicht nur räumlich, d.h. in den gleichen Gemeinden136, sondern auch zeitlich parallelisiert durchgeführt.137

5.2 Ausschöpfungssteigernde Maßnahmen Um die Ausschöpfung im ALLBUS+ zu steigern, wurden Elemente eingesetzt, die Groves/Couper in ihrem allgemeinen Konzept der Kooperation bei Umfragen unter dem Einfluss des Forschungsdesigns diskutieren (vgl. Groves/Couper 1998, siehe auch Kap. 3.2.1.2). Der Einsatz der Designelemente erfolgt dabei nach Annahmen, die aus der Leverage-Salience-Theorie (vgl. Groves et al. 2000: 299; siehe auch Kap. 3) abgeleitet werden können: Der durch die Kooperation entstehende Nutzen soll für die Mehrheit der Zielpersonen maximiert werden. Gleichzeitig sollen die entstehenden Kosten minimiert werden. Zu diesem Ziel können der Einsatz gewisser Kontaktmodalitäten, der Einsatz eines Incentives, die Reduktion der Länge bzw. des Aufwands der Befragung sowie die Nennung des Themas bzw. des Sponsors der Befragung beitragen.

5.2.1 Kontaktmodalitäten Zunächst beeinflussen die Kontaktmodalitäten den Anteil erreichter Zielpersonen. Je mehr Kontaktversuche unternommen werden können, desto geringer ist der Anteil Nicht-Erreichter. Gleichzeitig wirkt sich auch eine größtmögliche Variation der Tageszeit bei den Kontaktversuchen positiv auf die Wahrscheinlichkeit aus, eine Auskunfts- oder Zielperson zu erreichen (vgl. Goyder 1985a; Groves et al. 2004b; Purdon et al. 1999; für Telefonbefragungen Weeks et al. 1987).138 Die Kontaktmo136 Mit Ausnahme der Kleinstgemeinden des ALLBUS, für die im ALLBUS+ Spiegelgemeinden eingesetzt wurden (vgl. TNS-Infratest Sozialforschung 2008: 8). 137 Eine Ausnahme sind lediglich die sich anschließenden telefonischen und schriftlichen Nachfassaktionen, die nur beim ALLBUS+ durchgeführt wurden. Sie fanden von September bis November 2008 (telefonisch) bzw. im März/April 2009 (schriftlich) statt, so dass sich die Datenerhebung insgesamt, mit einigen zeitlichen Unterbrechungen in den Phasen der Datenbereinigung, über ein Jahr erstreckte. 138 Engel/Schnabel (2004) haben in einer umfassenden Metaanalyse mithilfe von Mehrebenenanalysen analysiert, inwiefern sich Variationen des Forschungsdesigns auf die Antwortraten auswirken. Sie zeigen dabei einen positiven Einfluss der Kontaktversuche auf die Ausschöpfung in face-to-face-Umfragen. Allerdings differenzieren sie nicht nach der Art des Ausfalls (Nicht-Erreichbarkeit, Verweigerung oder Nicht-Befragbarkeit), sondern verwenden die Responserate insgesamt als abhängige Variable. Auch für andere eingesetzte Designelemente wie personalisierte Anschreiben, eine direkte oder über die Medien indirekt vermittelte Vorankündigung der Studie oder auch Erinnerungsschreiben können anhand einer Vielzahl von Experimenten Effekte nachgewiesen werden. Allerdings

150

5 Das Design der Studie

dalitäten haben aber nicht nur einen Einfluss auf die Erreichbarkeit, sondern auch auf die Kooperationsbereitschaft der potenziell Befragten (vgl. z.B. Brehm 1994; Engel/Schnabel 2004). Grundlegend lassen sich dabei zwei Ebenen des Kontakts unterscheiden: der Kontakt zwischen Forscher und Zielperson und der Kontakt zwischen Interviewer und Zielperson. Zu den Kontaktmodalitäten gehört zunächst die Frage, in welcher Form der potenzielle Befragte mit der Studie und dem Ansinnen des Forschers in Berührung kommt. Dieser Kontakt erfolgt in der Regel durch ein Ankündigungsanschreiben, in dem verschiedene Überzeugungsstrategien eingesetzt werden können. Darin kann beispielsweise das Angebot enthalten sein, dem Befragten die Ergebnisse der Studie zukommen zu lassen. Ebenso werden persönliche zielgerichtete Appelle an die Zielperson oder auch die Foot-in-the-door-Technik139 eingesetzt (vgl. Furse et al. 1981; Groves/Magliavy 1981). In der Forschung wird angenommen, dass die Wirkung eines Anschreibens sowohl die Erwartungen der Zielperson („Ich erhalte Informationen. Das ist seriös und ich weiß, was auf mich zukommt.“) als auch die Erwartungen des Interviewers („Die Zielperson ist über mein Kommen informiert und kennt die Studie, ich kann demnach gelassener auftreten.“) positiv beeinflussen kann. Im Rahmen der sozialen Austauschtheorie (siehe Kap. 3.2.2.1) kann argumentiert werden, dass der anschließende Kontakt zwischen Interviewer und Zielperson im Rahmen der vorherigen Erfahrungen stattfindet. Die Vorabinformation stellt damit im Idealfall eine positive Erfahrung mit der Umfrage dar, die sich positiv auf die Kooperationsbereitschaft auswirkt. Darüber besteht in der Forschung weitgehend Einigkeit (vgl. Brehm 1994; de Leeuw 2005; Dillman et al. 1976; Goldstein/Jennings 2002; Groves/Couper 1998; Hembroff et al. 2005; Mann 2005; aber auch Singer et al. 2000). Zielpersonen erhalten über das Anschreiben Informationen und seitens des Forschers kann darüber ein Gefühl von Seriosität und Sicherheit transportiert werden.140 Auf diese Weise wird ein Vertrauensverhältnis aufgebaut, das es dem Interviewer erleichtert, die Zielperson von der Teilnahme zu überzeugen. In der Kosten-Nutzen-Terminologie kann man formulieren, dass mithilfe des Anschreibens der Nutzen der Studie für die Zielperson hervorgehoben wird. Gleichzeitig kann das Auftreten von Kosten, die durch Misstrauen oder Unsicherheit entstehen können, durch eine präzise Information der Zielpersonen verringert werden.

muss man dafür einschränkend berücksichtigen, dass es sich bei den untersuchten Experimenten immer um schriftliche oder telefonische, jedoch keine persönlich-mündlichen Befragungen handelte. 139 Siehe zur Foot-in-the-door-Technik auch Fußnote 67. 140 Die meisten Erkenntnisse bezüglich der positiven Wirkung schriftlicher Vorankündigungen stammen jedoch aus Experimenten innerhalb telefonischer Befragungen (siehe dazu die Metaanalyse von de Leeuw et al. 2007). Ob sich die positive Wirkung auch für face-to-face-Befragungen ergibt, die einfacher als Telefonsurveys durch die Interviewer selbst Informationen und eine seriöse Atmosphäre vermitteln könnten, ist noch nicht empirisch untersucht.

5.2 Ausschöpfungsteigernde Maßnahmen

151

Auch der Modus des ersten Kontakts zwischen Interviewer und Zielperson kann bei einer persönlich-mündlichen Befragung die Teilnahmeentscheidung einer Zielperson beeinflussen. Es zeigt sich, dass Interviewer, die einen Befragten vor ihrem ersten Besuch telefonisch kontaktieren, um einen Termin zu vereinbaren oder den Besuch anzukündigen, deutlich niedrigere Kooperationsraten erreichten als diejenigen, die die Zielpersonen ohne telefonische Vorankündigung direkt zuhause aufsuchen (vgl. Blohm et al. 2007: 104). Dafür lassen sich verschiedene Ursachen anführen: Das Tailoring, d.h. eine auf die Zielperson maßgeschneiderte Interaktion, ist für den Interviewer beim persönlichen Gespräch einfacher zu realisieren als am Telefon, da ihm eine größere Anzahl von Informationen zur Verfügung steht (vgl. auch Groves/Couper 1998; de Leeuw 1992). Zudem werden dubiose Verkaufsgespräche eher telefonisch als persönlich geführt, was bei einem Anruf zu einer falschen Einordnung der Frage und daher zu einer schnelleren Ablehnung der Zielperson führen kann (vgl. auch de Leeuw/Hox 2004: 465). Schließlich ist es für den Befragten einfacher, den Telefonhörer aufzulegen, als die Anfrage eines Interviewers, der einem mit einer persönlichen Bitte gegenübertritt, abzulehnen. Die soziale Distanz ist am Telefon größer (vgl. Blohm et al. 2007: 98). Für die durchgeführte Nonresponse-Studie wurde daher festgelegt, dass die Interviewer in jeder Bearbeitungswelle (d.h. sowohl in der Haupt- als auch in der Nachbearbeitung) mindestens vier persönliche Kontaktversuche unternehmen. Diese sollten an unterschiedlichen Wochentagen und zu unterschiedlichen Tageszeiten erfolgen. So war garantiert, dass jede Adresse mindestens acht Mal persönlich aufgesucht wurde. Auf den eigens durchgeführten Interviewer-Schulungen wurde den Interviewern zudem der Forschungsstand zu den unterschiedlichen Erfolgsraten je nach Kontaktmodus des ersten Kontakts (telefonisch/persönlich) vermittelt. Damit verbunden war der Hinweis, die Zielpersonen nur persönlich zu kontaktieren. Die Auswertung der Kontaktprotokolle des ALLBUS+ zeigt, dass diese Anweisungen weitestgehend umgesetzt wurden. Zwar wurde ein Teil der Kontaktversuche in beiden Studien dennoch telefonisch durchgeführt, im Vergleich zum regulären ALLBUS ist der Anteil telefonischer Kontaktversuche an der Gesamtzahl der Kontaktversuche im ALLBUS+ mit unter 13 Prozent zu über 17 Prozent jedoch signifikant niedriger.141 Über 95 Prozent der ersten Kontaktversuche im ALLBUS+ wurden persönlich durchgeführt, 2,1 Prozent der Kontakte erfolgten telefonisch. In den anderen Fällen ist der Modus nicht dokumentiert. Allen Zielpersonen wurde zudem ein Anschreiben zugesandt, in dem auf die Studie, den universitären Sponsor, das durchführende Institut und den Namen des Interviewers hingewiesen und über ein Incentive von zehn Euro informiert wurde. Gleichzeitig wurde diesem Anschreiben ein Informationsschreiben zum Auswahlprozess, zum Datenschutz und zum Zweck der Studie beigelegt. Über zwei angegebene Telefonnummern, eine kostenlose Nummer und die Nummer der Studien141

Das ergibt ein t-Test: p=0.000.

152

5 Das Design der Studie

leitung in Mainz, wurde den Zielpersonen die Möglichkeit gegeben, weitere Informationen einzuholen. Diese Elemente sollten die Informationskosten der Zielpersonen möglichst gering halten. Das Anschreiben wurde von erfahrenen Interviewern mitentwickelt, um es möglichst passgenau zu formulieren.142 Nach der Hauptbearbeitung wurden (fast) alle Zielpersonen, bei denen kein Interview durchgeführt wurde, erneut angeschrieben.143 Auf Basis der vorliegenden Informationen aus den Kontaktprotokollen zu den Ausfallgründen in der Hauptbearbeitung wurde das Anschreiben für die Nachbearbeitung variiert und an den jeweiligen Adressaten angepasst. Diejenigen Zielpersonen, die ihr Alter als Grund dafür angegeben hatten, nicht teilzunehmen, erhielten ein Anschreiben, in dem Gründe aufgeführt waren, warum die Teilnahme älterer Bürger für die Aussagekraft der Studie besonders wichtig ist. Dieses Anschreiben wurde zudem formal verändert und in größerer Schriftgröße gedruckt. Allen anderen Zielpersonen wurde ein allgemeiner formuliertes Anschreiben für die Nachbearbeitung zugeschickt. In beiden Versionen wurden 50 Euro als Incentive für die Teilnahme am Interview in der Nachbearbeitung angekündigt (Anschreiben siehe Anhang, B2-B4). Den Abschluss der Datenerhebung bildeten die beiden Nachfassaktionen, bei denen ein Wechsel des Erhebungsmodus stattfand. Die Grundüberlegung war, diejenigen zu erreichen, die nicht der Befragung an sich, aber dem persönlichmündlichen Befragungsmodus kritisch gegenüberstehen. Vielleicht – so die Annahme – würden sie bei einer alternativen Form der Datenerhebung teilnehmen. Bei denjenigen, bei denen eine Telefonnummer zu ermitteln war, wurde ein Telefoninterview angestrebt. Bei Zielpersonen ohne gelistete Telefonnummer wurde ein schriftlicher Fragebogen mit Rückumschlag verschickt. Die Anzahl der gestellten Fragen wurde im Nachfass noch einmal reduziert und die Befragungsdauer damit als zusätzlicher Anreiz auf etwa drei Minuten verringert. Ein monetäres Incentive wurde nicht mehr eingesetzt.144

5.2.2 Der Einsatz von Incentives Der Einsatz von Incentives zur Ausschöpfungssteigerung ist in der internationalen experimentellen Methodenforschung seit den 1970er Jahren gut erforscht (vgl. zur Übersicht die Metaanalyse von Engel/Schnabel 2004; siehe zur ethischen Perspek142

Die im ALLBUS+ eingesetzten Interviewer haben eine erste Version des Anschreibens insgesamt dreimal überarbeitet und an die Erfordernisse, die sie aus ihrer Erfahrung heraus sahen, angepasst. 143 Eine Ausnahme bilden dabei die expliziten Verweigerer, die unmissverständlich eine Teilnahme ausschließen und aus datenschutzrechtlichen Gründen nicht mehr angeschrieben werden dürfen (vgl. ADM 2007: 6; ICC/ESOMAR 2007). 144 Das forschungspraktische Argument gegen den Einsatz eines Incentives waren die daraus resultierenden Kosten. Gleichzeitig erschien ein weiterer Incentive-Einsatz aber auch aus theoretischen Überlegungen nicht notwendig, da angenommen wird, dass diejenigen Zielpersonen, bei denen ein Incentive wirkt, bereits über die 50 EuroNachbearbeitungstufe erreicht wurden.

5.2 Ausschöpfungsteigernde Maßnahmen

153

tive Groves et al. 2004b: 357).145 Man muss dabei zunächst verschiedene Formen von Incentives unterscheiden. Ein grobes Raster bietet die Einteilung in monetäre und nicht-monetäre, im Voraus (=prepaid) und im Nachhinein (=postpaid) bezahlte Anreize (vgl. etwa bei Church 1993; Engel/Schnabel 2004; Warriner et al. 1996). Gleichzeitig kann die Höhe der eingesetzten Incentives und damit deren Nutzenwert variieren.146 Nicht nur die Zielpersonen, sondern auch die Interviewer können Anreizempfänger sein (vgl. Carr et al. 2006; Miller et al. 2009; Traub et al. 2005). Der Incentive-Einsatz in großen Bevölkerungsumfragen wird jedoch nur selten experimentell kontrolliert. Meist werden Incentives dabei recht spontan während der Feldzeit eingesetzt, um eine schleppend verlaufende Ausschöpfung kurzfristig noch zu erhöhen (vgl. Wasmer/Koch 2002: 11). Die positive Wirkung von Incentives auf die Kooperationsbereitschaft von Zielpersonen gilt als empirisch bewährt (vgl. etwa Goyder 1987; Singer 2002; Singer et al. 1999b; Sudman/Bradburn 1974; Willimack et al. 1995). Auch die Metaanalyse internationaler Studien von Engel/Schnabel (2004)147 kann über alle untersuchten Befragungsformen hinweg (telefonisch, persönlich, schriftlich) drei Hauptannahmen bestätigen: Erstens wirken sich die Anreize insgesamt positiv auf die Ausschöpfung aus. Zweitens kann man feststellen, dass monetäre Anreize stärker wirken als nicht-monetäre (vgl. auch Goodstadt et al. 1977; Nederhof 1983; Singer 2002; Singer et al. 1999b: 217; Warriner et al. 1996). Drittens zeigt sich, dass im Voraus der Befragung bezahlte Incentives einen größeren Einfluss haben als im Nachhinein ausgezahlte (vgl. Berk et al. 1987; Engel/Schnabel 2004: 4).148 Diese Erkenntnisse gelten interessanterweise, obwohl Bürger in Studien angeben, sie hielten den Einsatz von Incentives nicht für wünschenswert und für unfair (vgl. Groves et al. 1999; Singer et al. 1999a). Alle drei Annahmen lassen sich theoretisch aus der handlungsleitenden Kosten-Nutzen-Analyse erklären. Die Incentives wirken dabei als positive extrinsische Nutzenanreize, die die Kosten einer Teilnahme kompensieren können (vgl. Groves et al. 2000: 299; Schräpler 2001: 5). 145

Der Großteil der Studien bezieht sich dabei jedoch auf den Einsatz von Incentives in schriftlich-postalischen Befragungen. 146 Zum Einsatz von Incentives findet sich eine Vielzahl an Beispielen aus der Forschungspraxis: So zahlt der australische Zensus 50 Dollar in bar an Befragte (vgl. Brehm 1994: 45) und auch der ALLBUS hat in der Vergangenheit – obgleich wenig kontrolliert – bereits monetäre Incentives bis 50 DM eingesetzt, um Zielpersonen zu einer Teilnahme zu motivieren (vgl. Wasmer/Koch 2002: 11). Andere Studien operieren mit kleineren Geldbeträgen, Telefonkarten, Kugelschreibern oder Lotterielosen (vgl. etwa Arzheimer/Klein 1998; Warriner et al. 1996). 147 Die Autoren haben 68 Methodenexperimente zum Einsatz von Incentives für Zielpersonen seit den 70er Jahren analysiert. Der Großteil der Forschung in diesem Bereich bezieht sich auf schriftliche Befragungen. Lediglich vier der 68 untersuchten Experimente sind im Kontext einer persönlich-mündlichen Befragung angesiedelt. Jedoch zeigen die Befunde, dass in face-to-face-Surveys die gleichen Mechanismen wie in schriftlichen Befragungen wirken, die höchstens etwas abgeschwächt sind (vgl. auch Lynn 2001). 148 Zwar sprechen die Ergebnisse von Engel/Schnabel (2004) nur für eine Wirkung von Incentives auf Ausschöpfungsquoten im Allgemeinen, da sie nicht zwischen verschiedenen Ausfallgründen unterscheiden. Man kann jedoch argumentieren, dass sich die Wirkung von Incentives hauptsächlich auf die Kooperationsbereitschaft und weniger auf Erreichbarkeit oder Befragbarkeit bezieht. Gerade bei face-to-face-Befragungen sind Erreichbarkeit und Befragbarkeit Grundvoraussetzungen dafür, dass ein Incentive eingesetzt werden kann.

154

5 Das Design der Studie

Monetäre Incentives können von der Zielperson flexibel und nach den eigenen Bedürfnissen eingesetzt werden und haben damit einen größeren individuellen Nutzen als nicht-monetäre Anreize (vgl. Groves et al. 2000: 301; Mehlkop/Becker 2007: 14). Wenn die Incentives im Voraus bezahlt werden, reduzieren sich zudem noch die Kosten, die aus der Unsicherheit einer nachträglichen Bezahlung resultieren können. Im Fall einer Auszahlung im Voraus kann die Zielperson sicher sein, das Incentive auch auf jeden Fall zu erhalten. Wenn jedoch zunächst die Leistung der Teilnahme erbracht werden muss und das Incentive als Belohnung erst im Nachhinein ausgezahlt wird, muss die Zielperson darauf vertrauen, das Incentive auch tatsächlich zu erhalten. Diese Situation ist mit einem gewissen Grad an Unsicherheit behaftet und daher möglicherweise mit größeren Kosten verbunden. Zum genauen Verlauf des Incentive-Effekts, d.h. ob sich mit zunehmender Höhe des Anreizes die Ausschöpfung immer weiter steigern lässt, gibt es keinen eindeutigen Befund. Vereinzelt werden zwar lineare Anreizeffekte nachgewiesen (vgl. Church 1993; Singer 1998; Singer 2002; Singer et al. 1999b: 223; Yu/Cooper 1983), es gibt jedoch auch konkurrierende Ergebnisse (vgl. etwa Armstrong 1975; Fox et al. 1988; Martin et al. 2001). Zum Einsatz hoher Beträge gibt es kaum Untersuchungen, da die meisten Bevölkerungsbefragungen aufgrund enger finanzieller Budgets und hoher angestrebter Fallzahlen eine recht niedrige natürliche Grenze für den Einsatz von Incentives haben.149 Inwiefern Studien aus anderen Ländern auf die Bundesrepublik Deutschland übertragbar sind, ist nicht hinreichend untersucht und wird bezweifelt. Es wird angenommen, dass die Wirkung von Incentives eng mit sozialen Normen und Traditionen zusammenhängt. Aus diesem Grund lassen sich Schlussfolgerungen von einem gesellschaftlichen Kontext nicht ohne weiteres auf einen anderen übertragen (vgl. Singer 1998: 8). In Deutschland existieren insbesondere für persönlichmündliche Befragungen keine empirischen Untersuchungen zum Einsatz von Incentives. Erkenntnisse aus Studien zu postalischen Befragungen können experimentell einen eindeutig ausschöpfungssteigernden Effekt kleinerer Incentives150 nachweisen (vgl. Arzheimer/Klein 1998; Mehlkop/Becker 2007: 5; Stadtmüller 2009). Häufig wird angenommen, dass in Deutschland weniger die Höhe des Incentives als vielmehr die symbolische Bedeutung der Etablierung einer Austauschbeziehung Relevanz habe (vgl. Hippler 1988: 245; Porst 1999: 76; Porst et al. 1998: 11). Daher wird davor gewarnt, hohe Incentives einzusetzen, da diese zu Reaktanz und einer Aufhebung des symbolischen Charakters führen könnten (vgl. Stadtmüller 2009: 170). Allerdings ist auch diese These empirisch nicht belegt. Die Folgen eines Einsatzes hoher Incentives sind bislang nicht untersucht worden. Incentives werden trotz ihrer positiven ausschöpfungssteigernden Wirkung auch kritisch gesehen. So wird vermutet, dass sie das Antwortverhalten der Befrag149

Obwohl eine Studie von Berlin et al. (1992) zeigt, dass der zunächst kostenintensive Einsatz von Incentives unter bestimmten Bedingungen dazu führen kann, die Gesamtkosten einer Studie zu reduzieren. Dabei handelt es sich um eine 6 DM-Telefonkarte bzw. den Einsatz von 5 Euro.

150

5.2 Ausschöpfungsteigernde Maßnahmen

155

ten verändern könnte, wodurch die inhaltlichen Ergebnisse verzerrt würden (vgl. Houston/Ford 1976). Studien, die versuchten diese Effekte empirisch nachzuweisen, konnten experimentell keinen Unterschied in den Einstellungen zwischen Incentive-Empfängern und Nicht-Empfängern aufzeigen (vgl. etwa Cantor et al. 2008; Davern et al. 2003; Goodstadt et al. 1977; Hansen 1980; Nederhof 1983; Shettle/Mooney 1999; Willimack et al. 1995: 78). Schwarz/Clore (1996) zeigten hingegen, dass sich die Stimmung einer Zielperson durch die Gabe von Incentives positiv beeinflussen lässt, was sich wiederum auf einen Teil der Antworten auswirken kann. Ähnliche Ergebnisse zeigen auch Studien von Curtin et al. (2007) und James/Bolstein (1990). Ein differenzierteres Bild zeichnen die Analysen von Singer et al. (2000) und Brehm (1994). Brehm beschreibt beispielsweise in Bezug auf politische Einstellungen, dass es von der spezifischen Einstellung abhängt, ob Einflüsse zu beobachten sind. Es existieren leichter zu beeinflussende Einstellungen, etwa gegenüber einer spezifischen Policy-Frage, und robustere Einstellungen, wie z.B. die generelle Bewertung von Politikern und politischen Gruppen im Allgemeinen. Dieser Befund passt zu dem im vierten Kapitel erläuterten Einstellungsbegriff, der von stabileren generalisierten und variableren spezifischen Einstellungen ausgeht. In der genannten Studie wird jedoch zugleich darauf hingewiesen, dass die Einflüsse in ihrem Ausmaß nicht derart relevant sind, dass die Daten einer Befragung durch den Einsatz von Incentives signifikant verzerrt würden (vgl. Brehm 1994: 57f.). Für die Bundesrepublik Deutschland zeigt ein Methodenexperiment (allerdings in einer postalischen Befragung), dass es – wenn überhaupt – nur marginale „unerwünschte Effekte“ (Stadtmüller 2009: 167) auf Einstellungen bzw. die strukturelle Zusammensetzung einer Stichprobe gibt (vgl. Stadtmüller 2009: 179ff.). Ein weiteres Problem im Zusammenhang mit dem Einsatz von Incentives bezieht sich auf die sogenannten „Non-Attitudes“. Unter „Non-Attitudes“ oder „Phantom Opinions“ versteht man diejenigen Personen, die auf Einstellungsfragen antworten, obwohl sie eigentlich keine Einstellung zu dem benannten Objekt aufweisen (vgl. Bishop et al. 1980; Converse 1964, 1974; Schuman/Presser 1981: 147ff.). Man könnte annehmen, dass Menschen, die nur aufgrund eines hohen monetären Anreizes an einer Befragung teilnehmen, verstärkt Einstellungen äußern, die sie gar nicht haben. Dies ließe sich aus der Rational Choice-Perspektive über verschiedene Argumente erklären: Entweder agieren die Zielpersonen derart aus materiellen Gründen, um das Geld zu erhalten, oder aus psychologischen Gründen, um dem Interviewer einen Gefallen zu tun und sich sozial erwünscht zu verhalten (vgl. Smith 1984). Diese Argumente erscheinen jedoch aus verschiedenen Gründen im Zusammenhang mit der generellen Teilnahmebereitschaft bei einer allgemeinen Bevölkerungsumfrage wie dem ALLBUS nicht unbedingt plausibel, wie im Folgenden gezeigt wird: Den Zielpersonen wird bei jeder Frage mit einer explizit vorgegebenen „weiß nicht“-Kategorie Item-Nonresponse ermöglicht, ohne dass sie mit Konsequenzen rechnen müssten. Die Befragten erhalten das Incentive, sobald sie

156

5 Das Design der Studie

grundsätzlich kooperieren, auch wenn sie auf einzelne Fragen keine Antwort geben. Gleichzeitig werden in allgemeinen Bevölkerungsumfragen nicht nur Einstellungen, sondern auch Verhaltensweisen und soziodemographische Merkmale oder Wissen abgefragt. Das bedeutet, es gibt Fragen, die jeder beantworten kann. Schließlich wird das Problem der Non-Attitudes vor dem Hintergrund der Erkenntnisse der jüngeren kognitionspsychologischen Einstellungsforschung abgemildert. Nur wenige Menschen haben tatsächlich überhaupt keine Eindrücke zu einem bestimmten abgefragten Bereich. Es gibt zwar Personen, bei denen nur wenige Eindrücke vorliegen oder bei denen die vorliegenden Orientierungen nicht einfach zu aktivieren sind. Diese könnten jedoch gerade durch ein Incentive motiviert werden, Eindrücke abzurufen, was immer noch einfacher ist, als „falsche Antworten“ zu konstruieren.151,152 Um das Problem dennoch abzumildern, werden, wenn möglich, geeignete Filterführungen eingesetzt, um die Befragten nur mit den für sie relevanten Fragen zu beschäftigen. Auch die Frage, ob monetäre Incentives nur in bestimmten Gruppen wirken, z.B. bei denen, die wenig in die Gesellschaft involviert sind (vgl. Groves et al. 2000: 301), bei gering Gebildeten (vgl. Mehlkop/Becker 2007: 13; Singer 1998: 25) oder nur bei älteren (vgl. Stadtmüller 2009: 180) bzw. jüngeren Personen (vgl. Dillman 2000: 153), wird in der Forschung diskutiert. Auch dafür gibt es jedoch keine stabilen Befunde. Schließlich wird befürchtet, dass eine „Bezahlung“ der Zielpersonen dazu führt, dass sie bei zukünftigen Studien ebenfalls ein monetäres Incentive erwarten und ohne dies eine Teilnahme verweigern. Dazu zeigen jedoch Studien, dass der Effekt ausbleibt. Vielmehr scheint die Incentivierung sogar die Umfrageeinstellung positiv zu beeinflussen, da die Zielpersonen, die bereits einmal incentiviert wurden, bei zukünftigen Studien bereitwilliger teilnehmen als nichtincentivierte Befragte (vgl. Singer et al. 1998). Alle diese Aussagen sind mit Vorsicht zu betrachten. Die Forschungsergebnisse sind nicht eindeutig und stammen in der Regel aus anderen gesellschaftlichen Kontexten. Zudem fehlt meist ein Vergleichsmaßstab, um Aussagen zur Datenqualität oder zu Einflüssen tatsächlich bewerten zu können, weil Erkenntnisse zu Verweigerern fehlen. In der hier vorliegenden Studie wurde jedoch entschieden, dass die erwünschten Effekte im Bereich der höheren Teilnahmebereitschaft im Gegensatz zu potenziell unerwünschten Effekten überwiegen. Daher wurden die Zielpersonen im Anschluss an ihre Teilnahme in der Hauptbearbeitung mit zehn Euro in 151

Aber auch Studien, die mit dem älteren Einstellungsbegriff arbeiten, zeigen, dass der Anteil an Non-Attitudes hauptsächlich von dem Druck abhängt, den die Interviewer auf die Zielpersonen ausüben, überhaupt eine Antwort zu geben (vgl. Bishop et al. 1986; Schuman/Presser 1980). Auch vor dem Hintergrund dieser Erkenntnisse erscheint das Problem der Non-Attitudes für die vorliegende Studie weniger relevant: Im ALLBUS werden die Interviewer darauf hingewiesen, keinen Druck auszuüben. 152 Studien, die den Zusammenhang des Einsatzes von Incentives mit der Antwortqualität untersuchen, zeigen, dass Incentive-Empfänger lediglich bei offenen Fragen etwas geringere Item-Nonresponse-Quoten aufweisen als nicht-incentivierte Befragte, d.h. sie antworten vollständiger (vgl. Willimack et al. 1995). Bei geschlossenen Fragen treten keine signifikanten Effekte auf. Inhaltlich unterscheiden sich die Incentive-Empfänger nicht von den Teilnehmern ohne Incentive.

5.2 Ausschöpfungsteigernde Maßnahmen

157

bar incentiviert. In der Nachbearbeitung wurde dieses Incentive noch einmal auf 50 Euro erhöht.

5.2.3 Interviewereinsatz Zu den Honorarvereinbarungen der Interviewer und damit auch dem Einsatz von Incentives bei Interviewern existieren kaum veröffentlichte Studien.153 Wenn man jedoch annimmt, dass Individuen nutzengeleitet agieren, sollten Incentives auch bei ihnen ähnlich motivierend wie bei den Zielpersonen wirken. Um die KostenNutzen-Abwägung der Interviewer positiv zu beeinflussen, wurde den Interviewern im ALLBUS+ für eine deutlich geringere Befragungszeit das gleiche Honorar pro Interview gezahlt, anschließend wurde dieses in der Nachbearbeitung noch einmal aufgestockt.154 Zunächst wurden in der Nonresponse-Studie 64 erfahrene155 Interviewer eingesetzt, die in drei Schulungen intensiv auf die Studie vorbereitet, als Teil des Projektteams motiviert und auf ihre Aufgabe „eingeschworen“ wurden. Dabei handelte es sich in der Regel um Vollzeit arbeitende Interviewer. Für die Nachbearbeitung war jedoch eine Aufstockung des Interviewerfeldes notwendig. Zum einen, um bei Aversionen der Zielpersonen gegenüber einem bestimmten Interviewer diesen in der Nachbearbeitung auswechseln zu können, zum anderen, um Anfahrtswege der Interviewer zu optimieren und die Arbeitsbelastung einzelner Interviewer zu reduzieren (siehe Kap. 5.1.2). Daher wurden im ALLBUS+ in Haupt- und Nachbearbeitung insgesamt 111 Interviewer eingesetzt, die (fast alle) auch im regulären ALLBUS Interviews durchgeführt haben. Für die sich anschließende telefonische Nachbearbeitung, die nicht mehr von TNS Infratest, sondern von GESIS in Mannheim durchgeführt wurde, wurden noch einmal neun erfahrene Telefoninterviewer eingesetzt.

5.2.4 Aufwand / Länge der Befragung Eine weitere Determinante der Kooperationsbereitschaft, die im Zusammenhang mit dem Forschungsdesign diskutiert wird, ist der Aufwand („burden“) des Befragten, an der Befragung teilzunehmen (vgl. Sharp/Frankel 1983: 36ff.). Dieser wird in der Forschung meist über die Länge des Fragebogens operationalisiert. Dabei wird bei schriftlichen Interviews die Seitenzahl oder bei mündlichen Interviews die durchschnittliche Dauer des Interviews in Minuten gemessen. Die aus dem KostenNutzen-Ansatz abgeleitete Hypothese ist, dass längere Befragungen aufgrund des 153 154 155

Man kann annehmen, dass Informationen dazu als Geschäftsinterna der Institute nicht publiziert werden. Genaue Beträge können dazu nicht angegeben werden, da es sich dabei um Institutsinterna handelt. Die durchschnittliche Erfahrung der Interviewer lag bei über 13 Jahren Institutszugehörigkeit.

158

5 Das Design der Studie

höheren Aufwands bei ansonsten konstanten Bedingungen zu niedrigeren Responseraten führen.156 Der Forschungsstand zum Einfluss der Dauer der Befragung auf die Teilnahmebereitschaft ist jedoch sehr heterogen (vgl. Bogen 1996; Hansen 2007). Zwar schätzen viele Forscher die Länge des Interviews als Determinante der Teilnahmebereitschaft ein (vgl. etwa de Heer/Israels 1992; Groves et al. 1992), es gibt aber nur wenige empirische Belege dafür (vgl. Bogen 1996).157 Gerade im Hinblick auf die Dauer des Interviews in persönlich-mündlichen Befragungen existieren kaum Untersuchungen (vgl. Burchell/Marsh 1992; Yu/Cooper 1983), die zudem durch die Kontrolle unterschiedlicher Drittvariablen zu sehr unterschiedlichen Ergebnissen kommen. Sharp/Frankel (1983) zeigen beispielsweise, dass die Länge der Befragung keine Rolle mehr spielt, wenn der Befragte vom Nutzen der Umfrage überzeugt ist. Auch dieser Befund passt jedoch zu einer grundsätzlichen Kosten-Nutzen-Vorstellung der Kooperationsentscheidung im Sinne der LeverageSalience-Theorie: Wenn der Nutzen den Aufwand übertrifft, sind die Kosten nicht entscheidend. Die Handlung – in dem Fall die Teilnahme an der Befragung – wird trotzdem ausgeführt.158 Die Probleme bei der Überprüfung des Konzepts liegen auf der Hand: Zum einen hat der Befragte im Moment der Entscheidung zur Kooperation in der Regel keine Vorstellung davon, wie lange die Befragung tatsächlich dauern wird. Meist hat er lediglich eine ungefähre Information durch den Interviewer oder das Anschreiben erhalten. Hinzu kommt, dass in Befragungen wie dem ALLBUS die angekündigte durchschnittliche Befragungszeit nur wenig Aussagekraft für die Befragung einer bestimmten Zielperson besitzt, da die Interviewlänge eine große Varianz aufweist (vgl. Wasmer et al. 2007: 72).159 Dennoch kann man annehmen, dass eine Reduktion der Befragungszeit keine negativen Effekte hat, sondern die Kosten-Nutzen-Abwägung der Zielperson entweder positiv oder gar nicht beeinflusst.160 Gleichzeitig ergaben die Aussagen der Interviewer auf den Schulungen, 156

Schon im Jahr 1920 warnte Chapin vor der Belastung der Befragten durch zu lange Fragebögen in Umfragedesigns (vgl. Chapin 1920; auch Sharp/Frankel 1983). 157 Ausnahmen sind hier die experimentellen Studien von Hansen (2007) und Galesic/Bosnjak (2009). Hansen (2007) zeigt für eine telefonische Befragung, dass eine Reduktion der Befragungszeit um fünf Minuten eine Steigerung der Responsequote um zehn Prozentpunkte bewirkt. Galesic/Bosnjak (2009) belegen in ihrer Studie den Einfluss der Länge eines Web-Fragebogens auf die Teilnahmebereitschaft. 158 Groves et al. (1999) kommen in einer experimentellen Studie zum Ergebnis, dass lange Interviews die Teilnahmebereitschaft verringern, und dass dieser Effekt auch nicht durch Incentives aufgefangen werden kann (vgl. Groves et al. 1999: 262). Hier könnte man im Sinne der theoretischen Modellierung jedoch argumentieren, dass die Incentives nicht groß genug waren. 159 Auch die Ergebnisse umfangreicher Metaanalysen lassen lediglich erkennen, dass man in diesem Bereich nicht von eindeutigen empirischen Erkenntnissen zum Einfluss und zur Wirkungsweise der Interviewlänge sprechen kann (vgl. Berdie 1973; Bogen 1996; Engel/Schnabel 2004). 160 Ein Gegenargument bietet Bradburn (1978): Er konstatiert, dass längere Fragebögen den potenziellen Befragten Seriosität und Wichtigkeit suggerieren könnten. Aus diesem Grund, so nimmt er an, könnten Länge und Ausschöpfung auch positiv korrelieren (vgl. Bradburn 1978: 37). Dieses Argument erscheint jedoch für eine Studie wie den ALLBUS von untergeordneter Relevanz. Da die Befragten zuvor bereits ein Anschreiben erhalten, sind sie über die Wichtigkeit der Studie informiert. Zudem kann man annehmen, dass es einen Schwellenwert gibt, wann Befragungen von Zielpersonen als unwichtig angesehen werden könnten. Dieser liegt, wenn er überhaupt

5.2 Ausschöpfungsteigernde Maßnahmen

159

dass sie selbst die Dauer des Interviews als einen der relevantesten Einflussfaktoren auf den Interviewerfolg einschätzen. So kann eine Reduktion der Befragungszeit dazu führen, dass, selbst wenn es keinen Effekt auf den Befragten gibt, die Interviewer motivierter und selbstbewusster in das Projekt starten. Um die daraus resultierenden positiven Effekte zu nutzen, wurde der Aufwand im ALLBUS+ im Vergleich zum regulären ALLBUS reduziert und die Befragungszeit in der Nonresponse-Studie mehr als halbiert. Die Interviewer wurden bei den Schulungen und in den Anschreiben zu jeder Welle darauf hingewiesen und auch die Zielpersonen wurden in ihrem Anschreiben zu Haupt- und Nachbearbeitung informiert, dass die Befragung maximal 20 Minuten dauern wird. Für die sich an die Nachbearbeitung noch einmal anschließenden telefonischen und schriftlichen Nachfassaktionen wurde die Befragungszeit noch einmal auf bestimmte Kernfragen reduziert, deren Beantwortung durchschnittlich nur noch etwa drei Minuten in Anspruch nahm.

5.2.5 Die Salienz des Themas der Befragung Auch die Salienz des Themas der Befragung wird in der Methodenforschung als Einflussfaktor der Kooperationsbereitschaft diskutiert (vgl. Groves/Cooper 1998; Groves et al. 1992; Steeh 1981). In der Regel können die Themen einer Studie nicht frei variiert werden, da sie vom Auftraggeber oder der untersuchten Fragestellung vorgegeben sind. Größere Befragungen wie der ALLBUS sind zudem meist Mehrthemenbefragungen. Wenn das Thema jedoch prinzipiell die Kooperationsbereitschaft beeinflusst, hat der Forscher die Möglichkeit über Einstiegsfragen oder Einleitungssätze explizit auf das Thema hinzuweisen oder dies zu unterlassen. Das bedeutet also, der Forscher oder der Interviewer muss entscheiden, ob er ein Thema betont und es damit „salient“ macht oder nicht (vgl. Groves et al. 2000). Verschiedene empirische Studien bestätigen experimentell die Hypothese, dass Antwortraten bei Studien in Spezialpopulationen höher ausfallen als in Gruppen, deren Mitglieder sich von einem Thema nicht selbst betroffen fühlen (vgl. etwa Goyder 1985a; Groves et al. 2004a; siehe für schriftliche Befragungen auch die Metaanalyse von Heberlein/Baumgartner 1978: 449).161 Auch für Umfragen in Deutschland wurde die ausschöpfungssteigernde Wirkung interessanter Einstiegsfragen und des Aufmerksamkeitswertes, den die Befragten dem Thema beimessen, untersucht und bestätigt. Diese Analysen beziehen sich jedoch nur auf schriftliche Befragungen (vgl. Porst 1999; Thoma/Zimmermann 1996). Für persönlich-mündexistiert, wahrscheinlich bei nur wenigen Minuten. Sobald eine gewisse Zeitdauer erreicht wird, kann man annehmen, dass das Argument von Bradburn keine Bedeutung mehr hat. 161 Problematisch ist zudem, dass bei den Studien meist theoretisch vorgegeben wird, welches Thema für wen interessant und welches weniger interessant sein sollte: Die Einteilung wird häufig nicht empirisch vorgenommen, was in vielen Fällen adäquater wäre.

160

5 Das Design der Studie

liche Befragungen, bei denen das Thema normalerweise entweder im Anschreiben formuliert oder informell vor Befragungsbeginn in der ersten Interaktion zwischen Interviewer und Befragtem erläutert wird, existieren dazu jedoch wiederum keine empirischen Erkenntnisse. Für die Nonresponse-Studie zum ALLBUS wurde das Thema „Politik und Gesellschaft“ benannt. Im Anschreiben wurde formuliert, dass „Informationen zur Lebenssituation und zu den Meinungen der Bevölkerung in Deutschland“ gesammelt werden und man die Chance habe, „Denkanstöße zur weiteren gesellschaftlichen Entwicklung zu liefern“.

5.2.6 Die Nennung des Sponsors der Befragung Ein weiterer potenzieller Einflussfaktor im Bereich des Forschungsdesigns ist die Wirkung, die vom Sponsor bzw. Auftraggeber der Befragung ausgehen kann. Die Nennung der Institution kann die Entscheidung zu Kooperation oder Verweigerung beeinflussen. Dazu werden in der Literatur meist drei Sponsoren-Kategorien unterschieden, für die unterschiedliche Wirkungen angenommen werden: Staatliche Sponsoren wie etwa Ministerien, universitäre Sponsoren wie Institute oder Professoren sowie Sponsoren, die aus dem Bereich der Marktforschung bzw. der freien Wirtschaft stammen (vgl. etwa Blumberg et al. 1974; Engel/Schnabel 2004; Fox et al. 1988; Linsky 1975; Yammarino et al. 1991). Studien mit universitärem und/oder staatlichem Hintergrund weisen dabei in der Regel eine höhere Ausschöpfung auf als Studien aus dem Marktforschungsbereich (vgl. Blumberg et al. 1974; Doob et al. 1973; Fox et al. 1988; Goyder 1985a; Heberlein/Baumgartner 1978; Peterson 1975; siehe aber auch die Metaanalyse von Yammarino et al. 1991).162 Hierbei kann man annehmen, dass das Vertrauen der Zielpersonen im Hinblick auf das Einhalten von Datenschutzrichtlinien gegenüber staatlichen Institutionen und Universitäten größer ist als gegenüber kommerziell arbeitenden Instituten. Das bedeutet, die subjektiv angenommenen Kosten einer Befragung, die sich auch auf die Zukunft beziehen können, sind bei kommerziellen Instituten größer, weil die Befragten nicht sicher sind, ob ihre Daten eventuell auch anderweitig verwendet werden. Im Anschreiben des ALLBUS+ wurden auf dem Briefpapier zunächst alle drei beteiligten Forschungseinrichtungen genannt (Universität Mainz, GESIS in Mannheim und TNS Infratest als durchführendes Institut), jedoch wurde der wissenschaftliche Sponsor durch die persönliche Unterschrift hervorgehoben. In der Nachbearbeitung wurde schließlich nur noch auf den universitären Sponsor ver162

Allerdings werden in vielen dieser Studien andere Drittvariablen nicht kontrolliert, daher fehlen eindeutige Erkenntnisse zu den Zusammenhängen. So zeigen James/Bolstein (1990), dass sich Designelemente gegenseitig beeinflussen können und Wechselwirkungen bestehen. Incentives können beispielsweise die Einstellung der Befragten gegenüber dem Sponsor einer Untersuchung verändern.

5.3 Zwischenfazit: Das Design des ALLBUS+

161

wiesen. Die anderen beteiligten Forschungseinrichtungen wurden nicht mehr genannt.

5.3 Zwischenfazit: Das Design des ALLBUS+ Abbildung 12 visualisiert das Gesamtdesign der Studie. Auf der linken Seite sind die Rahmenbedingungen des regulären ALLBUS, auf der rechten Seite die des ALLBUS+ zu erkennen. Insgesamt lassen sich im Standard-ALLBUS zwei, im ALLBUS+ drei Erhebungsstufen163 voneinander unterscheiden. Die Stichprobenziehung fand für beide Studien gemeinsam statt. Es wurde zunächst eine Adressstichprobe aus den Registern der Einwohnermeldeämter gezogen. Die Adressen wurden daraufhin zufällig im Verhältnis 5:1 einer der beiden Gruppen (ALLBUS/ALLBUS+) zugewiesen. Beide Teil-Stichproben wurden anschließend unterschiedlich bearbeitet. Der reguläre ALLBUS bestand aus Haupt- und Nachbearbeitungsphase (HB/NB). Vor der Hauptbearbeitung erhielten die Zielpersonen ein Anschreiben, das GESIS und TNS Infratest als durchführende Institute angab. Die Befragung dauerte durchschnittlich etwa 65 Minuten. Der Fragebogen enthielt Fragen zu den Bereichen Wirtschaft, Mediennutzung, politische Einstellungen und politische Partizipation. Daneben wurden auch Konzepte wie soziales Kapital und soziale Ungleichheit, die Staatsbürgerschaft und das Herkunftsland, der Nationalstolz sowie eine ausführliche Demographie des Befragten und der in seinem Haushalt lebenden anderen Personen erhoben.164 Alle Adressen wurden nach der ersten Bearbeitungswelle im Institut gesichtet und der Bearbeitungsstand überprüft. Anschließend wurden sie noch einmal ins Feld gegeben.165 Die Designmerkmale, wie die Dauer der Befragung, das Fehlen eines Incentives oder der Interviewereinsatz, änderten sich nicht zwischen beiden Bearbeitungsphasen, abgesehen von kleineren Ausnahmen, wie dem Austausch einzelner Interviewer (vgl. Wasmer et al. 2010).

163

Man kann von drei Erhebungsstufen sprechen, wenn man von Haupt-, Nachbearbeitung und Nachfassaktion ausgeht. Vier Erhebungsstufen resultieren, wenn man den telefonischen und den schriftlichen Nachfass noch einmal getrennt voneinander betrachtet. 164 Außerdem wurden in einer Zusatzbefragung für das ISSP (International Social Survey Programme) bei einem Teil der Stichprobe Fragen zu Freizeit und Sport oder zu Religion gestellt. 165 Bei dieser Untersuchung ist die Aufstockungsstichprobe des ALLBUS nicht berücksichtigt. Dies ist eine zusätzliche Stichprobe, die während der Feldzeit eingesetzt wurde, um trotz geringer Ausschöpfung eine bestimmte Fallzahl beim ALLBUS zu ermöglichen. Aufgrund einer Vielzahl an Argumenten (z.B. fehlender Vergleichbarkeit) wird sie im weiteren Verlauf der Untersuchung jedoch auch ausgeklammert und nicht weiter berücksichtigt. Wenn vom ALLBUS gesprochen wird, ist damit demnach immer der reguläre ALLBUS ohne die Aufstockung gemeint.

5.3 Zwischenfazit: Das Design des ALLBUS+

162

Abbildung 12: Das Design von ALLBUS und ALLBUS+ im Überblick

Stufe 1

ALLBUS: angestrebtes Brutto 6480 Adressen (40/Point)

ALLBUS+ angestrebtes Brutto 1296 Adressen (8/Point)

Anschreiben: GESIS, TNS Infratest

Anschreiben: Uni MZ (salient), GESIS, TNS Infratest

Hauptbearbeitung (65 min/0 €)

Hauptbearbeitung (30 min/10 € /ausgewählte Interviewer / höheres Interviewerhonorar) Zielgruppen-Anschreiben: Uni MZ (salient), GESIS, TNS Infratest

Stufe 2

Nachbearbeitung (65 min/0 €)

Stufe 3

Nachbearbeitung (30 min/50 € / ausgewählte Interviewer / erneut erhöhtes Interviewerhonorar) telefon. Nachfass (3 min/0 €)

Kontrollgruppe der bereits Befragten

Anschreiben: Studentin, Uni MZ schriftl. Nachfass (3 min/0 €)

Kontrollgruppe der bereits Befragten

Quelle: Eigene Darstellung

Im ALLBUS+ änderte sich das Forschungsdesign im Vergleich zum regulären ALLBUS. Gleichzeitig gab es eine Variation innerhalb der Studie zwischen Hauptund Nachbearbeitung. Auf diese Weise sollte die größtmögliche Anzahl an Personen erreicht werden, die unter Normalbedingungen Nonrespondenten wären. Bereits auf der ersten Stufe der Hauptbearbeitung wurde versucht, die Ausschöpfung deutlich zu erhöhen. Dazu wurde für die Teilnahme ein Incentive von zehn Euro in bar ausgezahlt, um den Nutzen der Teilnahme für die Zielpersonen zu erhöhen. Gleichzeitig kam ein optimiertes Anschreiben zum Einsatz, um die Informationskosten und die emotionalen Kosten einer Teilnahme bei den Zielpersonen zu reduzieren. Mit der Durchführung der Studie wurde eine Auswahl besonders erfolgreicher Interviewer des Instituts betraut, die sich durch ihre Erfahrung in ähnlichen Studien auszeichneten. Statt 65 Minuten Befragungszeit im regulären ALLBUS betrug die Befra-

5.4 Anmerkungen zur Analyse

163

gungszeit im ALLBUS+ letztlich etwa 30 Minuten. Im Anschreiben angekündigt waren 20 Minuten. Diese Reduktion wurde sowohl eingesetzt, um die Interviewer zu motivieren, als auch um die Zielpersonen so wenig wie möglich zu belasten. Inhaltlich wurden aus allen Bereichen der regulären ALLBUS-Module Fragen gekürzt. Die Befragung zu den Eigenschaften der weiteren Haushaltsmitglieder wurde vollständig gestrichen. Zudem wurde der universitäre Sponsor hervorgehoben. Im Anschluss an die Hauptbearbeitung wurden alle Adressen sowie die von den Interviewern zu jedem Kontakt ausgefüllten Protokolle des ALLBUS+ im Institut überprüft. Die expliziten Verweigerer, bei denen es datenschutzrechtliche Bedenken einer erneuten Kontaktierung gab, mussten aufgrund der ADMRichtlinien aussortiert werden. Alle restlichen Adressen wurden erneut an die Interviewer verschickt, mit der Bitte, sie noch einmal zu bearbeiten. Bei expliziten Intervieweraversionen der Ziel- bzw. Ansprechpersonen, die in den Kontaktprotokollen dokumentiert werden konnten, wurde der Interviewer ausgetauscht. In der Nachbearbeitung wurde ein zielgruppenspezifisches Anschreiben eingesetzt, d.h. bei denjenigen, die angegeben hatten, sie seien zu alt für eine derartige Befragung wurde im Anschreiben argumentiert, warum auch alte Menschen befragt werden müssen, um repräsentative Ergebnisse zu erhalten. Außerdem war in diesem Anschreiben die Schriftgröße deutlich größer. Gleichzeitig wurde in der Nachbearbeitung der Interviewerstab etwas vergrößert, um die Arbeitsbelastung der Interviewer zu reduzieren, und das Honorar der Interviewer noch einmal erhöht. Das Incentive für die Zielpersonen wurde von 10 auf 50 Euro angehoben. Nach dieser Nachbearbeitungsphase wurden zwei Nachfassaktionen („followup-studies“) mit verändertem Interviewmodus durchgeführt. Zielpersonen, von denen eine Telefonnummer ermittelt werden konnte, wurden telefonisch kontaktiert und befragt. Bei den Zielpersonen ohne Telefonnummer wurde ein schriftlicher Fragebogen verschickt. Auf dieser dritten Stufe wurde die Befragungsdauer noch einmal auf wenige Kernfragen reduziert. Zudem wurde im Anschreiben bzw. im Einleitungstext an die Hilfsbereitschaft der Zielpersonen appelliert und der universitäre Sponsor noch stärker hervorgehoben.166

5.4 Anmerkungen zur Analyse 5.4.1 Analysestrategien Um der zentralen Fragestellung auf dem Grund zu gehen und zu erklären, was Nonrespondenten in Studien mit politikwissenschaftlichen Fragestellungen charakterisiert, bietet das Design mehrere Analysemöglichkeiten. Zunächst wird analysiert, wie sich die Befragten im regulären ALLBUS von denen im ALLBUS+ un166

Dazu wurde darauf hingewiesen, dass die Studie Teil der wissenschaftlichen Abschlussarbeit einer Studentin sei.

164

5 Das Design der Studie

terscheiden. Damit kann der Frage nachgegangen werden, wie sich eine Stichprobe mit einem Anteil von etwa 60 Prozent Verweigerern von einer Studie mit einem Anteil von nur 30 Prozent Verweigerern unterscheidet (Analyse-Ebene 1). Hierbei steht die Frage im Vordergrund, welche faktischen Konsequenzen der erhöhte Aufwand auf der inhaltlichen Ebene einer großen allgemeinen Bevölkerungsbefragung mit sich bringt. Man kann jedoch zunächst nichts über Verweigerer aussagen, da im ALLBUS+ unklar ist, welche Befragten auch unter Standardbedingungen teilgenommen hätten, da dort bereits in der Hauptbearbeitung Veränderungen im Gegensatz zum regulären ALLBUS stattfanden. Für diese erste Annäherung an das Problem wird nicht zwischen Verweigerern, Nicht-Befragbaren und NichtErreichbaren unterschieden. Anschließend sollen die „Verweigerer“ und die Determinanten ihrer Handlungsentscheidung analysiert werden. Dazu werden diejenigen, die in der Hauptbearbeitung des ALLBUS+ bereit sind teilzunehmen, von denjenigen unterschieden, die eine Teilnahme zunächst verweigern (Analyse-Ebene 2). Der Fokus dieser zweiten Analyse liegt auf den Befragten des ALLBUS+, da angenommen wird, dass in dieser Studie im Vergleich zum regulären ALLBUS das Problem auf einem „höheren Niveau“ analysiert werden kann.167 „Höheres Niveau“ bedeutet in diesem Zusammenhang, dass im ALLBUS+ bereits in der Hauptbearbeitung diejenigen zusätzlich erreicht werden, die aufgrund weniger gewichtiger Gründe in der Regel nicht teilnehmen würden, jetzt aber aufgrund des 10 Euro-Incentives und der kürzeren Befragungszeit teilnehmen. Bei den dann zusätzlich in der Nachbearbeitung erreichten Zielpersonen wird erwartet, die „härteren Fälle“ zu erreichen, die erst unter größtem Aufwand überzeugt werden können. Im regulären ALLBUS kommt man an diese Personen nicht heran. Beim ALLBUS+ nehmen damit unter Standardbedingungen schon mehr Personen teil als im regulären ALLBUS. Das bedeutet, in der Nachbearbeitung wird ein größerer Teil derjenigen, die Verweigerer wären, noch konvertiert. Abbildung 13 zeigt die Analysestrategien in der Übersicht. Zunächst wird jeweils analysiert, ob und wenn ja bei welchen Merkmalen sich die beiden Gruppen (ALLBUS/ALLBUS+ in Analyse 1; Kooperative/Verweigerer in Analyse 2) bivariat unterscheiden. Anschließend sollen schrittweise multivariate logistische Regressionsmodelle gerechnet werden, um, unter Kontrolle der jeweils anderen Merkmale, Netto-Effekte auf Kooperation und Verweigerung bzw. auf die Zugehörigkeit zu einer der beiden Studienbedingungen herauszuarbeiten.

167

Zugleich könnte dieser Frage auch im regulären ALLBUS, obgleich auf niedrigerem Niveau, nachgegangen werden.

5.4 Anmerkungen zur Analyse

165

Abbildung 13: Analysestrategien Analyse 1 ALLBUS

ALLBUS+

Hauptbearbeitung

Hauptbearbeitung

Nachbearbeitung

Nachbearbeitung

Analyse 2 ALLBUS

ALLBUS+

Hauptbearbeitung

Nachbearbeitung

Nachfass K

Nachfass E

Nachfass K

Nachfass E

Quelle: Eigene Darstellung

Die erste Analyse bietet die stärker methodisch-praktische Perspektive, die zweite Perspektive ist die theoretisch interessantere. In dieser zweiten Analyse wird zunächst das im vorigen Kapitel aufgestellte Survey Variable Cause-Modell zu den Determinanten von Kooperation und Verweigerung überprüft. Im Anschluss daran sollen im Sinne des Common Cause-Modells Merkmale untersucht werden, die aus politikwissenschaftlicher Perspektive interessant sind. Für die Merkmale auf der politischen Verhaltensebene, deren Unterschiede sich nicht durch direkte Effekte erklären lassen, werden dabei indirekte Effekte modelliert.

5.4.2 Umgang mit fehlenden Werten Eine zentrale Frage für die empirische Analyse ist schließlich noch der Umgang mit einzelnen fehlenden Werten (Item-Nonresponse). Diese können aus Filtersetzungen resultieren, weil bestimmten Personen nur bestimmte Fragen gestellt werden. Sie können jedoch auch daraus resultieren, dass Personen keine Antwort wissen oder bewusst keine Antwort in Bezug auf die gestellten Fragen geben wollen. In der empirischen Forschung existieren verschiedene Vorgehensweisen zum Umgang mit Item-Nonresponse. Fälle mit fehlenden Werten können aus der Analyse ausgeschlossen werden oder die bestehenden Lücken werden gefüllt, wozu es wiederum verschiedene Verfahren gibt. Der einfachste Fall wäre, die fehlenden Werte durch den Mittelwert der gültigen Fälle zu ersetzen. Alternativ lassen sich die feh-

166

5 Das Design der Studie

lenden Werte aber auch durch Ergebnisse komplexerer Verfahren, wie etwa der multiplen Imputation, ersetzen (vgl. dazu ausführlicher Schafer/Graham 2002; Graham et al. 2003). Alle diese Ersetzungsverfahren basieren jedoch auf der Grundannahme, dass die Ausfälle „missing at random“ sind, d.h. dass sie sich zufällig verteilen. Für diejenigen Personen, die aufgrund der Filterführung gewisse Fragen nicht beantworten können, kann dies ausgeschlossen werden. Bei denjenigen, die „weiß nicht“ oder „keine Angabe“ wählen, kann man ebenfalls von einer bewussten Entscheidung ausgehen. Dies ist im Sinne der zuvor für UnitNonresponse ausgeführten handlungstheoretischen Antwort-Theorie nur konsequent. Dieser Arbeit liegt daher die Annahme zugrunde, dass Ausfälle bei einzelnen Fragen in der Regel nicht rein zufällig erfolgen, sondern Ergebnis einer rationalen Handlungsentscheidung des Individuums sind. Daher werden die fehlenden Werte nicht imputiert, sondern das „strengere“ Instrument eines fallweisen Ausschlusses gewählt. Das bedeutet, es werden je nach untersuchten Merkmalen nur diejenigen Fälle in die Analyse einbezogen, bei denen gültige Antworten vorliegen, auch wenn sich dadurch die Fallzahlen reduzieren. Eine Analyse der Häufigkeitsverteilungen aller Merkmale zeigt, dass nur manche Items hohe Nonresponse-Raten aufweisen. Bei den meisten Merkmalen liegt der Anteil der Antwortverweigerungen zwischen null und zwei Prozent der Fälle. Ausnahmen mit deutlich höheren Item-Nonresponse-Anteilen sind die Aussagen zum Vertrauen in Universitäten und Hochschulen (9,5%), die Links-Rechts-Selbsteinschätzung (8,2%), ein Teil der Items aus der Rechtsextremismus-Skala sowie die Sonntagsfrage (15,7%). Dies muss bei der anschließenden Analyse berücksichtigt werden.

5.3 Zwischenfazit: Das Design des ALLBUS+

167

6 Operationalisierung

Bevor in der empirischen Analyse die Hypothesen überprüft werden können, müssen die zentralen Konzepte der Modelle operationalisiert, d.h. messbar gemacht, werden. Die abhängige Variable im Erklärungsmodell ist die Kooperation eines Individuums an einer politischen Befragung. Darauf bezieht sich insbesondere der zweite Teil der empirischen Analyse (während der erste, wie bereits ausgeführt, zwei unterschiedlich ausgeschöpfte Stichproben miteinander vergleicht). Verweigerer sind in der vorliegenden Studie diejenigen Personen, die in der Hauptbearbeitung nicht teilgenommen haben, obwohl sie erreicht wurden und prinzipiell befragbar gewesen wären, in der Nachbearbeitung aber doch noch durch die ausschöpfungssteigernden Designelemente von einer Teilnahme überzeugt werden konnten. Der Vorteil der Messung ist, dass sie sowohl direkt beobachtbar als auch unabhängig von den Aussagen der Befragten ist. Sie bildet den Kern der weiteren Untersuchungen. Bei den erklärenden Variablen innerhalb des Modells handelt es sich weitgehend um Einstellungen und damit um nicht direkt beobachtbare, so genannte latente Merkmale. Zur Messung werden daher geeignete Indikatoren benötigt. Prinzipiell existieren dazu so genannte „Indikatorenuniversen“, aus deren Pool ein oder mehrere Indikatoren ausgesucht werden können (vgl. Guttmann 1950; Schnell et al. 2008: 134). Multiple Indikatoren minimieren dabei zufällige Messfehler (vgl. Schnell et al. 2008: 135f.).168 Aus forschungspraktischen Gründen war die Anzahl der einsetzbaren Indikatoren jedoch begrenzt, weswegen in manchen Bereichen lediglich auf wenige – eventuell auch auf nur bedingt geeignete – Indikatoren zurückgegriffen werden konnte. Außerdem wird angenommen, dass es nicht immer ein vollständig homogenes Indikatorenuniversum gibt, sondern dass mit der bewussten Auswahl bestimmter Indikatoren lediglich Annäherungen an die theoretischen Konzepte möglich sind. Im Folgenden sollen nun die Indikatoren vorgestellt werden, die zur Messung der zentralen Konstrukte der Theorie geplanten Verhaltens herangezogen werden. Dazu gehören die Indikatoren zur Messung der subjektiv wahrgenommenen und objektiven Kontrollmöglichkeiten, der Einstellung gegenüber der Teilnahme und der subjektiven Norm. Zudem wird im Anschluss daran das Konzept der politischen Partizipation operationalisiert, das exemplarisch für die möglichen indirekten Effekte im Sinne des Common Cause-Modells herangezogen wird. 168

Dies kann über das Grundprinzip der Testtheorie erklärt werden.

H. Proner, Ist keine Antwort auch eine Antwort?, DOI 10.1007/978-3-531-92721-3_6, © VS Verlag für Sozialwissenschaften | Springer Fachmedien Wiesbaden GmbH 2011

168

6 Operationalisierung

6.1 Die Indikatoren zur Messung der objektiven Kontrollmöglichkeiten Bei den für eine Befragung relevanten objektiven Kontrollmöglichkeiten wurden zuvor drei verschiedene Typen von Ressourcen unterschieden: kognitive, soziale und Zeitressourcen. Zunächst ist die Allgemeinbildung einer Person ein Maß für ihre kognitiven Ressourcen. Diese wird im ALLBUS, und daher auch in der parallel verlaufenden Nonresponse-Studie, über die formale Bildung, d.h. den höchsten erreichten Schulabschluss, erhoben. Die formale Bildung deckt jedoch nur einen Teil dessen ab, was als relevante kognitive Ressourcen für die Teilnahme an einer politischen Befragung angesehen wird. Daher wird das Konzept der politischen Informiertheit hinzugezogen, um auch spezifische politische kognitive Ressourcen, die für die Teilnahme an einer politischen Befragung relevant sein können, mit in die Analyse einzubeziehen. Der Grad politischer Informiertheit wird dabei über den individuellen Medienkonsum der Zielpersonen gemessen und ein Index gebildet, in den zu gleichen Teilen sowohl die Häufigkeit von öffentlich-rechtlichem Nachrichtenkonsum169 als auch die Häufigkeit des Tageszeitungslesens eingehen (vgl. zum Einfluss der Mediennutzung auf politische Informiertheit Schulz 2008: 165ff.). Die sozialen Ressourcen, worunter Kommunikations- und Organisationsfähigkeiten verstanden werden, sind schwieriger auf der Basis der im ALLBUS enthaltenen Indikatoren zu operationalisieren. Hierzu muss auf Hilfsannahmen aus der politikwissenschaftlichen Sozialkapitalforschung zurückgegriffen werden.170 Für die vorliegende Untersuchung wird unterstellt, dass die soziale Einbindung zur Herausbildung sozialer Ressourcen beiträgt. Daher werden die Aktivität in Netzwerken und die soziale Integration herangezogen, um den Grad sozialer Ressourcen einer Zielperson zu messen. Um die Aktivität in Netzwerken zu erheben, wird nach Vereinsmitgliedschaften der Zielperson gefragt (vgl. Gabriel et al. 2002: 42; Putnam 1993; Verba et al. 1995; van Deth 2001). Dabei wird nicht nur rein quantitativ gemessen, in wie vielen Vereinen eine Zielperson Mitglied ist, vielmehr wird auch die Qualität des Engagements berücksichtigt. So wird zunächst für verschiedene Vereinstypen zwischen keinem Engagement (0), einer reinen passiven Mitgliedschaft (0,5) und einer aktiven Mitgliedschaft bzw. der Übernahme eines Ehrenamts (1) unterschieden und jeweils angegeben, inwieweit sich eine Zielperson in dem entsprechenden Verein engagiert. Die einzelnen Items werden anschließend zu einem einfachen additiven Index zusammengefasst. Dieses Vorgehen ist nicht völlig befriedigend, da die theoretischen Konzepte nicht ganz passgenau erhoben werden und Dateninformationen verloren gehen. Es erscheint jedoch als bestmögliche Annäherung. Zudem wird bei 169

Da der Anteil politischer Nachrichten am Gesamtprogramm bei den privaten Sendern sehr gering ist und deren Schwerpunkt auf Unterhaltung liegt, wird der Konsum dieser Sender nicht mit in die Messung einbezogen. 170 Auf die Erfassung egozentrierter Netzwerke wurde aus Zeitgründen verzichtet, auch wenn diese theoretisch adäquat gewesen wären (vgl. Wasmer et al. 2010: 28).

6.1 Indikatoren zur Messung der objektiven Kontrollmöglichkeiten

169

allen Personengruppen (Kooperativen und Verweigerern) der gleiche Indikator verwendet, so dass auftretende Unterschiede zumindest einen Hinweis darauf geben können, dass soziale Ressourcen die Kooperationsentscheidung beeinflussen (vgl. Gabriel et al. 2002: 45; van Deth/Kreuter 1998). Die soziale Einbindung einer Person wird über die Häufigkeit sozialer Kontakte gemessen. Dazu wird erhoben, wie viel Zeit mit anderen Menschen im Verein, Club oder einer freiwilligen Organisation, mit Arbeitskollegen außerhalb des Arbeitsplatzes bzw. mit Freunden verbracht wird. Für jede der Kontaktformen wird gefragt, ob man dies täglich, einmal pro Woche, einmal pro Monat, seltener oder nie tue. Anschließend wird aus diesen Informationen ein Index gebildet. Die verfügbare Zeit als drittes Merkmal objektiver Kontrollmöglichkeiten zu operationalisieren ist ein schwieriges Unterfangen: Zeitressourcen sind an der Schnittstelle zwischen objektiver und subjektiver Verhaltenskontrolle anzusiedeln. Ob eine Zielperson „genügend“ Zeit besitzt, ist nur begrenzt von objektiv messbaren Merkmalen, sondern stark von der eigenen subjektiven Einschätzung und vom individuellen Zeitmanagement einer Zielperson abhängig. Man kennt dies aus der psychologischen Stressforschung, die nachweist, dass subjektive Interpretationen für die Auswirkungen von knappen Zeitbudgets als Stress entscheidend sind (vgl. etwa Antoni/Bungard 1989: 434f.). Man kann jedoch annehmen, dass bestimmte Faktoren existieren, die die Wahrscheinlichkeit, ein objektiv knappes Zeitbudget zu haben, erhöhen. Dazu zählt in besonderem Maße die Erwerbstätigkeit. Eine in Vollzeit arbeitende Person besitzt ein geringeres Zeitbudget als eine nur in Teilzeit oder gar nicht erwerbstätige Person. Für das Modell bedeutet dies, dass eine Vollzeiterwerbstätigkeit die Wahrscheinlichkeit einer Teilnahme verringern sollte, da damit ein geringeres freies Zeitbudget einhergeht. Selbstverständlich können auch andere Faktoren, wie z.B. die Kinderzahl oder das Ausmaß freiwilligen Engagements, die frei verfügbare Zeit einer Zielperson beeinflussen. Da jedoch nur eine gewisse Befragungszeit zur Verfügung steht und die Anzahl der möglichen Items begrenzt war, da zudem für den Faktor Zeit aufgrund des zuvor ausgeführten flexiblen Designs nur geringe Effekte angenommen werden, wurde an dieser Stelle auf weitere Indikatoren verzichtet. Für das freiwillige Engagement wird angenommen, dass dieses im Modell bereits im Bereich der sozialen Ressourcen über die Integration mit kontrolliert wird. Sollten bei der Analyse die sozialen Ressourcen einen negativen anstatt des erwarteten positiven Effekts aufzeigen, wird vermutet, dass dieser über das damit verbundene knappe Zeitbudget vermittelt ist.

170

6 Operationalisierung

Tabelle 1: Die Indikatoren zur Messung der objektiven Kontrollmöglichkeiten Bereich

Konzept Bildung

kognitiv: Wissen

politische Informiertheit

soziale Integration

sozial: Kommunikation und Organisation Aktivität in Netzwerken

Zeit

Erwerbstätigkeit

Indikator formale Bildung: „Welches ist Ihr höchster erreichter Schulabschluss?“ Index aus öffentlich-rechtlichem Nachrichtenkonsum und Tageszeitung lesen: „An wie vielen Tagen sehen Sie im Allgemeinen Nachrichtensendungen von ARD und ZDF?“ „Und an wie vielen Tagen in der Woche lesen Sie im Allgemeinen eine Tageszeitung?“ Häufigkeit: Zeit mit Menschen im Verein/Klub/Freiwilligenorganisation verbringen; mit Arbeitskollegen außerhalb des Arbeitsplatzes verbringen; mit Freunden verbringen. Index: Vereinsmitgliedschaft in Kultur-, Musik-, Theater- oder Tanzverein; Sportverein; Sonstige Hobbyvereinigung; Wohltätigkeitsverein oder karitative Organisation; Friedensoder Menschenrechtsorganisationen; Umwelt-, Natur- oder Tierschutzorganisationen; Verein/Organisation im Gesundheitsbereich, Selbsthilfegruppe; Elternorganisation; Verein für Pensionierte, Rentner, Seniorenverein; Bürgerinitiative. hauptberufliche Erwerbstätigkeit, ganztags; hauptberufliche Erwerbstätigkeit, halbtags; nebenher/nicht erwerbstätig.

Quelle: Eigene Darstellung.

6.2 Die Indikatoren zur Messung der subjektiv wahrgenommenen Verhaltenskontrolle Nicht nur die objektiven Kontrollmöglichkeiten, sondern auch das Selbstbild eines Individuums trägt zur Entscheidung zwischen Kooperation oder Verweigerung bei. Ein Individuum muss glauben, eine Handlung ausführen zu können. Innerhalb der Theorie geplanten Verhaltens wirkt sich das Selbstbild über das Konzept der wahrgenommenen Kontrollerwartung aus. Es wird vermutet, dass mit zunehmendem politischen Kompetenzbewusstsein und zunehmendem politischen Wissen der

6.3 Indikatoren für Einstellungen zur Teilnahme an einer pol. Befragung

171

Glaube, an einer politischen Befragung teilnehmen zu können, ansteigt. Zu deren Messung wird zum einen auf das subjektive politische Wissen sowie auf das Konzept der internen politischen Efficacy rekurriert. Um die Einschätzung der Zielpersonen über ihr politisches Wissen zu erfragen, wurden sie gebeten anzugeben, wie sie zu der Aussage „Im Allgemeinen weiß ich eher wenig über Politik“ stehen. Das subjektive politische Kompetenzgefühl, d.h. die interne politische Efficacy, wird über klassische ALLBUS-Indikatoren erhoben: Inwiefern traut sich eine Person zu, „in einer Gruppe, die sich mit politischen Fragen befasst, eine aktive Rolle zu übernehmen“ und wie sehr lehnt sie die Aussage „Die ganze Politik ist so kompliziert, dass jemand wie ich gar nicht versteht, was vorgeht“ ab. Auf diese Weise wird nicht das allgemeine Selbstbewusstsein der Zielpersonen abgefragt und auch kein Bezug zum Selbstbewusstsein hinsichtlich einer Umfrageteilnahme im Allgemeinen hergestellt, sondern spezifisch auf den politischen Bereich Bezug genommen. Variablen, die geeignet wären allgemeine Persönlichkeitsmerkmale171 abzufragen (z.B. Extraversion), um allgemeinere Aussagen über die wahrgenommene Verhaltenskontrolle zu treffen, sind im Datensatz nicht enthalten. Daher können sie auch nicht mit herangezogen werden. Tabelle 2: Die Indikatoren zur Messung der subjektiven Kontrollmöglichkeiten Bereich

wahrgenommene Verhaltenskontrolle

Konzept

interne Efficacy

politisches Wissen

Indikator „Ich traue mir zu, in einer Gruppe, die sich mit politischen Fragen befasst, eine aktive Rolle zu übernehmen.“ „Die ganze Politik ist so kompliziert, dass jemand wie ich gar nicht versteht, was vorgeht.“ (umgepolt) Ablehnung der Aussage: „Im Allgemeinen weiß ich eher wenig über Politik.“

Quelle: Eigene Darstellung.

6.3 Die Indikatoren zur Messung der Einstellung gegenüber der Teilnahme an einer politischen Befragung Neben den bislang genannten subjektiv wahrgenommenen und objektiv vorhandenen Ressourcen sind weitere Orientierungen und generalisierte Einstellungen für die Bildung einer spezifischen Einstellung gegenüber der Teilnahme – und damit für die Handlungsentscheidung des Individuums – relevant. Dazu zählen politische und soziale sowie Umfrageeinstellungen. Sowohl aus forschungspraktischen als auch aus inhaltlichen Gründen konnte nicht das gesamte Spektrum aller potenziell

171

Persönlichkeitsmerkmale sind in der Regel nur über sehr aufwändige Skalen annähernd adäquat zu messen.

172

6 Operationalisierung

relevanten Indikatoren integriert werden, um die Einstellungen der Zielpersonen gegenüber den drei Bereichen umfassend abzubilden. Bei der Messung der allgemeinen Umfrageeinstellung kam die Überlegung hinzu, dass direkte Fragen zur Bewertung von Umfragen zwar vielleicht einen Erklärungsbeitrag für die Teilnahme an einer Befragung im Allgemeinen leisten können. Gleichzeitig wurde aber angenommen, dass diese Merkmale für die explizit inhaltliche Frage: „Wie unterscheiden sich Teilnehmer und Nicht-Teilnehmer in Studien mit politikwissenschaftlichen Fragestellungen im Hinblick auf ihre politischen Einstellungen und Verhaltensweisen?“ weniger relevant sind. Aus diesem Grund wurde bewusst auf einen Teil der Fragen zur allgemeinen Umfrageeinstellung (z.B. zum Interesse an Umfragen, zum Spaß beim Ausfüllen, zur Erfahrung mit Umfragen) verzichtet. In die Analyse einbezogen wurde lediglich die Einstellung der Zielpersonen gegenüber Partizipationsnormen, um eine allgemeine Einschätzung der Einstellung gegenüber politischer und gesellschaftlicher Beteiligung zu erhalten. Zudem wurde auf das Konzept der externen politischen Efficacy rekurriert. Dieses ermöglicht eine Annäherung an die Einschätzung der Relevanz von Umfragen. Damit werden auch im Bereich der Umfrageeinstellung diejenigen Indikatoren ausgewählt, die in vielen anderen politikwissenschaftlichen Forschungskontexten vertreten sind. In welcher Art und Weise für diese beiden Konzepte Effekte angenommen werden, soll im Folgenden kurz begründet werden. Es wird vermutet, dass Personen, die Partizipationsnormen einen hohen Wert zuschreiben, eher an Befragungen teilnehmen als Personen, die einer aktiven Beteiligung skeptisch gegenüberstehen. Um die Nähe einer Zielperson zu Beteiligungsnormen zu operationalisieren, wurde auf das – nicht unproblematische – Wertekonzept von Inglehart zurückgegriffen und angenommen, dass Postmaterialisten Beteiligungswerte höher schätzen als Materialisten. Das Konzept wird in der Forschung kritisiert, weil sowohl die theoretische Fundierung als auch die Reliabilität und Validität des Messinstruments von Inglehart einige Schwachstellen aufzeigen (vgl. neben vielen anderen Klein 1995; Klages 1992). Da der Inglehart-Index hier aber nicht verwendet wird, um explizit materialistische oder postmaterialistische Werthaltungen zu erheben, sondern lediglich, um eine Nähe zu Beteiligungswerten zu messen, ist es durchaus zweckmäßig, ihn zu integrieren. Postmaterialisten geben an, dass ihnen die Werte, die Bürger sollten „mehr Einfluss […] auf die Entscheidungen der Regierung“ haben und „Schutz des Rechts auf freie Meinungsäußerung“ sehr wichtig sind. Beide Aussagen erfüllen in diesem Zusammenhang ihren Zweck: Sie drücken eine inhaltliche Nähe zu demokratischen Beteiligungsnormen aus.172

172

Die Integration des Inglehart-Indexes erscheint zudem geeignet, da er – unabhängig von der aufgezeigten Kritik – immer noch in zahlreichen politikwissenschaftlichen Studien als unabhängige oder abhängige Variable enthalten ist. Aus diesem Grund kann ein Vergleich von Respondenten und Nonrespondenten zeigen, inwiefern hierbei Verzerrungen auftreten können.

6.3 Indikatoren für Einstellungen zur Teilnahme an einer pol. Befragung

173

Um zu messen, wie relevant eine Zielperson politische Umfragen einschätzt, wird auf das Konzept der externen politischen Efficacy Bezug genommen. Darunter wird die antizipierte Responsivität des politischen Systems verstanden, d.h. die wahrgenommene Chance der Bürger, auf politische Prozesse Einfluss nehmen zu können. Bei der externen Efficacy handelt es sich um eine Einstellung an der Schnittstelle zwischen Umfrageeinstellung und politischer Einstellung. Als Hilfsannahme wird vermutet, dass ein hohes Maß externer politischer Efficacy eine Voraussetzung dafür ist, dass man annimmt, mit der Teilnahme an einer Umfrage etwas bewegen zu können. Ursprünglich wurde das Konzept der Efficacy bereits in einer frühen Studie von Campbell et al. (1954) eingesetzt, dort jedoch noch eindimensional betrachtet: Politische Efficacy wurde dabei als das Gefühl definiert, „that political and social change is possible, and that the individual citizen can play a part in bringing about this change“ (Campbell et al. 1954: 191). Seit einer Studie von Balch (1974) konnte die – zuvor nur theoretisch formulierte – Annahme zweier unterschiedlicher Dimensionen empirisch belegt werden. Interne politische Efficacy bezieht sich dabei, wie im vorangegangenen Abschnitt erläutert, auf das Selbstbild einer Person; externe politische Efficacy bezieht sich hingegen auf die Wahrnehmung des politischen Systems und damit auf die Frage, ob das Individuum annimmt, das System würde auf seine (politische) Aktivität reagieren (vgl. Vetter 1997a, 1997b). Damit verbunden ist dann auch die Annahme, dass Umfragen für den politischen Bereich von Bedeutung sind. Mit welchen Indikatoren das Konzept letztlich erhoben wird, ist nicht unumstritten. Es existieren einerseits klassische Indikatoren des Efficacy-Konzepts, andererseits neuere Indikatoren, die in der Forschung diskutiert werden. Zudem ist die Zuordnung einzelner Indikatoren zu den beiden Dimensionen des Konzepts nicht ganz unproblematisch. Einen Überblick über die damit verbundene Diskussion gibt Vetter (1997a: 51ff.). In der vorliegenden Untersuchung wurde auf die klassischen Efficacy-Indikatoren des ALLBUS zurückgegriffen, die in der Trendstudie über die Zeit konstant gehalten wurden. Dazu gehören die drei Aussagen: „Die meisten Politiker interessieren sich in Wirklichkeit gar nicht für die Probleme der einfachen Leute“, „Die Politiker kümmern sich nicht viel darum, was Leute wie ich denken“ und „Die Politiker bemühen sich im Allgemeinen darum, die Interessen der Allgemeinheit zu vertreten“, die in eine Richtung umgepolt und anschließend zu einem einfachen additiven Index zusammengefasst werden. Diese nun erläuterte sparsame Messung der Umfrageeinstellung führt dazu, dass im Modell eventuell relevante erklärende Variablen fehlen. Vergleicht man die ausgewählten Indikatoren mit dem im vierten Kapitel aufgestellten Modell (Kap. 4.5.2, Abb. 9) stellt man fest, dass zwei Konstrukte, deren Einfluss theoretisch diskutiert wurde, empirisch nicht gemessen werden können. Dabei handelt es sich um den Spaß an Umfragen und die Erfahrung mit Umfragen. Zu beiden Merkmalen sind im Datensatz keine geeigneten Indikatoren enthalten, weswegen die damit verbundenen Hypothesen H4.2.3 und H4.2.4 ungeprüft bleiben. In der

174

6 Operationalisierung

Gesamtbetrachtung wirkt sich dies jedoch nicht auf die Schätzung des Einflusses der anderen Determinanten aus, sondern reduziert höchstens die Gesamterklärungskraft des Modells.173 Die politischen Einstellungen wurden ausführlicher als die allgemeine Umfrageeinstellung in den Fragebogen integriert. Auch von ihnen wird theoretisch ein Einfluss auf die Kooperationsbereitschaft angenommen. Sie sind zugleich aus politikwissenschaftlicher Perspektive besonders relevant für diese Studie. Zum einen werden von ihnen Einflüsse auf die Teilnahme an politischen Befragungen angenommen. Zum anderen ist anzunehmen, dass die Konsequenzen, die sich aus potenziellen Verzerrungen bei den politischen Einstellungen aufgrund von Nonresponse ergeben, für die empirische politikwissenschaftliche Forschung von großer Bedeutung sind, weil politische Einstellungen eine wichtige Rolle bei der Erklärung zahlreicher politikwissenschaftlich interessanter Phänomene einnehmen. Politische Einstellungen, von denen ein Einfluss auf die Teilnahmebereitschaft angenommen wird, sind das Institutionenvertrauen und die (Un-) Zufriedenheit mit dem politischen System.174 Auch die bereits im Bereich der Umfrageeinstellung erwähnte externe politische Efficacy könnte man als Einstellung gegenüber dem politischen System mit in die Analyse einbeziehen. Zwar wird damit zunächst die Relevanz von Umfragen abgebildet, man kann sie aber auch als einen Indikator für die Zufriedenheit einer Zielperson mit dem politischen System einsetzen (siehe Abb. 9, Kap. 4.5.2). Zudem wurde das politische Interesse mit in das Modell integriert, bei dem es sich im engeren Sinne nicht um eine Einstellung handelt, da Interesse an sich keine positive oder negative Bewertung eines Objekts enthält. Allerdings kann man argumentieren, dass mit dem Interesse gemessen wird, ob überhaupt Reaktionen auf ein Einstellungsobjekt, in dem hier vorliegenden Kontext bezieht sich das Interesse auf den Bereich des Politischen, existieren. Der Gegenpol zum Interesse wäre Gleichgültigkeit. Interesse beinhaltet, dass Reaktionen auf ein Objekt vorliegen, die dann sowohl positiv als auch negativ ausgeprägt sein können. 173 Empirisch lässt sich zeigen, dass das Auslassen von erklärenden Variablen in (linearen und logistischen) Regressionsmodellen insbesondere dann zu verzerrten Schätzern führt, wenn die ausgelassene Variable mit den anderen erklärenden Variablen hoch korreliert (für lineare Regressionsmodelle vgl. die mathematische Herleitung z.B. bei von Auer 2005: 248ff.; für logistische Regressionsmodelle vgl. die Simulationsexperimente bei Kühnel 1993: 174ff.). In diesem Fall gibt es eine Verzerrung im Hinblick auf das Komplettmodell. Sind sie unkorreliert, tritt keine oder nur eine geringe Verzerrung auf. Für die Erfahrung mit Umfragen und den erwarteten Spaß bzw. die Abwechslung durch die Teilnahme wird angenommen, dass sie mit den anderen im Modell enthaltenen erklärenden Variablen weitgehend unkorreliert sind. Kühnel (1993: 177) zeigt zudem gleichzeitig, dass die sparsamen Modelle konsistent und erwartungstreu sein können, da ein „Komplettmodell“, so argumentiert er, eher eine theoretische Konstruktion darstellt. Bei der Modellierung gilt es daher immer abzuwägen, ob Variablen notwendig sind oder ob zum Zwecke der Komplexitätsreduktion auf Variablen verzichtet werden kann. Bei einer Modellierung geht es ja gerade darum, die Komplexität der Realität zu reduzieren und nur die wesentlichen Effekte aufzuzeigen. 174 Damit lehnt sich die Operationalisierung an Eastons Konzept politischer Unterstützung, neuere Konzepte der politischen Kulturforschung (vgl. Fuchs 2002; Norris 1999) und die Arbeiten zu politischer (Un-) Zufriedenheit bei Farah et al. (1979) an (vgl. auch Arzheimer 2002: 182).

6.3 Indikatoren für Einstellungen zur Teilnahme an einer pol. Befragung

175

Das politische Interesse wird auf einer fünfstufigen Skala erhoben. Die Zielpersonen sollten angeben, wie stark sie sich für Politik interessieren. Bei der Zufriedenheit mit dem politischen System werden verschiedene Dimensionen unterschieden: Zunächst wurde nach der Zufriedenheit mit der Demokratie als Staatsform gefragt und damit die Bindung an demokratische Werte gemessen (vgl. Fuchs 2002: 37). Zweitens wurde die Zufriedenheit mit der Umsetzung der Demokratie in Deutschland erhoben, da man zwar mit der Idee der Demokratie zufrieden sein, dennoch die konkrete Umsetzung des Modells kritisch betrachten kann (vgl. Fuchs 1997; Völkl 2005: 251). Drittens wurde die Zufriedenheit mit der Performanz, d.h. der Leistung der Bundesregierung, erfragt, um die Unterstützung der Akteure in das Modell einzubinden. Bei anderen Studien wird noch einmal zwischen der Regierungsperformanz und der Unterstützung einzelner Akteure differenziert (vgl. etwa Norris 1999). Da die letztgenannte Dimension zu wenig generalisiert erschien, wurde mit der Unterstützung der Institutionen ein weiterer Aspekt integriert, der sich in seiner Abstraktion zwischen der sehr allgemeinen Frage nach der Regierungsperformanz und der sehr konkreten Frage der Unterstützung einzelner Akteure ansiedeln lässt (vgl. Norris 1999: 10).175 Um das Institutionenvertrauen zu messen, wurden die Zielpersonen gebeten anzugeben, wie sehr sie (jeweils auf einer Skala von 1 bis 7) sieben zentralen Institutionen des politischen Systems der BRD vertrauen. Dabei handelt es sich um den Bundestag, die Bundesregierung, das Bundesverfassungsgericht, die Justiz, die Polizei, die Stadt- und Gemeindeverwaltung sowie politische Parteien. Eine Faktorenanalyse zeigt, dass von den Zielpersonen empirisch keine unterschiedlichen Dimensionen wahrgenommen werden, sondern alle Items hoch auf einen Faktor laden (siehe Anhang, Tab. A36). Daher wurden auch keine unterschiedlichen Vertrauens-Dimensionen berücksichtigt, sondern ein Mittelwert-Index über alle Items gebildet. Neben der Einstellung gegenüber Umfragen und der Einstellung gegenüber dem politischen System können auch soziale Orientierungen die Einstellung einer Zielperson gegenüber der Teilnahme an einer Befragung und damit ihre Teilnahmebereitschaft beeinflussen. Dazu wird in der vorliegenden Studie das Vertrauen in die Mitmenschen analysiert, das sowohl direkt als auch indirekt erhoben wird. Die Zielpersonen sollten dazu ihr Vertrauen in andere Menschen und ihre Angst vor Kriminalität im direkten Wohnumfeld angeben. 175

In der Forschung wird angenommen, dass es sich beim Institutionenvertrauen zunächst um eine Bewertung der politischen Elite handelt. Damit ließe es sich in der Terminologie Eastons als Bewertung der Autoritäten bezeichnen (vgl. Easton 1965b; Craig et al. 1990; Fuchs et al. 2002: 442). Jedoch sprechen empirische Befunde dafür, dass es sich beim Institutionenvertrauen um mehr als die Bewertung der politischen Elite handelt. Verschiedene Autoren argumentieren, dass mit dem Konzept zugleich auch Einstellungen gegenüber dem Regime insgesamt abgefragt werden (vgl. Walter-Rogg 2005: 133; Fuchs et al. 2002: 443). Beim Institutionenvertrauen lassen sich zudem verschiedene Dimensionen unterscheiden: Almond et al. (2000: 39ff.) differenzieren beispielsweise zwischen Entscheidungs- und Implementationsinstitutionen, Walter-Rogg (2005: 141) ergänzt diese dichotome Unterscheidung um das Vertrauen zu den Politikern und den Parteien. Darauf wird jedoch im Folgenden nicht weiter eingegangen.

176

6 Operationalisierung

Tabelle 3: Die Indikatoren zur Messung der Einstellung gegenüber dem Verhalten Bereich

Konzept Partizipationsnormen

Umfragen externe Efficacy

politisches Interesse

Institutionenvertrauen

Politik

Zufriedenheit mit dem politischen System

Gesellschaft

Vertrauen in Mitmenschen

Quelle: Eigene Darstellung.

Indikator Wichtigkeit des Items „Schutz des Rechts auf freie Meinungsäußerung“ „Die meisten Politiker interessieren sich in Wirklichkeit gar nicht für die Probleme der einfachen Leute.“ / „Die Politiker kümmern sich nicht viel darum, was Leute wie ich denken.“ / „Die Politiker bemühen sich im Allgemeinen darum, die Interessen der Allgemeinheit zu vertreten.“ „Wie stark interessieren Sie sich für Politik?“ (5-stufige Skala von „sehr stark“ bis „überhaupt nicht“) additiver Index: Vertrauen in Bundestag, Bundesregierung, Bundesverfassungsgericht, Justiz, Polizei, Stadt-/Gemeindeverwaltung, pol.Parteien „Wie sehr sind Sie grundsätzlich für oder grundsätzlich gegen die Idee der Demokratie?“ „Wie zufrieden oder unzufrieden sind Sie – alles in allem – mit der Demokratie, so wie sie in Deutschland besteht?“ „Wie zufrieden sind Sie – insgesamt betrachtet – mit den gegenwärtigen Leistungen der Bundesregierung?“ „Manche Leute sagen, dass man den meisten Leuten trauen kann. Andere meinen, dass man nicht vorsichtig genug sein kann im Umgang mit anderen Menschen. Was ist Ihre Meinung dazu?“ „Gibt es in der unmittelbaren Nähe zu Ihrem Wohnort – so im Umkreis von einem Kilometer – irgendeine Gegend, wo Sie nachts nicht alleine gehen möchten?“

6.4 Die Indikatoren zur Messung der subjektiven Norm

177

6.4 Die Indikatoren zur Messung der subjektiven Norm Im theoretischen Teil wurde bereits argumentiert, dass soziale Einstellungen nicht nur relevante Orientierungen zur Herausbildung einer Einstellung gegenüber dem Verhalten sind. Sie können zugleich auch über den Pfad der subjektiven Norm das Handeln des Individuums beeinflussen. Damit wird die soziologische Perspektive in das Modell integriert. Unter der subjektiven Norm wird dabei eine antizipierte gesellschaftliche Partizipationsnorm verstanden, d.h. die Annahme einer Zielperson, ihr soziales Umfeld erwarte eine Teilnahme und würde eine Nicht-Teilnahme negativ sanktionieren. Die wahrgenommene innere Verpflichtung, etwas für die Gesellschaft tun zu wollen, wird in dieser Studie zunächst über ein klassisches Item aus der Wahlforschung gemessen, die Wahlnorm. Die Hilfsannahme ist, dass die Wahlnorm auch das allgemein empfundene Pflichtgefühl des Individuums gegenüber der Gesellschaft widerspiegelt. Zudem wurde im theoretischen Teil bereits ausgeführt, dass angenommen wird, dass das Gefühl der Pflicht gesellschaftlicher Beteiligung bei denjenigen, die der Gesellschaft nahe stehen, ausgeprägter ist als bei Personen, die von der Gesellschaft entfremdet sind. Aus diesem Grund wird auch der Grad an Distanz bzw. Nähe einer Zielperson gegenüber der Gesellschaft als Indikator zur Messung des verinnerlichten Pflichtbewusstseins herangezogen. Dazu wird die Entfremdung einer Zielperson vom gesellschaftlichen System gemessen. Die Zielpersonen werden gebeten, ihre Einstellung zum Umgang der Menschen miteinander in der Gesellschaft einzuschätzen; sie sollen angeben, inwieweit sie der Meinung sind, man könne es noch verantworten, Kinder auf die Welt zu bringen und sollen ihre Einstellung gegenüber der Aussage „Egal, was manche Leute sagen, die Situation der einfachen Leute wird nicht besser, sondern schlechter“ auszudrücken. Aus den drei Items wird ein additiver Index zur Messung der Anomie176 gebildet.177 Auf diese Weise kann gemessen werden, ob die Zielpersonen ein eher optimistisches oder ein eher pessimistisches Bild von der Zukunft der Gesellschaft haben und ob sie sich eher integriert oder entfremdet fühlen. Schließlich wurde argumentiert, dass die Wahrnehmung der eigenen ideologischen Position im Vergleich zum Wertesystem der Gesamtgesellschaft die Teilnahmebereitschaft beeinflusst. Daraus resultiert die Annahme, dass Menschen mit extremen politischen Einstellungen eine Teilnahme an einer politischen Befragung eher verweigern (H5.4). Wie bereits im theoretischen Teil ausgeführt, wird hierbei 176

Die Begriffe Anomie und Anomia werden aus pragmatischen Gründen synonym verwendet, auch wenn sich die Autorin bewusst ist, dass beide Begriffe in der Forschung leichten Differenzierungen unterliegen. 177 Srole (1956: 712f.) arbeitet in seiner Studie fünf Items zur Messung der Anomie, oder „Anomia“, wie er sie bezeichnet, heraus. Die ersten beiden, politische Machtlosigkeit und das Gefühl, die Zukunft sei unvorhersehbar, werden in dieser Studie jedoch nicht mit berücksichtigt. Bei der ersten Dimension wird eine inhaltliche Überschneidung mit dem Konzept der politischen Efficacy angenommen, die zweite erscheint deckungsgleich zur vierten Dimension, der Einschätzung der Zukunft. Daher werden nur die von Srole als dritte bis fünfte Dimension bezeichneten Indikatoren zur Messung von Anomie einbezogen (vgl. Srole 1956: 713).

178

6 Operationalisierung

insbesonders für rechtsextreme Einstellungen angenommen, dass sie die Teilnahmebereitschaft beeinflussen, da in der Bundesrepublik Deutschland hiergegen ein breiter gesellschaftlicher Konsens wahrgenommen wird. Zur Messung rechtsextremer Einstellungen wird die Mainzer Rechtsextremismusskala verwendet (vgl. Falter 1994: 136ff.). Gleichzeitig könnten natürlich auch Menschen mit linksextremen Einstellungen sich selbst als weit entfernt von der gesellschaftlichen Wertebasis empfinden. Um auch diese Überlegung einzubeziehen, wurde die ideologische Position der Zielpersonen als Selbsteinschätzung auf der Links-Rechts-Achse erhoben. Damit moderate von extremen Einstellungen unterschieden werden können, wurde das arithmetische Mittel aller Befragten als moderate Einstellung betrachtet, für jede Zielperson wurde dann die Entfernung von diesem Mittelwert berechnet. Insgesamt wird damit zur Erklärung von Kooperation und Verweigerung ein sparsames Modell aufgestellt. Problematisch ist, dass nicht alle relevanten Konstrukte ideal gemessen werden können. Gewisse Dimensionen, etwa im Bereich der Umfrageeinstellung, können nicht mit modelliert werden, da geeignete Indikatoren im Datensatz fehlen. Dies schränkt die kausalanalytische Interpretation des Erklärungsmodells ein. Gleichzeitig muss man jedoch festhalten, dass jede Modellierung eine Komplexitätsreduzierung der Tatsachen vornimmt und nie alle Facetten potenzieller Determinanten einer Handlung erfasst werden können. Die nun ausgewählten Indikatoren bieten eine gute Annäherung an die theoretischen Konstrukte innerhalb des Erklärungsmodells.

6.5 Die Messung des politischen Partizipationsniveaus

179

Tabelle 4: Die Indikatoren zur Messung der subjektiven Norm Bereich

Konzept geteilte Normen und Werte

Anomie/Entfremdung

Einstellung gegenüber der Gesellschaft

extreme Einstellungen

Indikator Wahlnorm: „In der Demokratie ist es die Pflicht jedes Bürgers, sich regelmäßig an den Wahlen zu beteiligen.“ „Egal was manche Leute sagen, die Situation der einfachen Leute wird nicht besser, sondern schlechter.“ „So wie die Zukunft aussieht, kann man es kaum noch verantworten, Kinder auf die Welt zu bringen.“ „Die meisten Leute kümmern sich in Wirklichkeit gar nicht darum, was mit ihren Mitmenschen geschieht.“ Rechtsextremismusskala: Grad der Zustimmung zu „Ich bin stolz, ein Deutscher zu sein.“; „Wir sollten endlich wieder Mut zu einem starken Nationalgefühl haben.“; „Unter bestimmten Umständen ist eine Diktatur die bessere Staatsform.“; „Der Nationalsozialismus hatte auch seine guten Seiten.“; „Ohne die Judenvernichtung würde man Hitler heute als einen großen Staatsmann ansehen.“; „Die Bundesrepublik ist durch die vielen Ausländer in einem gefährlichen Maß überfremdet.“; „Ausländer sollten grundsätzlich ihre Ehepartner unter ihren eigenen Landsleuten auswählen.“; „Auch heute noch ist der Einfluss von Juden zu groß.“; „Die Juden haben einfach etwas Besonderes und Eigentümliches an sich und passen daher nicht so recht zu uns.“; „Anschläge auf Asylbewerberheime kann ich gut verstehen.“ Links-Rechts-Selbsteinschätzung

Quelle: Eigene Darstellung.

6.5 Die Messung des politischen Partizipationsniveaus Im Common Cause-Modell (siehe Kap. 4.6) wurde angenommen, dass politische Partizipation und die Teilnahme an Umfragen von ähnlichen Hintergrundvariablen beeinflusst werden. Aus diesem Grund wäre dann auch die Messung politischer Partizipation von Verzerrungen durch Nonresponse betroffen (vgl. Voogt/Saris 2003). Um diese Frage empirisch untersuchen zu können, muss auch das Konzept der politischen Partizipation möglichst umfassend operationalisiert werden. In An-

180

6 Operationalisierung

lehnung an die Definition von Kaase/Marsh (1979: 42), Verba/Nie (1972: 2) oder auch Kaase (1997: 160) wurde politische Partizipation als freiwillige intentionale Handlung definiert (vgl. bereits Kap. 4.4). Damit werden nur solche Tätigkeiten als politische Partizipation untersucht, bei denen man annimmt, die Bürger handelten, um politische Entscheidungen dadurch bewusst zu beeinflussen (siehe allgemein zum Begriff der Partizipation van Deth 1997; Schlozman 2002). Innerhalb dieser Definition lassen sich verschiedene Dimensionen politischer Partizipation herausarbeiten. Zu Beginn der Partizipationsforschung in den 1960er Jahren dominierte eine eindimensionale Strukturvorstellung von politischer Beteiligung: Besonders Milbrath (1965: 20) verdeutlicht mit der Partizipationspyramide dieses hierarchische und kumulative Partizipationsverständnis. Bei der Aufstellung verschiedener Beteiligungsmöglichkeiten wurde angenommen, dass derjenige, der sich auf einer höheren Stufe beteiligt, auch alle darunterliegenden Aktivitäten ausfüllt. So unterschied Milbrath Inaktive, Zuschauer (die etwa wählen, politische Stimuli nutzen, Geld spenden oder Veranstaltungen besuchen) und Gladiatoren (die in Parteien aktiv sind, für Ämter kandidieren oder auch Spenden sammeln) (vgl. Milbrath/Goel 1977: 17). Diejenigen, die in politischen Parteien mitarbeiten, würden in dieser Vorstellung auch Geld spenden und wählen gehen. Anders formuliert steigt der Grad des Engagements in dieser Vorstellung mit der Ausübung verschiedener Formen des Engagements. Diese Vorstellung wandelte sich jedoch. Verba/Nie konstatieren: „There are many types of gladiators engaging in different acts with different motives and different consequences” (Nie/Verba 1975: 7). Neuere Modelle politischer Partizipation sind daher differenzierter und gehen von mehreren Dimensionen aus, die getrennt voneinander untersucht werden können. Im Vergleich zum Pyramidenmodell übt nicht jedes Mitglied, das eine Aktivität ausführt, auch automatisch die darunterliegenden Aktivitäten aus. Deshalb ist an der Art der Partizipation auch nicht direkt der Grad der Partizipation abzulesen. In der moderneren Partizipationsforschung werden meist konventionelle und unkonventionelle Formen politischer Partizipation unterschieden (vgl. Barnes/Kaase u.a. 1979; Jennings/van Deth u.a. 1990; siehe auch Muller 1979; Norris 2002; Parry et al. 1992; Uehlinger 1988; Verba et al. 1995). Das zentrale Abgrenzungskriterium ist dabei die Legitimität einer Aktivität. Diese kann sich jedoch über die Zeit verändern. Ein Beispiel dafür ist die Teilnahme an Demonstrationen. Während diese Form in den 1960er und 1970er Jahren noch in den Bereich der unkonventionellen Partizipation gefallen wäre, handelt es sich bei der Teilnahme an Demonstrationen heute um ein höchst konventionelles Mittel, politisch Einfluss zu nehmen. Andere Studien trennen wiederum zwischen legalen und illegalen Partizipationsformen und orientieren sich damit nicht an der Legitimität, sondern an der Legalität als Abgrenzungskriterium. Schließlich wird in der Partizipationsforschung aus theoretischer Perspektive meist noch zwischen hoch institutionalisierten elektoralen und nicht-elektoralen Partizipationsformen unterschieden.

6.5 Die Messung des politischen Partizipationsnicveaus

181

Für die hier vorliegende Studie wird sowohl eine theoretisch begründete als auch eine empirische Unterscheidung der Dimensionen politischer Partizipation vorgenommen. Zunächst wird aus theoretischen Gründen die Wahlbeteiligung von den anderen Formen politischer Partizipation getrennt untersucht. Sie unterscheidet sich von den anderen Formen bürgerlicher Beteiligung. Wahlen sind, wie bereits ausgeführt, in demokratischen Systemen hochgradig institutionalisiert. Wählen ist die verbreitetste Form, politisch Einfluss zu nehmen. Anders als die anderen freiwilligen Aktivitäten wird die Wahlteilnahme zudem von einem Großteil der Bevölkerung als Bürgerpflicht wahrgenommen (vgl. Verba et al. 1995: 48). Ein weiteres Argument, das für eine getrennte Analyse der Wahlbeteiligung spricht, ist ein forschungspraktisches und liegt in den Möglichkeiten der Erkenntnis für die Wahlforschung. Wie bereits zuvor ausgeführt, wird der Anteil der Nicht-Wähler an der Gesamtbevölkerung in vielen Studien aus dem Bereich der Wahlforschung unterschätzt (vgl. Bolstein 1991; Brehm 1993: 138; Clausen 1968; Kleinhenz 1995). Dieses Phänomen wäre erklärbar, wenn es einen Zusammenhang zwischen der Wahlbeteiligung und der Umfrageteilnahme gibt. Zur Messung der Wahlteilnahme stehen zwei Indikatoren zur Verfügung. Zum einen wurde gefragt, ob die Zielperson bei der letzten Bundestagswahl 2005 gewählt hat. Wenn ja, wurde die Parteiwahl erhoben, d.h. die Partei, die mit der Zweitstimme gewählt wurde. Wenn eine Zielperson nicht gewählt hat, wurde nach Gründen für die Nichtwahl gefragt. Daneben wurde die klassische Sonntagsfrage gestellt, d.h. gefragt, welche Partei die Zielperson wählen würde, wenn am nächsten Sonntag Bundestagswahlen wären. Bivariat werden beide Indikatoren ausgewertet. Der erste Indikator ist aufgrund der Gründe für eine potenzielle Nichtwahl interessant. Da die Befragung im Jahr 2008 stattfand und damit zeitlich drei Jahre nach der letzten Bundestagswahl 2005 angesiedelt ist, wird angenommen, dass bei der Recallfrage zur Wahlentscheidung 2005 Messfehler zu erwarten sind (vgl. Falter et al. 1992: 15; Schoen/Kaspar 2009: 159ff.). Daher wurde, konsistent zur Theorie geplanten Verhaltens, nicht auf die tatsächliche Handlung Bezug genommen, sondern die Handlungsintention für die näher liegende kommende Wahl integriert. Über die Sonntagsfrage lässt sich (indirekt) sowohl die Wahlbeteiligung als auch die Parteiwahl messen. Auf diese Weise können sowohl die Wähler der großen als auch die Wähler der kleinen Parteien getrennt voneinander analysiert werden. Zusätzlich wurde offen abgefragt, ob man eine andere Partei wählen würde und falls ja, welche, um auch die Wähler kleinerer Splitterparteien und extremer Parteien analysieren zu können. Es sollen jedoch nicht nur elektorale Partizipationsformen untersucht werden. Aus diesem Grund wurde eine Liste weiterer Aktivitäten in den Fragebogen aufgenommen, um die Teilnahme der Befragten an weiteren Formen politischer Partizipation zu messen. Zu diesen sollten die Zielpersonen jeweils angeben, ob sie sich dieser Formen bedienen würden, und ob sie sich dieser Formen schon einmal be-

182

6 Operationalisierung

dient haben, um politisch Einfluss zu nehmen.178 Um zu analysieren, ob hinter den verschiedenen Partizipationsformen verschiedene Dimensionen liegen, wurde eine Hauptkomponentenanalyse gerechnet, die drei verschiedene Dimensionen ergibt.179 Eine Komponente lässt sich als „aktives Engagement im öffentlichen Bereich“ bezeichnen, wozu z.B. die Mitarbeit in einer Partei oder Bürgerinitiative gehören. Eine zweite Dimension bezieht sich auf „privates politisches Engagement“, wenn man seine Meinung am Arbeitsplatz oder im Bekanntenkreis äußert oder beim Einkaufen aus politischen, ethischen oder Umweltgründen Waren boykottiert. Die dritte Dimension beinhaltet den „Protestgedanken“ politischer Partizipation. Darauf laden beispielsweise die Teilnahme an einer nicht genehmigten Demonstration oder auch das Protestwahlverhalten. Für diese Dimensionen politischer Partizipation, d.h. die Wahlbeteiligung bzw. Parteiwahl auf der einen Seite und die drei eben benannten Faktoren auf der anderen Seite, wird anschließend in der empirischen Analyse untersucht, ob Unterschiede zwischen Kooperativen und Verweigerern auftreten. Anschließend wird versucht, diese auf der Basis des Common CauseModells zu erklären.

178

Bei diesen Partizipationsformen handelt es sich um die folgenden zwölf Tätigkeiten: „seine Meinung sagen, im Bekanntenkreis und am Arbeitsplatz“, „sich an Wahlen beteiligen“, „sich in Versammlungen an öffentlichen Diskussionen beteiligen“, „Mitarbeit in einer Bürgerinitiative“, „in einer Partei aktiv mitarbeiten“, „Teilnahme an einer nicht genehmigten Demonstration“, „Teilnahme an einer genehmigten Demonstration“, „sich aus Protest nicht an Wahlen beteiligen“, „aus Protest einmal eine andere Partei wählen als die, der man nahesteht“, „Beteiligung an einer Unterschriftensammlung“, „aus politischen, ethischen oder Umweltgründen Waren boykottieren oder kaufen“, „sich an einer Online-Protestaktion beteiligen“. Über die Frage: „Wenn Sie politisch in einer Sache, die Ihnen wichtig ist, Einfluss nehmen und Ihren Standpunkt zur Geltung bringen wollten: Welche der folgenden Möglichkeiten würden Sie nutzen? Und: Was davon haben Sie selbst schon gemacht?“ wird der intentionale Aspekt politischer Partizipation betont. Gleichzeitig wird zwischen einer Beteiligungsabsicht und dem berichteten Verhalten unterschieden. Für die anschließende Analyse wird auf die Beteiligungsabsicht zurückgegriffen, da nach der Theorie geplanten Verhaltens hierauf ein direkter Einfluss der Determinanten angenommen wird. 179 Es wurde eine Hauptkomponentenanalyse gerechnet, da das Ziel der Analyse eine „möglichst umfassende Reproduktion der Datenstruktur durch möglichst wenige Faktoren“ (Backhaus et al. 2006: 292) war. Eine Hauptachsenanalyse interpretiert die Korrelationen kausal und beantwortet die Frage, was die Ursache für die hohen Ladungen der Variablen ist. Beide Verfahren unterscheiden sich nicht in dem dahinter liegenden iterativen Verfahren, sondern nur in ihrem Umgang mit den Kommunalitäten. Rein rechnerisch ergeben beide Verfahren in diesem Fall zudem identische Faktoren.

6.5 Die Messung des politischen Partizipationsnicveaus

183

Tabelle 5: Hauptkomponentenanalyse zur Intention Politischer Partizipation Rotierte Komponentenmatrix Seine Meinung sagen, im Bekanntenkreis und am Arbeitsplatz Sich an Wahlen beteiligen Sich in Versammlungen an öffentlichen Diskussionen beteiligen Mitarbeit in einer Bürgerinitiative

Faktor 1: öffentlich

Faktor 2: privat

Faktor 3: Protest

,67 ,68

-,31

,65 ,72

In einer Partei aktiv mitarbeiten ,70 Teilnahme an einer nicht genehmigten De,48 ,31 monstration Teilnahme an einer genehmigten Demonstra,54 ,32 tion Sich aus Protest nicht an Wahlen beteiligen ,74 Aus Protest einmal eine andere Partei wählen ,45 ,39 als die, der man nahesteht Beteiligung an einer Unterschriftensammlung ,30 ,61 Aus politischen, ethischen oder Umweltgrün,51 ,33 den Waren boykottieren oder kaufen Sich an einer Online-Protestaktion beteiligen ,43 ,32 Quelle: Eigene Berechnungen. DFG-Projekt „Nonresponse in der politikwissenschaftlichen Wahl- und Einstellungsforschung“. Gewichtete Daten (Ost-West-Designgewicht). Hauptkomponentenanalyse; Varimax-Rotation mit Kaiser-Normalisierung; 5 Iterationen. KMO: 0,82; Bartlett-Test p