
Im Zusammenhang mit direktdemokratischen Entscheiden ist immer wieder von Meinungswandel die Rede. So auch im Zusammenhang mit den Vorlagen, über die am 28. Februar entschieden wurde. Zuweilen wird dieser Meinungswandel gar in Prozentpunkten genau beziffert. Doch wie verlässlich sind eigentlich solche Zahlen? Und woher wissen wir, dass Stimmende ihre Meinung änderten?
Die Geschichte klingt fast schon zu gut, um wahr zu sein. Noch im November 2015 galt die Annahme der Durchsetzungsinitiative als so gut wie sicher. Nur noch ein Wunder könne ein Volksja zur Durchsetzungsinitiative (DSI) verhindern, hiess es damals.[2] Und dann ereignete sich just dieses Stimmwunder vor unseren Augen: Die DSI wurde abgelehnt und das auch noch (vergleichsweise) klar. Ein dramatischer Meinungsumsturz in weniger als drei Monaten und ausserdem zu einer Sachfrage, zu welcher die Bürger ansonsten höchst stabile Haltungen haben. Das ist Stoff, den die Medien lieben: Ein Aussenseiter, der in letzter Sekunde das Blatt noch sensationell wendet. Die DSI war im Übrigen nicht die einzige Initiative, bei der die «Stimmung» auf fast schon wundersame Art und Weise gekippt ist: Auch die Heiratsstrafe und die Gotthardröhre verloren erheblich an Zustimmung. Was ist los im Lande der sonst so gefestigten Schweizer und Schweizerinnen? Ihre Meinungen scheinen höchst volatil zu sein; sie ändern sich – so ein erster, vordergründiger Eindruck – offenbar über Nacht.

Doch woher wissen wir denn eigentlich, dass ein Meinungswandel – und mit «Meinungswandel» ist landläufig gemeint, dass Bürger ihre Meinungen ändern – stattfand? Ganz einfach: Man nehme das Ergebnis der (SRG-)Vorbefragungen und vergleiche es mit dem Endergebnis: Die Differenz ist Meinungswandel. Ist das wirklich so einfach? Nein, denn es müssen einige Voraussetzungen erfüllt sein, damit wir tatsächlich von (individuellem) Meinungswandel sprechen können.
ERSTE VORAUSSETZUNG: DIE BÜRGER HABEN BEREITS FRÜH EINE HALTUNG ZUR SACHFRAGE
Damit Meinungen (oder Stimmabsichten) ändern können, müssen sie zunächst vorhanden sein. Sind sie nicht vorhanden, können sie sich selbstredend auch nicht ändern. Vielmehr bilden sich in solchen Fällen Meinungen erst im Laufe des Abstimmungskampfes. Gewiss, der Prozess der Meinungsbildung ist ebenfalls ein höchst interessantes Phänomen: Auch sie kann durch Kampagnen beeinflusst werden mit dem Resultat, dass sich das «Stimmungsbild» zu einer Vorlage ändert. Aber nichtsdestotrotz sind Meinungsänderung und Meinungsbildung zwei unterschiedliche Dinge. Es ist beileibe nicht dasselbe, ob sich jemand vom entschiedenen Ausschaffungsbefürworter zum glühenden DSI-Gegner wandelt – also gewissermassen vom «Saulus zum Paulus» – oder ausgehend von einer weitestgehend indifferenten Position (“keine Meinung”) zum Stimmentscheid gelangt.
Ob nun eine halbwegs stabile Grundorientierung, die wir auch mit gutem Gewissen als «Stimmabsicht»[3] bezeichnen können, schon sechs bis sieben Wochen vor dem Abstimmungstermin (erste SRG-Umfragewelle) vorliegt, hängt primär von der Vertrautheit der jeweiligen Sachfrage ab. Bei der medial dauerpräsenten Durchsetzungsinitiative war dies sicherlich eher der Fall als etwa bei der Nahrungsmittelspekulation oder der Heiratsstrafe. Um das Argument zu verstehen, lohnt es sich, die ganz konkrete Befragungssituation vor Augen zu führen.
Wie kommen Antworten in Interviews zustande?
Die Sichtweise, wonach Befragte bei einem Interview sozusagen auf Knopfdruck ihre «wahren» Haltungen offenbaren, ist unrealistisch. Vielmehr ist die Artikulation einer Antwort zu einer Interviewfrage ein komplexer mentaler Prozess.[4] Was geschieht also, wenn die Befragten rund sechs Wochen vor dem Abstimmungstermin danach gefragt werden, ob sie eine bestimmte Vorlage derzeit annehmen oder ablehnen würden? Wie reagieren vor allem Befragte, die von der Vorlage bis zum Zeitpunkt der Befragung vielleicht noch nie was gehört haben, darauf? Einige von ihnen werden allenfalls mit «Weiss nicht» antworten. Sie zählen dann als «Unentschiedene». Andere wiederum werden wohl kurzerhand den Titel der Vorlage bewerten. Denn: Was sonst sollen sie bewerten? Der Titel, der vorgängig genannt wird, ist (wahrscheinlich) alles, was sie von der Vorlage wissen. Initiativtitel klingen aber meist höchst verheissungsvoll. Nicht nur, aber sicher auch deshalb starten Initiativen meist mit einem Umfragevorsprung in den Abstimmungskampf. Aber diese ad-hoc-Bewertung des Initiativtitels ist keine eigentliche Stimmabsicht im Sinne einer persönlichen Disposition, sondern eine unverbindliche Kurzbewertung des Initiativtitels. Philip Converse, der sich in den 60er Jahren mit den (in Umfragen) erhobenen politischen Haltungen der Amerikaner auseinandersetzte, war gar der Ansicht, dass solche Äusserungen oftmals ein «bedeutungsloses Zufallsprodukt ohne gedankliche Grundlage» seien.[5] So weit will ich nicht gehen. Aber ein – zugegebenermassen extremes – Schweizer Beispiel, nämlich die Vorlage zur medizinischen Grundversorgung (18. Mai 2014), zeigt, dass ähnliche Phänomene auch bei Sachfragen in der Schweiz auftreten: Denn selbst bei der Nachbefragung zur besagten Abstimmung konnten fast 40 Prozent der Stimmenden (!) immer noch nicht angeben, worum es inhaltlich eigentlich ging. Wenn man nach der Abstimmung nicht weiss, wovon eine Vorlage handelte, (bei der man allerdings teilgenommen hat!), wie soll man vor der Abstimmung eine Stimmtendenz dazu gehabt haben, die diese Bezeichnung auch verdient?[6] Wo aber keine Stimmabsicht vorliegt, kann auch nicht von Meinungswandel gesprochen werden.
Nochmals: die Stabilität solcher Angaben ist selbstverständlich nicht überall in Zweifel zu ziehen. Bei europa- oder ausländerpolitischen Abstimmungen dürften in der Tat bereits zu einem frühen Zeitpunkt relativ stark auskristallisierte Haltungen vorliegen – die sich in der Folge aber genau deshalb auch kaum ändern. Indes, bei wenig diskutierten, konfliktarmen Vorlagen, die oft im Schatten von Zugpferdvorlagen stehen, ist es mitunter etwas fragwürdig, von einer Stimmabsicht und folgerichtig von Meinungswandel zu sprechen.
ZWEITE VORAUSSETZUNG: EXAKTE MESSUNG DER STIMMABSICHTEN IM VORFELD DER ABSTIMMUNG
Um Meinungswandel in Prozentpunkten zu beziffern, muss die Messung der Stimmabsichten und des Stimmentscheids korrekt erfolgen.[7] Das effektive Stimmergebnis dürfte wohl in den allermeisten Fällen korrekt ausgezählt worden sein. Die Stimmabsichten sind jedoch Umfragewerte. Als solche weisen sie immer eine Unschärfe auf. Selbst bei einer «echten» Zufallsstichprobe mit 100-prozentiger Ausschöpfung ist eine Abweichung möglich – man bezeichnet dies auch als Zufallsfehler.[8] Immerhin, dieser Zufallsfehler lässt sich berechnen. Aber selbstverständlich müsste er auch dann, wenn der Meinungswandel in Prozentpunkten berechnet wird, berücksichtigt werden. Getan wird dies meines Wissens nicht. Hinzu kommt: Lehrbuchmässige Zufallsauswahlen gibt es kaum. Dazu bräuchte es nämlich eine (so gut wie) vollständige Liste aller Stimmberechtigten. Das sind Telefonverzeichnisse schon seit langem nicht mehr. Umfrageergebnisse, die auf solchen Telefonlisten beruhen, haben deshalb wohl auch eine breitere Fehlermarge als im 95%-Konfidenzintervall angegeben.[9]
Ein Beispiel: Bei der Abstimmung über das Minarettverbot wies die Vorbefragung rund zwei Wochen vor dem Urnengang 37 Prozent Zustimmung aus. Das Begehren wurde am Ende jedoch mit 57.5 Prozent Ja-Stimmen angenommen. Betrug der «Meinungswandel» satte 20 Prozent – noch dazu zu einem Zeitpunkt, zu welchem viele Stimmbürger schon brieflich abgestimmt haben? Kaum vorstellbar. Vielmehr war es wohl so, dass die Vorbefragung daneben lag. Höchst aufschlussreich ist in diesem Zusammenhang, dass die VOX-Nachbefragung zur gleichen Abstimmung, die vom gleichen Befragungsinstitut mit gleicher Methode erhoben wird, das ungewichtete Ergebnis der Minarettverbot-Initiative wieder um rund 9 Prozent unterschätzte. Zumindest bei dieser Vorlage (und vermutlich auch bei anderen) müssen wir also von einer Verzerrung von unbekanntem Ausmass bei der Messung der Stimmabsichten ausgehen, was eine genaue Bezifferung des Meinungswandels verunmöglicht.[10]
DRITTE VORAUSSETZUNG: PANELDATEN
Zuletzt: Will man individuellen Meinungswandel nachweisen, benötigt man Paneldaten. Mit anderen Worten: Man befragt dieselben Individuen zu mindestens zwei verschiedenen Zeitpunkten.[11] Im Falle von Abstimmungen liegen jedoch keine solchen Paneldaten vor. Aus diesem Grund kann auch nicht gesagt werden, ob es nun individueller Meinungswandel war oder asymmetrische (De-)Mobilisierung, die dazu führte, dass das Gesamtergebnis kippte. Zum besseren Verständnis dieses Arguments: Ein Ergebnis kann theoretisch auch dann ändern, wenn sich niemand umentscheidet. Dann nämlich, wenn die Beteiligungsbereitschaft im einen Lager ab- und im anderen Lager zunimmt, eben asymmetrische Mobilisierung. Mit Trenddaten lassen sich diese beiden Effekte nicht sauber voneinander unterscheiden. Nur mit Paneldaten geht das. Weil diese nicht vorliegen, kann auch nur schwer abgeschätzt werden, ob das, was wir auf Aggregatebene als «Stimmungswandel» wahrnehmen, auf individuelle Meinungsänderungen oder auf Mobilisierungseffekte zurückzuführen ist – oder, was am wahrscheinlichsten ist, auf beides.
DSI-STIMMABSICHTEN WAREN STABILER ALS BEI DEN ANDEREN VORLAGEN
Es geht keineswegs darum, einen Meinungswandel bei den Vorlagen vom 28. Februar in Abrede zu stellen. Im Gegenteil: Mit hoher Wahrscheinlichkeit gab es einen solchen – notabene bei allen vier Vorlagen und nicht bloss bei der DSI. Aber – und das ist der Punkt: In welchem Ausmass ist nur schwer zu sagen. Die Tamedia-Umfrage deutet im Übrigen darauf hin, dass just bei der DSI die Haltungen am gefestigsten waren. Rund 80 Prozent gaben an, sie seien sich von Anfang sicher gewesen, wie sie abstimmen würden. Nur sieben Prozent gaben an, ihre Meinung während des Abstimmungskampfes geändert zu haben, während weitere sieben Prozent offenbar hin und her gerissen waren zwischen einem Ja und einem Nein. Vergleicht man die DSI-Werte mit den entsprechenden Anteilen für die anderen Vorlagen, so stellt man fest: Der Anteil von Beginn weg Überzeugten war bei der DSI am höchsten und derjenige der Umentscheider am tiefsten. Der Kontrastpunkt zur DSI bildet die Initiative zur Nahrungsmittelspekulation: 21 Prozent gaben an, sie hätten sich erst kurz vor dem Abstimmungstermin überhaupt damit auseinandergesetzt. Zum Vergleich: Bei der DSI betrug dieser Anteil gerade einmal drei Prozent. Im Übrigen: Das ist alles nicht überraschend. Bei Europa- und Ausländerabstimmungen sind die Schweizer Stimmbürger überdurchschnittlich gut informiert, entscheiden sich früh und weisen fest verwurzelte Haltungen auf.
Nochmals: Offenbar gab es individuelle Meinungsänderungen bei allen vier Vorlagen. Die Daten weisen auch darauf hin. Aber der «Umschwung» wird nicht alleine darauf zurückzuführen sein, dass sich Bürger plötzlich umentschieden. Ein weiterer Grund wird gewesen sein: Viele ansonsten «Stimmfaule» liessen sich mitreissen und nahmen teil. Sie haben ihre Haltung aber nicht notwendigerweise geändert, geändert hat sich bloss ihre Beteiligungsbereitschaft. Und bei den drei «Nicht-DSI-Vorlagen» gab es offensichtlich viele, die primär der DSI wegen teilnahmen, aber sich nun auch gleich noch zu den anderen Vorlagen der Multipack-Abstimmung äusserten. Bei diesen Stimmbürgern apriori von Meinungswandel zu sprechen, führt in die Irre.
Thomas Milic
[1] Foto: richoz|Flickr
[2] Den dazugehörigen Text in der NZZ lesen Sie hier.
[3] Was versteht man eigentlich unter Stimmabsicht? Von einer Stimmabsicht erwarten wir eine gewisse Stabilität. In der Kognitionspsychologie ist deshalb auch von Dispositionen die Rede, also von einer Tendenz, denselben Bewertungsgegenstand immer wieder in einer ähnlichen Art und Weise zu bewerten. Damit ist nicht gemeint, dass Haltungen ein für alle Mal in Granit gemeisselt sind. Aber sollte sich eine «Stimmabsicht» beinahe stündlich ändern und schon durch kleinste Veränderungen in der Frageformulierung umgestossen werden, dann ist das keine verinnerlichte Orientierungstendenz (Stimmabsicht) mehr, sondern – Zitat Converse (1964: 243) – «meaningless opinions that vary randomly in direction during repeated trials over time».
[4] Es gibt mittlerweile einen riesigen Fundus an Literatur zu Theorien des Antwortverhaltens. Besonders empfehlenswert ist meiner Ansicht nach John Zallers und Stanley Feldmans (1992) «A Simple Theory of the Survey Response: Answering Questions Versus Revealing Preferences». Dabei gehen Zaller und Feldman nicht von einem «Converschen Vakuum» aus. Aber sie gehen ebenso wenig von der Ansicht aus, Bürger hätten zu allen Sachfragen eine einigermassen stabile Meinung, die sie bei Befragungen «auf Abruf» präsentieren können.
[5] Lesen Sie dazu: Schmitt-Beck 2000. Der Zufallsfehler einer verzerrten Stichprobe ist logischerweise ebenfalls verzerrt.
[6] Der Anteil Unentschiedener betrug bei der zweiten Vorbefragungswelle 19 Prozent, demnach weit weniger als die rund 40 Prozent, die keine substanzielle Inhaltsangabe bei der Nachbefragung machen konnten.
[7] Den dazugehörigen Artikel finden Sie unter Fussnote 2.
[8] Wodurch zeichnet sich eine Zufallsstichprobe aus? Dadurch, dass alle Elemente der Grundgesamtheit dieselbe bzw. eine berechenbare Chance aufweisen, Element der Stichprobe zu werden. Diese Inklusionschance muss zudem höher als Null betragen. Im Telefonverzeichnis nicht registrierte Stimmbürger haben eine Inklusionschance von Null, sofern die Telefonliste die Auswahlgesamtheit darstellt.
[9] Eine «Trefferquote» lässt sich bei Vorbefragungen bekanntermassen nicht ermitteln, aber bei Nachbefragungen. Die Vox ist eine solche Nachbefragung. Die Befragungen finden jeweils innerhalb zweier Wochen nach der Abstimmung statt. Der Einwand, wonach sich in den letzten Wochen die Meinung eben noch geändert habe, gilt für eine Nachbefragung somit nicht. Man kann also den Schätzfehler genau ermitteln. Die Differenz zwischen dem im Vox-Sample ermitteltem und dem effektiven Ergebnis beträgt zwischen 1998 und heute rund 5 Prozentpunkte (absolut). Überträgt man diese Trefferquote auf die Vorbefragungen, so könnte der in Prozentpunkten gemessene Meinungswandel unter Umständen 5 Prozentpunkte mehr oder 5 Prozentpunkte weniger betragen.
[10] Zu den Gründen für diese Verzerrung wurde seinerzeit viel diskutiert. Für die Ermittlung des Meinungswandels in Prozentpunkten spielt dies indes keine Rolle.
[11] Lesen Sie hierzu den Artikel von Nicolet und Sciarini.