Home » Blog » Prognosen: Das Beispiel der Luzerner Regierungsratswahlen

Kapellbrücke in Luzern. [4]

Prognosen: Das Beispiel der Luzerner Regierungsratswahlen

Im zweiten Teil wollen wir die Probleme und Herausforderungen von theoretischen Prognosenmodellen an einem konkreten und aktuellen Beispiel diskutieren: Die Regierungsratswahlen im Kanton Luzern.

Kurz zur Ausgangslage der Exekutivwahlen vom 29. März 2015: Gewählt wird der fünfköpfige Regierungsrat des Kantons Luzern. Wählbar sind grundsätzlich alle kantonalen Stimmberechtigten. Anders als beispielsweise im Kanton Zürich sind ausseramtliche Wahllisten zulässig. Weil diese ausserdem vorgängig eingereicht werden müssen, wissen wir, dass sich acht «offizielle» Kandidaten und Kandidatinnen um das Amt eines Regierungsrates bzw. einer Regierungsrätin bewerben. Vier davon sind Bisherige (d.h. ein Sitz wird «frei»), die restlichen vier kandidieren neu.[1]

Wie können wir den Wahlerfolg der acht Kandidierenden mit einem statistischen Modell berechnen? Zunächst müssen wir definieren, was wir unter «Wahlerfolg» verstehen. Mit anderen Worten: Was soll denn überhaupt prognostiziert werden? Die Anzahl Stimmen, der Umstand, ob jemand gewählt wird oder nicht, oder der Anteil Stimmen am Total aller Stimmen? Unsere abhängige Variable ist definiert als der Anteil Stimmen am Total aller gültigen Wahlzettel, was uns im Falle des Kantons Luzern auch gleichzeitig angibt, ob der Kandidat das absolute Mehr im ersten Wahlgang erzielt oder nicht. Sodann brauchen wir Erfahrungswerte: Uns stehen die Ergebnisse zu drei Luzernischen Gesamterneuerungswahlen (sowie ein zweiter Wahlgang) zur Verfügung. Insgesamt sind das 41 Fälle (Fälle=Kandidaturen). Das ist (eigentlich zu) wenig. Denn: Mit tieferer Fallzahl wächst der prognostische Unschärfebereich umso stärker an. Wir begegnen diesem Umstand in pragmatischer Weise: Wenn theoretische Prognosenmodelle an einem aktuellen Beispiel diskutiert werden sollen, dann muss mit der geringen Fallzahl Vorlieb genommen werden. Wer interessiert sich schon für Prognosen zurückliegender Wahlen?

1. Schritt: Finde die Determinanten des Wahlentscheides

Nun beginnt der theoretische Teil der Prognosearbeit. Dieser besteht darin, diejenigen Variablen zu identifizieren, die als aussagekräftige Prädiktoren des Wahlentscheids in Frage kommen. Wir überspringen diesen – zwar eminent wichtigen – aber auch zeitraubenden Teil und halten bloss fest, welche Prädiktoren wir in einem ersten Schritt berücksichtigt haben:

  1. Die Wählerstärke der Partei des Kandidaten. Anzunehmen ist, dass Parteiwähler (einigermassen) diszipliniert für ihre Kandidaten stimmen werden. Im Prinzip wäre anstelle der Parteistärke auch die «Blockstärke» denkbar, da beispielsweise Sympathisanten der Grünen  mit hoher Wahrscheinlichkeit auch einen SP-Kandidaten wählen werden.
  2. Der «Status» des Kandidaten. Gemeint ist damit der Umstand, ob ein Kandidat ein erneut kandidierender Amtsinhaber oder ein Neukandidierender ist. Amtsinhaber sind viel eher bekannt und haben demnach viel höhere Wahlchancen als neu Kandidierende.
  3. Anzahl der Kandidaten. Je höher die Anzahl der Kandidaten pro Wahl, desto eher nehmen sich die Kandidaten gegenseitig Stimmen weg.

Andere Variablen wurden vorerst (noch) nicht berücksichtigt. Aus drei Gründen: Erstens, weil sie statistisch keinen Einfluss haben auf das Wahlverhalten (wie etwa das Geschlecht: Männer haben im Kanton Luzern etwa die gleichen Wahlchancen wie Frauen). Zweitens, weil sie mit anderen Prädiktoren korrelieren und drittens, weil uns die gewünschten Informationen gar nicht zur Verfügung standen. Gerne wüssten wir beispielsweise, wie bekannt ein Kandidat ist. Denn: Um einen Namen auf den Wahlzettel schreiben zu können, muss er geläufig sein. Man könnte dies beispielsweise mittels der Höhe der Propagandaaufwendungen für den jeweiligen Kandidaten messen. Doch über die politischen Werbeaufwendungen weiss man nicht genaues. Eine weitere, voraussichtlich wichtige Information ist uns ebenso wenig bekannt. Sie hat damit zu tun, dass im Kanton Luzern, wie gesagt, ausseramtliche Wahllisten zulässig sind. Bei den aktuellen Wahlen wurden insgesamt 15 solcher vorgedruckten Wahllisten eingereicht. Die Wählerschaft kann anstelle des leeren Wahlzettels, der dem Wahlmaterial auch beiliegt, eine dieser vorgedruckten Wahllisten unverändert einlegen. Dabei ist klar: Die Wahlchancen eines Kandidaten sind nun umso grösser, je häufiger er oder sie auf diesen (bzw. auf einer «chancenreichen») vorgedruckten Wahllisten steht. Diese Information ist aber nur für die aktuellen, nicht für die vergangenen Wahlen vorhanden. Wir können sie deshalb nicht in unsere Voraussage einfliessen lassen. All dies verringert notwendigerweise die Prognosegüte des Modells, denn mindestens zwei wichtige Prädiktoren bleiben so unberücksichtigt. Das sind eben die «Grenzen» theoretischer Prognosemodelle.

Flickr/Lars Pelz
Politische Werbeausgaben sind so durchsichtig wie Milchglas. Foto: Flickr/Lars Pelz

Das vorgeschlagene Modell vermag über 80 Prozent der Varianz zu erklären. Es hat allerdings ein wesentliches Problem: Die Wählerstärke der Parteien, die hinter den jeweiligen Kandidaturen stehen, ist nicht im Voraus bekannt. Die kantonalen Parlamentswahlen finden nämlich gleichzeitig mit den Regierungsratswahlen statt. Man könnte nun stattdessen die Wähleranteile der vergangenen Wahl oder der Nationalratswahl nehmen, doch liegt im Falle des Kantons Luzern beides vier Jahre zurück. Ein zwar nicht vollwertiger, aber passabler Ersatz sind sogenannte «Dummyvariablen»: Man bildet für jede Partei eine Variable, die in der Folge angibt, um wie viel besser (oder schlechter) ein Kandidat der betreffenden Partei abschneidet als eine vordefinierte Restgruppe. Ein Beispiel: SVP-Kandidaten schneiden in Anbetracht dessen, dass ihre Partei oftmals die wählerstärkste Partei im Kanton ist, bei Majorzwahlen eher schlecht ab. Denn es ist für die SVP schwieriger als für andere Parteien, ausserhalb ihrer eigenen Wählerschaft Stimmen für ihre Kandidaten zu erzielen. Eine entsprechende Dummyvariable trägt diesem Umstand Rechnung. Der Vorteil der Parteizugehörigkeit gegenüber der Wählerstärke einer Partei ist der Umstand, dass erstere schon lange vor den Wahlen bekannt ist, letztere erst nach den Wahlen.

Wie soll die Bekanntheit gemessen werden?

Weiter haben wir mit dem bei den Baselbieter Wahlen erstmals eingesetzten Medienmonitor versucht, die Bekanntheit der Kandidaten (retrospektiv) zu messen. Die erhobenen Werte haben wir in das nachfolgende Basismodell einfliessen lassen.[2]

Variablenβ-Koeff.SEP>|t|untere Grenze 95%-Konf.int.obere Grenze 95%-Konf.int.
Amtsinhaber
(0=nein; 1=ja)
11.752.980.0005.6717.83
SP-Parteizugehörigkeit9.953.680.0112.4417.45
CVP-Parteizugehörigkeit 14.922.980.0008.8321.01
FDP-Parteizugehörigkeit11.643.150.0015.2118.07
Anzahl Kandidaten -2.58.310.000-3.20-1.94
Medienmonitor.44.160.010.11.77
Konstante51.263.700.00043.7158.81
n=38; R-Quadrat=.88

Das neue Modell ist statistisch gesprochen gar besser als das erste. 88 Prozent der Varianz können erklärt werden. Die mittlere Abweichung unserer modellgenerierten Prognosewerte beträgt 6 Prozent. Das heisst: Unser Modell lag im Schnitt um rund sechs Prozentpunkte daneben. Das heisst auch: Im Schnitt dürfte sich unser Modell auch bei der Prognose um denselben Betrag irren. Das ist happig – aber das gehört eben zu den «Grenzen» theoretischer Prognosemodelle. Die maximale Abweichung betrug im Übrigen 16 Prozent. Das ist viel – zu viel, wird manch einer einwerfen. Interessant ist jedoch, bei welchem Kandidaten unser Modell derart daneben lag: Daniel Bühlmann von der SVP wurde wegen einer Steueraffäre als einziger Amtsinhaber bei den untersuchten Wahlen abgewählt (siehe Kasten). Unser Modell prognostizierte ihm ex-post einen Anteil von 36 Prozent, am Ende erzielte er bloss 20 Prozent. Dieses Beispiel zeigt die im ersten Teil auf theoretischer Ebene andiskutierte Schwäche eines hochgeneralisierten Modells auf: Es prognostiziert jedem Amtsinhaber die Wiederwahl, weil dies in der Tat auch meistens erfolgt. Wird ein Amtsinhaber aufgrund eines Skandals (o.ä) von der Wählerschaft abgestraft, liegt ein theoretisches Modell, welches solche aussergewöhnlichen Fälle einer höchst unbeliebten Amtsführung nicht berücksichtigen kann, zwangsläufig daneben.

Ein weiteres, zur Vorsicht mahnendes Wort sei an dieser Stelle auch noch angebracht: Retrospektiv (in-sample forecasts) lässt sich (allenfalls) der Erklärungsgehalt eines Modells, nicht aber seine eigentliche Prognosegüte überprüfen. Denn nachträglich ermittelte Prognosewerte beruhen ja auf den tatsächlichen Ergebnissen der Wahlen (aufgrund dieser Datenpunkte wird das Modell geschätzt), sind demnach kein echter «Prüfstein» für die Prognosekraft eines Modells. Im Prinzip müsste man das Modell bloss mit einem Teil der Daten schätzen lassen und den anderen Teil zur Bewertung der Prognosegüte verwenden (out-of-sample forecasts). Aufgrund der geringen Fallzahl ist das in unserem Beispiel nicht möglich.

In einem weiteren Schritt haben wir uns eine Vorgehensweise zunutze gemacht, die im Zusammenhang mit Wahlen in den USA schon verschiedentlich zur Anwendung gelangt ist und im weitesten Sinne mit «Aggregation» zu umschreiben ist.[3] Dabei geht es darum, die Stärken verschiedener Modelle zu vereinigen, indem man ihre Prognosewerte poolt, nach ihrer Performanz gewichtet und daraus einen Mittelwert bildet. Zu diesem Zweck haben wir drei weitere Modelle gebildet, die neben den oben genannten Prädiktoren noch die Amtsdauer des Amtsinhabers, den Wahlgang, die Parteienkonkurrenz sowie weitere Dummy-Variablen für SVP- und Grüne-Kandidaten sowie Parteilose beinhalten.

Darauf basierend lauten die Prognosen für sieben der acht Kandidaten der Luzerner Regierungsratswahl wie folgt:

RR.Predict.LU2

Wenig überraschend prognostiziert unser Modell die Wiederwahl aller Amtsinhaber. Es prognostiziert zudem auch einen zweiten Wahlgang, weil weniger als fünf Kandidaten das absolute Mehr erzielen. Allerdings wird eine weitere Schwäche unseres Modells sichtbar: Für Amtsinhaber (bzw. Neukandidierende) der gleichen Partei werden beinahe dieselben Stimmenanteile vorausgesagt. Unser Modell kann diese Kandidaten kaum voneinander unterscheiden. Das ist natürlich kein Zufall. Denn in der Vergangenheit haben Amtsinhaber derselben Partei tatsächlich oft ähnlich abgeschnitten. 2007 haben beispielsweise die beiden Bisherigen, Anton Schwingruber (CVP) und Markus Dürr (CVP), 65 bzw. 63 Prozent erzielt. Weiter unterscheidet unser Modell kaum zwischen Kandidaten der Grünen und der SVP. Wie um Himmels willen ist sowas möglich? Die einfache Antwort ist: SVP- und Grüne-Kandidaten mögen ideologisch sehr weit voneinander entfernt liegen, aber sie erzielten bei Luzerner Regierungsratswahlen etwa dieselben Stimmenanteile. Die Kandidaten der Grünen erzielten von 2003 bis 2011 zwischen 21 und 27 Prozent der Stimmen, diejenigen der SVP zwischen 15 und 34 Prozent. Wenn man zweite Wahlgänge nicht berücksichtigt, rücken die beiden Parteien noch näher zusammen: Bei den Grünen beträgt die Bandbreite 21 – 27 Prozent, bei der SVP 15 – 27 Prozent.

Wie beurteilen wir die Plausibilität unseres Modells? In der Tat zweifeln Prognostiker ja bisweilen selbst an den Ergebnissen ihrer Modelle. Wie gesagt, liegt das daran, dass solch theoretische Modelle allein auf der Basis von abstrakten Erfahrungswerten operieren. Ein theoretisches Modell «kennt» beispielsweise den SVP-Kandidaten Paul Winiker nicht, es kennt bloss seine Vorgänger (d.h. die früheren SVP-Regierungsratskandidaten) und errechnet darauf aufbauend die Erfolgschancen des erstgenannten – als wäre dieser ein Klon aller bisheriger SVP-Kandidaten, was natürlich nicht der Fall ist. Die untenstehende Abbildung zeigt im Übrigen, dass – gemessen an der Wählerstärke der eigenen Partei – die SVP-Kandidaten bisher am schlechtesten bei Luzerner Regierungsratswahlen abgeschnitten haben. Teilweise haben die SVP-Kandidaten tiefere Wähleranteile erzielt als ihre Partei bei den gleichzeitigen Parlamentswahlen. Wenn Paul Winiker dieses Muster durchbricht, wird er mit Gewissheit mehr Stimmen erzielen als es das theoretische Prognosemodell voraussagt.

lu_forecast_1
Im Boxplot ist die Differenz zwischen dem Wähleranteil der Kandidaten bei den Exekutivwahlen und demjenigen ihrer Partei bei den gleichzeitig stattfindenden Parlamentswahlen angegeben. Quelle: Eigene Berechnungen.

Ein Prognosewert fehlt in der Grafik. Für die jungen Grünen kandidiert Irina Studhalter. Ihr prognostizierter Wert kann nicht geschätzt werden, da bisher erst ein Kandidat der jungen Grünen antrat (Olivier Dolder, 2007). Ihr dieselbe Prognose zu stellen wie den (nicht-jungen) Grünen-Kandidaten ist wohl falsch. Denn die bisher angetretenen Grünen-Kandidaten erzielten alle Stimmenanteile zwischen 21 und 27 Prozent, der Kandidat der jungen Grünen lag mit 12 Prozent klar unter diesen Werten.

Zurück zum ersten Teil

Einen Spezialfall stellt Margrit Fischer (CVP) dar. Als der neu fünfköpfige Luzerner Regierungsrat 2003 gewählt wurde, erzielte sie im ersten Wahlgang das viertbeste Resultat – hinter drei weiteren CVP-Kandidaten. Da niemand das absolute Mehr erzielte, war ein zweiter Wahlgang nötig. Zu diesem trat Margret Fischer nicht mehr an, obwohl sie – wäre ein absolutes Mehr nicht nötig gewesen – im ersten Wahlgang gewählt worden wäre. Wir haben sie deshalb auch nicht zu den abgewählten AmtsinhaberInnen hinzugezählt. Daniel Bühlmann wiederum haben wir für unser vorgestelltes Prognosemodell nicht berücksichtigt. Wie gesagt, war er der einzige Amtsinhaber, der im Untersuchungszeitraum abgewählt wurde. Wegen der Steueraffäre wurde über ihn auch mit Abstand am meisten berichtet, was den Effekt des von uns verwendeten Medienindikators erheblich verzerrt. Deshalb haben wir Daniel Bühlmanns Kandidatur 2007 für unsere Prognose nicht berücksichtigt.

[1] Über den Amtsinhaberbonus haben wir im Rahmen der kantonalen Wahlen in Basel-Landschaft berichtet. Siehe hier.

[2] Hier finden Sie den Medienmonitor zu den Regierungsratswahlen im Kanton Basel-Landschaft und hier unsere Nachlese.

[3] Ein Beispiel finden Sie hier.

[4] Foto: Manuel|Flickr