14. Nov 2022   Bildung & Uni Business

Wer Fußball-Weltmeister wird: Prognose von 5 Unis

Andreas Groll ©Roland Baege

Sport & Statistik. Vor vier Jahren schied sie im Viertelfinale aus, doch heuer ist die brasilianische Nationalmannschaft WM-Favorit, so die Berechnungen der Statistiker der Uni Innsbruck und vier weiterer europäischer Universitäten.

Nachdem sie vor vier Jahren im Viertelfinale ausgeschieden ist, geht die brasilianische Nationalmannschaft diesmal wieder als klarer Favorit für den Fußball-Weltmeistertitel ins Rennen. Aber auch Argentinien, die Niederlande, Deutschland und Frankreich dürfen sich Titelchancen ausrechnen – das zeigt ein internationales Forscher*innen-Team der Universitäten Innsbruck, Gent und Luxemburg und der Technischen Universitäten Dortmund und München.

Die Fußball-WM in Katar

Kommenden Sonntag, 20. November, starten die Herren-Fußballmannschaften in die FIFA-Weltmeisterschaft in Katar. Der Favorit ist diesmal Brasilien mit einer Gewinnwahrscheinlichkeit von 15 Prozent. Das haben jedenfalls die Berechnungen des internationalen Forscher*innen-Teams ergeben, bestehend aus

  • Andreas Groll und Neele Hormann (beide TU Dortmund)
  • Gunther Schauberger (TU München)
  • Christophe Ley (Universität Luxemburg)
  • Hans Van Eetvelde (Universität Gent)
  • Achim Zeileis (Universität Innsbruck)

Sie haben ihre Berechnungen mit Hilfe von maschinellem Lernen angestellt. Die Prognose kombiniert laut den Angaben dabei mehrere statistische Modelle für die Spielstärken der Teams mit Informationen über die Team-Struktur (etwa Marktwert oder Anzahl der Champions-League-Spieler) sowie sozio-ökonomische Faktoren des Herkunftslandes (Bevölkerung und Bruttoinlandsprodukt).

Achim Zeileis ©Uni Innsbruck

„Die WM ist diesmal von vielen ethischen und sportlichen Problemen überschattet, die wir nicht ausblenden wollen. Aus wissenschaftlichem Interesse haben wir uns aber dennoch dazu entschlossen, unseren Ansatz des maschinellen Lernens, den wir bei früheren Turnieren erfolgreich eingesetzt haben, für die Erstellung probabilistischer Prognosen zu verwenden“, so Achim Zeileis vom Institut für Statistik der Uni Innsbruck.

100.000 Simulationen

Mit den vorhergesagten Werten aus dem Modell der Forscher*innen wurde die gesamte WM 100.000 Mal durchsimuliert: Spiel für Spiel, der Turnierauslosung und allen FIFA-Regeln folgend. Damit ergeben sich Wahrscheinlichkeiten für das Weiterkommen aller Teams in die einzelnen Turnierrunden und letztendlich für den WM-Sieg. Konkret lautet das Resultat:

  • Favorit ist Brasilien mit einer Gewinnwahrscheinlichkeit von 15 Prozent,
  • gefolgt von Argentinien (11,2 Prozent),
  • den Niederlanden (9,7 Prozent),
  • Deutschland (9,2 Prozent) und
  • Frankreich (9,1 Prozent).

Das Turnier ist natürlich dennoch nicht gelaufen – das zeige allein die ohnehin vergleichsweise niedrige Gewinnwahrscheinlichkeit selbst der vier Top-Nationen.

„Natürlich können Prognosen falsch sein“

„Es liegt in der Natur von Prognosen, dass sie auch danebenliegen können – sonst wären Fußball-Turniere auch sehr langweilig. Wir liefern eben Wahrscheinlichkeiten, keine Gewissheiten, und eine Gewinnwahrscheinlichkeit von 15 Prozent heißt zugleich, dass die Mannschaft zu 85 Prozent nicht Turniersieger werden kann“, erklärt Andreas Groll.

Bisher waren die Prognosen aber durchaus erfolgreich: Das Innsbrucker Modell von Achim Zeileis, das auf bereinigten Quoten der Wettanbieter basiert, konnte unter anderem bereits 2008 das Euro-Finale, sowie 2010 und 2012 Welt- und Europameister Spanien richtig vorhersehen. Dieses Jahr werde es zum zweitem Mal nach der EM 2021 als Teil eines umfassenderen kombinierten Modells eingesetzt, das von den Teams um Andreas Groll (TU Dortmund), Gunther Schauberger (TU München) und Christophe Ley (Universität Luxemburg) entwickelt wurde und das bei der Fußball-Weltmeisterschaft 2018 die Prognosegüte der Wettanbieter übertroffen hatte.

Eine höchst ungewöhnliche WM

Die WM 2022 ist für die Forscher*innen aus wissenschaftlicher Perspektive aufgrund des Termins interessant – wegen der extrem hohen Temperaturen in Katar im Sommer musste das Turnier bekanntlich auf die Wintermonate verschoben werden: „Neben den weithin diskutierten ethischen Problemen dieser Fußballweltmeisterschaft ergeben sich so auch sehr kritische sportliche Fragen: In den Wintermonaten müssen nun alle großen Fußballligen in Europa und Südamerika ihren üblichen Spielplan unterbrechen, um das Turnier unterzubringen. Dadurch haben die Nationalmannschaften weniger Zeit zur Vorbereitung und die Spieler weniger Zeit zur Erholung vor und nach der Weltmeisterschaft. In Verbindung mit den extremen klimatischen Bedingungen erhöht sich dadurch auch das Verletzungsrisiko“, erläutert Zeileis.

Eine Mannschaft mit vielen Spielern in den internationalen Ligen zu haben – etwa Champions League, Europa League, Europa Conference League –, könnte sich daher in diesem Jahr eher als Nachteil statt wie sonst als Vorteil erweisen, wie Andreas Groll ausführt: „Alle diese Faktoren erschweren die Vorhersage des Turnierverlaufs, da Variablen, die sich bei früheren Weltmeisterschaften als sehr aussagekräftig erwiesen haben, möglicherweise nicht oder anders funktionieren.“

Als Fußball-Fans sind die Forscher*innen abseits von wissenschaftlichem Interesse bestürzt über die Umstände, unter denen die WM dieses Jahr stattfindet, heißt es dazu: Die sonst übliche Freude und Vorfreude sei durch schreckliche Umstände zunichtegemacht, angefangen bei angeblicher Korruption, Menschenrechten und problematischen Arbeitsbedingungen bis hin zur mangelnden Nachhaltigkeit beim Bau der Stadien.

Die Methode des Machine Learning

Die Berechnung der Forscher*innen basiert laut Uni Innsbruck auf vier Informationsquellen:

  • Ein statistisches Modell für die Spielstärke jedes Teams auf Basis aller Länderspiele der vergangenen acht Jahre (Universitäten Gent und Luxemburg);
  • ein weiteres statistisches Modell für die Spielstärke der Teams auf Basis der Wettquoten von 28 internationalen Buchmachern (Universität Innsbruck);
  • weiteren Informationen über die Teams, zum Beispiel der Marktwert, und ihre Herkunftsländer, etwa die Bevölkerungszahl (TU Dortmund und TU München),
  • sowie als vierte Quelle bzw. vierter „Partner“ ein Machine-Learning-Modell, das die anderen Quellen zusammenführt und sie schrittweise optimiere.

Die Forscher*innen haben das Machine-Learning-Modell zuvor mit historischen Daten trainiert, wie Andreas Groll erläutert: „Wir haben das Modell mit den jeweils zu dem Zeitpunkt aktuellen Daten für die vergangenen fünf Weltmeisterschaften, also zwischen 2002 und 2018, gefüttert und mit den tatsächlichen Spielausgängen aller Spiele der jeweiligen Turniere vergleichen lassen – so wird die Gewichtung der einzelnen Informationsquellen für das aktuelle Turnier im Idealfall sehr genau ausfallen.“

Das so weiter trainierte Modell kann in Zukunft übrigens auch für weitere Prognosen verwendet werden – so könne eine bessere Fußball-Prognose in Zukunft vielleicht auch für genauere Wettervorhersagen sorgen, heißt es. Wie gut das Modell in Sachen Fußball abschneidet, werden Fußballbegeisterte am Abend des 18. Dezember 2022 erfahren.

    Weitere Meldungen:

  1. NFL kommt nach Deutschland mit Hengeler Mueller
  2. Mit Whistleblowing gegen Sextortion im Sport
  3. 1. FC Kaiserslautern erhält neuen Investor mit Grub Brugger
  4. Inflation steigt im Jänner 2022 auf 5,0%