Eine seriös-wissenschaftliche Analyse von Fussball-Weltmeisterschaften

Marko KovicBlog9 Comments

In wenigen Tagen, am 12. Juni, beginnt die Sportveranstaltung schlechthin – die Fussball-Weltmeisterschaft in Brasilien.

Fussball ist ein im Grunde sehr einfaches Spiel. Das dürfte auch der Grund sein, warum es sich einer solch grossen Beliebtheit auf der ganzen Welt erfreut. Die Fussball-WM ist das grösste, aber vor allem das emotional mitreissendste Fussball-Ereignis überhaupt – selbst erklärte Fussball-Feinde können sich der feierlichen Atmosphäre während einer WM nicht ganz entziehen.

Eine Fussball-WM ist nur eine Fussball-WM, wenn Fussball-Experten (Expertinnen kommen leider eher selten zu Wort) vor, während und nach dem Turnier ihr Wissen in einiger Ausführlichkeit zum Besten geben. Diese Fussball-Auguren meinen es vielleicht gut, aber die meisten von uns möchten nicht den Prophezeiungen der Experten lauschen, sondern dem Fussball-Fest auf dem Feld frönen. Aber irgendwie wollen wir ja doch auch verstehen, warum auf dem Feld passiert, was passiert. Wer, wenn nicht die Experten, soll uns erklären, wodurch Sieg und Niederlage zustande kommen? Natürlich wissenschaftlich-objektiv-neutrale Statistik!

Natürlich ist es nicht möglich, vor der WM statistisch-objektiv-neutral zu erklären, warum die WM wird verlaufen sein, wie sie wird verlaufen sein. Die Datenlücken wären zu gross.

Was aber möglich ist, ist eine statistisch-objektiv-neutrale Analyse der WM 2010 in Südafrika. Weil Statistik objektiv und neutral ist, sind diese Ergebnisse allgemeingültig und erklären, warum die WM 2014 in Brasilien wird verlaufen sein, wie sie verlaufen sein wird. Die im Folgenden aufgelisteten Grafiken zeigen Trendlinien und Kennzahlen zu den Regressionsberechnungen hinter diesen Trendlinien. Die Grafiken zeigen stets «bivariate» Zusammenhangsmasse; d.h., es werden nur jeweils zwei Grössen verglichen. Die «abhängige Variable» in den Grafiken ist immer die Anzahl Punkte, welche ein Team an der WM 2010 erreicht hat. Das bedeutet, dass die Berechnungen versuchen, zu erklären, ob zwischen Punktezahl und anderen Dingen ein Zusammenhang besteht. Die Anzahl Punkte ist kein perfekter Wert, um den Erfolg an einer WM zu messen, weil ein Mehr an Punkten nicht immer eine bessere Position bedeutet. Aber Fussball ist ja keine Wissenschaft.

Der Wert für «R-Quadrat» gibt an, welcher Anteil der Verteilung an erreichten Punkten durch die jeweils andere Variable erklärt wird. Ein R-Quadrat von 0 bedeutet, dass gar nichts erklärt wird, und ein R-Quadrat von 1 bedeutet, dass alles erklärt wird.

Nebst R-Quadrat ist die «Effektstärke» der «unabhängigen Variable» angegeben. Wenn beispielsweise interessiert, ob die durchschnittliche Anzahl geschossener Tore einen Einfluss auf die Punktzahl hat, wäre die durchschnittliche Anzahl geschossener Tore die unabhängige Variable. Die Effektstärke gibt an, um welchen Wert sich die Anzahl Punkte verändert, wenn sich die Anzahl geschossener Tore um 1 verändert.

Die blaue Linie in den Grafiken gibt an, in welche Richtung der Zusammenhang verläuft. Die grauen Flächen sind dabei die «95%-Konfidenzintervalle»: Der wahre Wert der Effektstärke befindet sich mit einer Wahrscheinlichkeit von 95% in diesem Bereich.

Bei der Effektstärke sind unter Umständen noch Sternchen vorhanden («*»). Die Sternchen sind das Allerallerwichtigste in Wissenschaft, weil sie angeben, wie hoch die «Signifikanz» des Effektes ist. Die Sternchen haben folgende Bedeutungen:

  • * – Signifikanzniveau von 5%. Die Wahrscheinlichkeit, dass der Zusammenhang zufällig ist, liegt bei 5% oder weniger. Grad noch brauchbar.
  • ** – Signifikanzniveau von 1%. Die Wahrscheinlichkeit, dass der Zusammenhang zufällig ist, liegt bei 1% oder weniger. Das ist vielversprechend.
  • *** – Signifikanzniveau von 0.1%. Die Wahrscheinlichkeit, dass der Zusammenhang zufällig ist, liegt bei 0.1% oder weniger. Jetzt geht die Post ab!

Im Allgemeinen finden Wissenschaftlerinnen und Wissenschaftler Sinn und Zweck ihres Daseins einzig und allein in der unermüdlichen Jagd nach ***. Alles, was nicht *** ist, ist nichts weiter als ein Zeugnis armseligen Scheiterns.

Das Runde gehört in das Eckige – oder: Tore sind wichtig, aber nicht ausschliesslich

In einem ersten Schritt bietet es sich an, anzuschauen, wie bestimmte Parameter der Spiele an der WM 2010 mit der Anzahl finaler Punkte zusammenhängen. Das Erste, was interessiert, ist die Frage nach den erzielten Toren: Je mehr Goals, desto mehr Punkte am Schluss?

In der Tat sind die erzielten Tore wichtig: Im Schnitt bedeutet ein erzieltes Tor, dass am Ende des Turniers 5.74 Punkte mehr auf dem Konto sind. Aber damit ist noch nicht alles erklärt. Der Erklärungswert R-Quadrat beträgt zwar beträchtliche 0.44 und die Signifikanz der Effektstärke ist mit *** hoch, aber die Verteilung der Punkte bleibt zu 0.56 noch unerklärt. Also müssen wir weiterbohren.

Tore schiessen ist das eine, Tore kassieren das andere. Sind kassierte Treffer auch von Bedeutung?

Auch Gegentore scheinen eine Rolle zu spielen. Erklärt werden nur 0.19 der Punkteverteilung, aber der negative Effekt von -2.91 ist gross. Das Signifikanzniveau beträgt aber nur 5% – die Korken sollten wir also nicht knallen lassen.

Und wie sieht es aus, wenn geschossene und kassierte Treffer zusammengerechnet werden? Das zeigt ein Blick auf die Tordifferenz.

Der Effekt der Tordifferenz (geschossene Tore minus kassierte Tore) weist, wenig überraschend, einen positiven Zusammenhang auf. Der Zusammenhang ist stark (3.44 Punkte mehr pro Zunahme der Tordifferenz um 1) und «hochsignifikant». Zudem werden satte 0.49 der Punkteverteilung damit erklärt.

Der Neugier halber sei noch ein letzter Aspekt der Matches betrachtet: Die Anzahl kassierter Karten. Beeinflusst die durchschnittliche Anzahl kassierter Karten pro Spiel die totale Anzahl Punkte?

Tut sie offenbar nicht.

Merkmale ausserhalb des Stadions

Um das Ergebnis einer WM zu erklären, kann man sich auf Daten der WM selber beschränken. Das ist etwas langweilig. Darum sollen in diesem Abschnitt ein paar mehr oder weniger Fussball-bezogene Daten in Verbindung mit dem dem WM-Ergebnis von 2010 gebracht werden.

Spielt es vielleicht eine Rolle, wie fussballbegeistert ein Land ist, um zu erklären, wie gut das Ergebnis an einer WM ist? Eine erste Annäherung an diese Frage kann die Anzahl registrierter Fussballer pro Land geben. Diese Daten werden von der FIFA erhoben. Wie wir alle wissen, ist die FIFA und damit diese Daten vollkommen seriös und vertrauenswürdig.

Die Anzahl registrierter Spieler spielt keine Rolle. Vielleicht die Anzahl Fussbalclubs?

[/text_output]

Auch die Anzahl Fussbalclubs in einem Land sagt nichts über den WM-Erfolg aus.

Ist vielleicht eine andere Statistik der FIFA relevant, nämlich das «FIFA/Coca-Cola World Ranking» (informativ und erfrischend)?

In der Tat: Die geballte Kompetenz von FIFA und Coca Cola ist nicht vergeudet. Zwar ist der Effekt des FIFA-Rankings unmittelbar vor dem Turnier gering, aber dafür «hochsignifikant» und doch recht potent, was die Erklärungskraft angeht (R-Quadrat von 0.32).

Weitere Faktoren: Fussball als Hobby der Massen oder der Bessergestellten?

Es ist denkbar, dass bestimmte Eigenschaften eines Landes indirekt mit dem Erfolg an der WM zusammenhängen. Eine erste Möglichkeit ist, dass ein Land ganz einfach mehr Fussball-Maestros produziert, je mehr Menschen im Land sind. Mehr Leute gleich mehr Breite gleich mehr Konkurrenz gleich mehr Spitzenfussballer. Stimmt das?

Die Bevölkerungsgrösse (in der Grafik logarithmisiert, weil das wissenschaftlich-objektiv-neutraler ist) ist scheinbar kein relevanter Faktor für das WM-Gelingen.

Ist stattdessen vielleicht wichtiger, wie gut es den Leuten in einem Land geht? Fussball quasi als Wohlstands-Phänomen? Eine erste Annäherung an diese Hypothese ist das BIP pro Kopf.

Das BIP pro Kopf nimmt keinen Einfluss.

Könnte es sein, dass nicht das durchschnittliche BIP pro Kopf relevant ist, sondern eher die Ungleichheit bei der Verteilung des Wohlstandes? Der Gini-Koeffizient ist hier eine gute Annäherung.

Nicht nur das BIP pro Kopf, sondern auch der Gini-Koeffizient geben keinerlei Aufschluss über das WM-Ergebnis.

Geht es vielleich nicht nur um die finanzielle Situation, sondern allgemeiner um die Qualität der Lebenslage und der politischen Situation in einem Land? Zuletzt soll zu diesem Zweck geprüft werden, ob zwei Annäherungen in diese Richtung, der «Human Development Index» sowie der «Democracy Index» (von 2010) einen Effekt auf das WM-Ergebnis haben.

Beim Human Development Index ist kein Zusammenhang zu beobachten, dafür aber beim Democracy Index. Bei Letzterem ist aber das Signifikanzniveau tief, der Effekt schwach und die Erklärungskraft bescheiden. Aber immerhin; man nimmt, was man bekommt.

Zusammenfassung: WM-Erfolg bedeutet – Tore schiessen!

In diesem Blogeintrag wurden einige Aspekte wissenschaftlich-neutral-objektiv untersucht, um absolute und unumstössliche Wahrheiten zutage zu fördern. Einige Faktoren scheinen einen Einfluss auf den WM-Erfolg auszuüben: Geschossene Tore, kassierte Tore, Tordifferenz, FIFA-Ranking, Demokratie-Index.

Am Schluss hat einzig und allein die Anzahl Tore pro Spiel einen relevanten Einfluss

Welche dieser Dinge sind am wichtigsten? Wenn diese fünf unabhängigen Variablen in einem Modell geprüft werden, ist das Bild eindeutig: Am Schluss hat einzig und allein die Anzahl Tore pro Spiel einen relevanten Einfluss (auf einem Signifikanzniveau von 1%, bei einer Effektstärke von 4.46 und einer Erklärungskraft von 0.58). Was bedeutet das? An der WM wird am ehesten jenes Team erfolgreich sein, welches am meisten Tore schiesst.

Die Handlungsempfehlung, welche sich aufgrund dieser bahnbrechend-wissenschaftlich-objektiv-neutralen Erkenntnis aufdrängt, ist klar: Zurücklehnen, bei der WM mitfiebern, den vor sich hin faselnden Experten nicht übertrieben viel Beachtung schenken – und einfach die Tore geniessen.

Update: Zusammenhang zwischen Toren und Punkten seit 1930

Schön und gut, mag man sich denken – aber diese Daten betreffen ja nur die WM 2010. Was ist mit den restlichen Weltmeisterschaften? Ein Blick in die Daten hilft auch hier weiter.

Vor 1994 gab ein Sieg an der WM nur 2 anstatt 3 Punkte; darum sind die Grafiken aufgeteilt.

Tore pro Spiel, 1994-2010Tore pro Spiel, 1930-1990Tore pro Spiel, 1950-1990

Der Zusammenhang zwischen durchschnittlicher Anzahl Tore pro Spiel und total gewonnenen Punkten ist nach wie vor vorhanden. Für die WMs ab 1994 ist der Effekt deutlich stärker als vorher, als ein Sieg nur 2 Punkte gab. Wenn die zwei antiken Weltmeisterschaften vor dem 2. Weltkrieg weggelassen werden und nur jene zwischen 1950 und 1990 betrachtet werden, ist der Effekt ein wenig stärker.

Autor

9 Comments on “Eine seriös-wissenschaftliche Analyse von Fussball-Weltmeisterschaften”

  1. Ich bin bis jetzt ein Fan von euren Untersuchungen, aber dieser Text ist irgendwie peinlich und nicht nur wegen des Stils…
    Was bei diesen „wissenschaftlich-objektiv-neutralen“ Untersuchungen rauskam, war von Anfang relativ klar, aber das ist ja im Prinzip okay. Was mich wirklich stört ist die Schleichwerbung für Coca Cola und die Werbung für FIFA und die WM ohne ein einziges kritisches Wort zu der ganzen komplizierten politischen / moralischen Problematik rund um diese Mafia.

    Wissenschaftliche Methodik ist gut, aber wenn sie ohne kritisches Denken und moralische Intelligenz stur rationalistisch angewandt wird, hat das für mich absolut rein gar nichts mehr mit „Skeptik“ zu tun. Da könnt ihr gerade so gut ein Horoskop zur WM hier publizieren…

    1. Hallo Michael

      Nicht immer so ernst sein – sonst merkt man nämlich nicht, wenn ein Text nicht so ernst ist :).

      Grüsse
      Marko

      1. Hoi Marko

        Hmm okay, vielleicht ist der Text etwas weniger ernst, als ich in gelesen habe 🙂
        Wahrscheinlich liegt es am Thema, dass ich ihn automatisch zu ernst gelesen habe. Die „Fussball-Experten“ zu veralbern und zu entlarven ist natürlich richtig und wichtig und das ist dir mit diesem Text sicherlich auch gelungen. Aber irgendwie hätte ich zu dem Thema (eben gerade im Hinblick auf die neue Weltkirche namens FIFA) mehr von euch erwartet…

        Aber wie gesagt, ist mir ein bisschen in den falschen Hals geraten. Sorry für die harten Worte, ich mag euch wirklich!

        liebe Grüsse
        Michael

  2. Danke für die Zahlen. Warum nimmst du die Anzahl Fussballer / Clubs pro 1000 Einwohner? Die absolute Zahl ist da sicher relevanter. Der Trainer kann ja aus allen vorhandenen Spielern die besten aussuchen. Lichtenstein, die Schweiz und Deutschland haben vermutlich eine ähnliche Spielerdichte, aber nur Deutschland ist schon Weltmeister geworden.

    Wie wäre es zusätzlich mit
    – Marktwert der Spieler
    – Anzahl internationaler Titel

    Gruss Benny

    1. Ciao Benny

      Bei der absoluten Anzahl Clubs würde der (allfällige) Effekt wohl sehr stark durch die Bevölkerungsgrösse verzerrt (Je mehr Menschen in einem Land, desto mehr Clubs); diese Umwandlung soll quasi diesen Effekt etwas abschwächen.

      Die anderen Faktoren wären natürlich auch eine Berechnung wert – nur steigt irgendwann der Aufwand für die Datenerhebung beträchtlich ;).

      Gruss
      Marko

  3. Pingback: Armillarsphäre, Kreuz des Südens und Sol de Mayo: Die Astronomie der Fußball-Weltmeisterschaft – Astrodicticum Simplex

  4. Lieber Marko,
    Sehr amüsanter Text, den Sie geschrieben haben. Statistik fesselt mich mehr als Fussball und deshalb würde ich Ihnen gerne einige Fragen stellen.
    Mir ist klar das ein gewisser Sarkasmus und Ironie in diesem Text vorhanden ist; meine Fragen sind deshalb für meine Weiterbildung und nicht eine Kritik an diesem Text. Leider ist mein deutsches Vokabular in Statistik nicht sehr gut, deshalb habe ich in Klammern den exakten Englischen begriff hinzugefügt.
    Bei der Regression: Anzahl erzielter Punkte gegen Bevölkerungsgrösse haben Sie einen Log(10) benutz. Falls ich nun die Formel: Anzahl Punkte = y + 0.94 * Bevölkerung (log10) benutzen möchte um die Punkte eines fiktives Landes vorherzusagen (predict) muss dann die absolute Zahl Bevölkerung (z.B. 10 Millionen) irgendwie umgerechnet werden?
    Bei meiner zweiten Frage bin ich wohl Opfer des Sarkasmus geworden. Die Aussage „Am Schluss hat einzig und allein die Anzahl Tore pro Spiel einen relevanten Einfluss“, würde in der wissenschaftlichen Methode (scientific method) falsch sein, da diese ein Fehlschluss (fallacy) ist. Genauer, lockerer Reduktionismus (?) (causal reductionism) da viele andere Faktoren die einen Einfluss haben könnten nicht getestet wurden und diese höchstwahrscheinlich existieren auf Grund des tiefen R-Quadrates. Die korrekte Aussage müsste lauten: Die Anzahl der geschossen Tore ist die einzige der getesteten Variablen die einen Einfluss auf den Punktgewinn zu haben scheint. Liege ich da richtig?
    Ich würde mich freuen wenn Sie mir diese Fragen beantworten könnten.
    Lieber Gruss Patric

    1. Ciao Patric

      Das mit den Transformationen von Daten ist so eine Sache. In der Tat muss man sich fragen, warum was genau gemacht wird oder auch nicht. Bei der Log-Umwandlung von Bevölkerungsgrössen in diesem Beispiel sind zwei Faktoren von Belang:

      • Visualisierung: Bevölkerungsgrössen ohne Umwandlung sind oft unschön in Scatterplots. Die meisten Punkte sind irgendwo unten links zusammengequetscht, und oben rechts sind ein paar Ausreisser. Eine Log-Transormfation zeigt die Punkte übersichtlicher.
      • Parametrische Tests: Bevölkerungsgrössen sind, je nach Sample, sehr stark nicht-normalverteilt. Das ist, im Prinzip, ein Problem für parametrische Tests wie bei der hier eingesetzten Regression. Bei parametrischen Tests wird Normalverteilung vorausgesetzt, und eine Log-Transformation ist einer der (vielen) möglichen Wege, um die Daten etwas näher an die Normalverteilung zu bringen.
        Das ist aber meiner Meinung nach nur im Prinzip ein Problem, weil Normalverteilung erst dann wichtig wird, wenn man konkrete Predictions machen will, was hier nicht der Fall ist.

      Bezüglich kausalem Reduktionismus („locker“ wäre eher „casual“ 😉 ): Mit der Schlussfolgerung sind natürlich nur die Effekte innerhalb des getesteten Modells gemeint.

      Lieber Gruss, Marko

  5. Pingback: Unser letzter WM-Senf XXXIII: Rückblick WM 2014 Brasilien | FANKULTUR.com

Kommentar schreiben