Fussball ist ein im Grunde sehr einfaches Spiel. Das dürfte auch der Grund sein, warum es sich einer solch grossen Beliebtheit auf der ganzen Welt erfreut. Die Fussball-WM ist das grösste, aber vor allem das emotional mitreissendste Fussball-Ereignis überhaupt – selbst erklärte Fussball-Feinde können sich der feierlichen Atmosphäre während einer WM nicht ganz entziehen.
Eine Fussball-WM ist nur eine Fussball-WM, wenn Fussball-Experten (Expertinnen kommen leider eher selten zu Wort) vor, während und nach dem Turnier ihr Wissen in einiger Ausführlichkeit zum Besten geben. Diese Fussball-Auguren meinen es vielleicht gut, aber die meisten von uns möchten nicht den Prophezeiungen der Experten lauschen, sondern dem Fussball-Fest auf dem Feld frönen. Aber irgendwie wollen wir ja doch auch verstehen, warum auf dem Feld passiert, was passiert. Wer, wenn nicht die Experten, soll uns erklären, wodurch Sieg und Niederlage zustande kommen? Natürlich wissenschaftlich-objektiv-neutrale Statistik!
Was aber möglich ist, ist eine statistisch-objektiv-neutrale Analyse der WM 2010 in Südafrika. Weil Statistik objektiv und neutral ist, sind diese Ergebnisse allgemeingültig und erklären, warum die WM 2014 in Brasilien wird verlaufen sein, wie sie verlaufen sein wird. Die im Folgenden aufgelisteten Grafiken zeigen Trendlinien und Kennzahlen zu den Regressionsberechnungen hinter diesen Trendlinien. Die Grafiken zeigen stets «bivariate» Zusammenhangsmasse; d.h., es werden nur jeweils zwei Grössen verglichen. Die «abhängige Variable» in den Grafiken ist immer die Anzahl Punkte, welche ein Team an der WM 2010 erreicht hat. Das bedeutet, dass die Berechnungen versuchen, zu erklären, ob zwischen Punktezahl und anderen Dingen ein Zusammenhang besteht. Die Anzahl Punkte ist kein perfekter Wert, um den Erfolg an einer WM zu messen, weil ein Mehr an Punkten nicht immer eine bessere Position bedeutet. Aber Fussball ist ja keine Wissenschaft.
Der Wert für «R-Quadrat» gibt an, welcher Anteil der Verteilung an erreichten Punkten durch die jeweils andere Variable erklärt wird. Ein R-Quadrat von 0 bedeutet, dass gar nichts erklärt wird, und ein R-Quadrat von 1 bedeutet, dass alles erklärt wird.
Nebst R-Quadrat ist die «Effektstärke» der «unabhängigen Variable» angegeben. Wenn beispielsweise interessiert, ob die durchschnittliche Anzahl geschossener Tore einen Einfluss auf die Punktzahl hat, wäre die durchschnittliche Anzahl geschossener Tore die unabhängige Variable. Die Effektstärke gibt an, um welchen Wert sich die Anzahl Punkte verändert, wenn sich die Anzahl geschossener Tore um 1 verändert.
Die blaue Linie in den Grafiken gibt an, in welche Richtung der Zusammenhang verläuft. Die grauen Flächen sind dabei die «95%-Konfidenzintervalle»: Der wahre Wert der Effektstärke befindet sich mit einer Wahrscheinlichkeit von 95% in diesem Bereich.
Bei der Effektstärke sind unter Umständen noch Sternchen vorhanden («*»). Die Sternchen sind das Allerallerwichtigste in Wissenschaft, weil sie angeben, wie hoch die «Signifikanz» des Effektes ist. Die Sternchen haben folgende Bedeutungen:
- * – Signifikanzniveau von 5%. Die Wahrscheinlichkeit, dass der Zusammenhang zufällig ist, liegt bei 5% oder weniger. Grad noch brauchbar.
- ** – Signifikanzniveau von 1%. Die Wahrscheinlichkeit, dass der Zusammenhang zufällig ist, liegt bei 1% oder weniger. Das ist vielversprechend.
- *** – Signifikanzniveau von 0.1%. Die Wahrscheinlichkeit, dass der Zusammenhang zufällig ist, liegt bei 0.1% oder weniger. Jetzt geht die Post ab!
Im Allgemeinen finden Wissenschaftlerinnen und Wissenschaftler Sinn und Zweck ihres Daseins einzig und allein in der unermüdlichen Jagd nach ***. Alles, was nicht *** ist, ist nichts weiter als ein Zeugnis armseligen Scheiterns.
Das Runde gehört in das Eckige – oder: Tore sind wichtig, aber nicht ausschliesslich
In einem ersten Schritt bietet es sich an, anzuschauen, wie bestimmte Parameter der Spiele an der WM 2010 mit der Anzahl finaler Punkte zusammenhängen. Das Erste, was interessiert, ist die Frage nach den erzielten Toren: Je mehr Goals, desto mehr Punkte am Schluss?
Tore schiessen ist das eine, Tore kassieren das andere. Sind kassierte Treffer auch von Bedeutung?
Und wie sieht es aus, wenn geschossene und kassierte Treffer zusammengerechnet werden? Das zeigt ein Blick auf die Tordifferenz.
Der Neugier halber sei noch ein letzter Aspekt der Matches betrachtet: Die Anzahl kassierter Karten. Beeinflusst die durchschnittliche Anzahl kassierter Karten pro Spiel die totale Anzahl Punkte?
Merkmale ausserhalb des Stadions
Um das Ergebnis einer WM zu erklären, kann man sich auf Daten der WM selber beschränken. Das ist etwas langweilig. Darum sollen in diesem Abschnitt ein paar mehr oder weniger Fussball-bezogene Daten in Verbindung mit dem dem WM-Ergebnis von 2010 gebracht werden.
Spielt es vielleicht eine Rolle, wie fussballbegeistert ein Land ist, um zu erklären, wie gut das Ergebnis an einer WM ist? Eine erste Annäherung an diese Frage kann die Anzahl registrierter Fussballer pro Land geben. Diese Daten werden von der FIFA erhoben. Wie wir alle wissen, ist die FIFA und damit diese Daten vollkommen seriös und vertrauenswürdig.
Die Anzahl registrierter Spieler spielt keine Rolle. Vielleicht die Anzahl Fussbalclubs?
[/text_output]
Ist vielleicht eine andere Statistik der FIFA relevant, nämlich das «FIFA/Coca-Cola World Ranking» (informativ und erfrischend)?
Weitere Faktoren: Fussball als Hobby der Massen oder der Bessergestellten?
Es ist denkbar, dass bestimmte Eigenschaften eines Landes indirekt mit dem Erfolg an der WM zusammenhängen. Eine erste Möglichkeit ist, dass ein Land ganz einfach mehr Fussball-Maestros produziert, je mehr Menschen im Land sind. Mehr Leute gleich mehr Breite gleich mehr Konkurrenz gleich mehr Spitzenfussballer. Stimmt das?
Ist stattdessen vielleicht wichtiger, wie gut es den Leuten in einem Land geht? Fussball quasi als Wohlstands-Phänomen? Eine erste Annäherung an diese Hypothese ist das BIP pro Kopf.
Könnte es sein, dass nicht das durchschnittliche BIP pro Kopf relevant ist, sondern eher die Ungleichheit bei der Verteilung des Wohlstandes? Der Gini-Koeffizient ist hier eine gute Annäherung.
Geht es vielleich nicht nur um die finanzielle Situation, sondern allgemeiner um die Qualität der Lebenslage und der politischen Situation in einem Land? Zuletzt soll zu diesem Zweck geprüft werden, ob zwei Annäherungen in diese Richtung, der «Human Development Index» sowie der «Democracy Index» (von 2010) einen Effekt auf das WM-Ergebnis haben.
Zusammenfassung: WM-Erfolg bedeutet – Tore schiessen!
In diesem Blogeintrag wurden einige Aspekte wissenschaftlich-neutral-objektiv untersucht, um absolute und unumstössliche Wahrheiten zutage zu fördern. Einige Faktoren scheinen einen Einfluss auf den WM-Erfolg auszuüben: Geschossene Tore, kassierte Tore, Tordifferenz, FIFA-Ranking, Demokratie-Index.
Am Schluss hat einzig und allein die Anzahl Tore pro Spiel einen relevanten Einfluss
Welche dieser Dinge sind am wichtigsten? Wenn diese fünf unabhängigen Variablen in einem Modell geprüft werden, ist das Bild eindeutig: Am Schluss hat einzig und allein die Anzahl Tore pro Spiel einen relevanten Einfluss (auf einem Signifikanzniveau von 1%, bei einer Effektstärke von 4.46 und einer Erklärungskraft von 0.58). Was bedeutet das? An der WM wird am ehesten jenes Team erfolgreich sein, welches am meisten Tore schiesst.
Die Handlungsempfehlung, welche sich aufgrund dieser bahnbrechend-wissenschaftlich-objektiv-neutralen Erkenntnis aufdrängt, ist klar: Zurücklehnen, bei der WM mitfiebern, den vor sich hin faselnden Experten nicht übertrieben viel Beachtung schenken – und einfach die Tore geniessen.
Update: Zusammenhang zwischen Toren und Punkten seit 1930
Schön und gut, mag man sich denken – aber diese Daten betreffen ja nur die WM 2010. Was ist mit den restlichen Weltmeisterschaften? Ein Blick in die Daten hilft auch hier weiter.
Vor 1994 gab ein Sieg an der WM nur 2 anstatt 3 Punkte; darum sind die Grafiken aufgeteilt.
9 Comments on “Eine seriös-wissenschaftliche Analyse von Fussball-Weltmeisterschaften”
Ich bin bis jetzt ein Fan von euren Untersuchungen, aber dieser Text ist irgendwie peinlich und nicht nur wegen des Stils…
Was bei diesen „wissenschaftlich-objektiv-neutralen“ Untersuchungen rauskam, war von Anfang relativ klar, aber das ist ja im Prinzip okay. Was mich wirklich stört ist die Schleichwerbung für Coca Cola und die Werbung für FIFA und die WM ohne ein einziges kritisches Wort zu der ganzen komplizierten politischen / moralischen Problematik rund um diese Mafia.
Wissenschaftliche Methodik ist gut, aber wenn sie ohne kritisches Denken und moralische Intelligenz stur rationalistisch angewandt wird, hat das für mich absolut rein gar nichts mehr mit „Skeptik“ zu tun. Da könnt ihr gerade so gut ein Horoskop zur WM hier publizieren…
Hallo Michael
Nicht immer so ernst sein – sonst merkt man nämlich nicht, wenn ein Text nicht so ernst ist :).
Grüsse
Marko
Hoi Marko
Hmm okay, vielleicht ist der Text etwas weniger ernst, als ich in gelesen habe 🙂
Wahrscheinlich liegt es am Thema, dass ich ihn automatisch zu ernst gelesen habe. Die „Fussball-Experten“ zu veralbern und zu entlarven ist natürlich richtig und wichtig und das ist dir mit diesem Text sicherlich auch gelungen. Aber irgendwie hätte ich zu dem Thema (eben gerade im Hinblick auf die neue Weltkirche namens FIFA) mehr von euch erwartet…
Aber wie gesagt, ist mir ein bisschen in den falschen Hals geraten. Sorry für die harten Worte, ich mag euch wirklich!
liebe Grüsse
Michael
Danke für die Zahlen. Warum nimmst du die Anzahl Fussballer / Clubs pro 1000 Einwohner? Die absolute Zahl ist da sicher relevanter. Der Trainer kann ja aus allen vorhandenen Spielern die besten aussuchen. Lichtenstein, die Schweiz und Deutschland haben vermutlich eine ähnliche Spielerdichte, aber nur Deutschland ist schon Weltmeister geworden.
Wie wäre es zusätzlich mit
– Marktwert der Spieler
– Anzahl internationaler Titel
Gruss Benny
Ciao Benny
Bei der absoluten Anzahl Clubs würde der (allfällige) Effekt wohl sehr stark durch die Bevölkerungsgrösse verzerrt (Je mehr Menschen in einem Land, desto mehr Clubs); diese Umwandlung soll quasi diesen Effekt etwas abschwächen.
Die anderen Faktoren wären natürlich auch eine Berechnung wert – nur steigt irgendwann der Aufwand für die Datenerhebung beträchtlich ;).
Gruss
Marko
Pingback: Armillarsphäre, Kreuz des Südens und Sol de Mayo: Die Astronomie der Fußball-Weltmeisterschaft – Astrodicticum Simplex
Lieber Marko,
Sehr amüsanter Text, den Sie geschrieben haben. Statistik fesselt mich mehr als Fussball und deshalb würde ich Ihnen gerne einige Fragen stellen.
Mir ist klar das ein gewisser Sarkasmus und Ironie in diesem Text vorhanden ist; meine Fragen sind deshalb für meine Weiterbildung und nicht eine Kritik an diesem Text. Leider ist mein deutsches Vokabular in Statistik nicht sehr gut, deshalb habe ich in Klammern den exakten Englischen begriff hinzugefügt.
Bei der Regression: Anzahl erzielter Punkte gegen Bevölkerungsgrösse haben Sie einen Log(10) benutz. Falls ich nun die Formel: Anzahl Punkte = y + 0.94 * Bevölkerung (log10) benutzen möchte um die Punkte eines fiktives Landes vorherzusagen (predict) muss dann die absolute Zahl Bevölkerung (z.B. 10 Millionen) irgendwie umgerechnet werden?
Bei meiner zweiten Frage bin ich wohl Opfer des Sarkasmus geworden. Die Aussage „Am Schluss hat einzig und allein die Anzahl Tore pro Spiel einen relevanten Einfluss“, würde in der wissenschaftlichen Methode (scientific method) falsch sein, da diese ein Fehlschluss (fallacy) ist. Genauer, lockerer Reduktionismus (?) (causal reductionism) da viele andere Faktoren die einen Einfluss haben könnten nicht getestet wurden und diese höchstwahrscheinlich existieren auf Grund des tiefen R-Quadrates. Die korrekte Aussage müsste lauten: Die Anzahl der geschossen Tore ist die einzige der getesteten Variablen die einen Einfluss auf den Punktgewinn zu haben scheint. Liege ich da richtig?
Ich würde mich freuen wenn Sie mir diese Fragen beantworten könnten.
Lieber Gruss Patric
Ciao Patric
Das mit den Transformationen von Daten ist so eine Sache. In der Tat muss man sich fragen, warum was genau gemacht wird oder auch nicht. Bei der Log-Umwandlung von Bevölkerungsgrössen in diesem Beispiel sind zwei Faktoren von Belang:
Das ist aber meiner Meinung nach nur im Prinzip ein Problem, weil Normalverteilung erst dann wichtig wird, wenn man konkrete Predictions machen will, was hier nicht der Fall ist.
Bezüglich kausalem Reduktionismus („locker“ wäre eher „casual“ 😉 ): Mit der Schlussfolgerung sind natürlich nur die Effekte innerhalb des getesteten Modells gemeint.
Lieber Gruss, Marko
Pingback: Unser letzter WM-Senf XXXIII: Rückblick WM 2014 Brasilien | FANKULTUR.com