Moritz Broschinski (FCB), rechts, erzielt gegen Torhueter Benjamin Roith (Biel), links, das Tor zum 2:0 in der ersten Runde des Schweizer Fussball Cups zwischen dem FC Basel 1893 und dem FC Biel-Bienne im Stadion St. Jakob-Park in Basel, am Samstag, 16. August 2025. (KEYSTONE/Georgios Kefalas)
(Bild: © KEYSTONE / GEORGIOS KEFALAS)

Was taugt xG wirklich?

Expected Goals sollen zeigen, ob Siege verdient sind oder Pleitenserien bloss einer Pechsträhne entspringen. Aber das Modell hat seine Tücken.

Ein Artikel aus ZWÖLF #107 (März/April 2025)

Text: Silvan Kämpfen

In einer Gesellschaft, wo alles irgendwie messbar sein muss, darf auch der Fussball nicht hintenanstehen. Daten, die noch vor zehn Jahren einem kleinen Zirkel von Freaks vorbehalten waren, beschäftigen heute Journalisten, Fans und solche, die eines von beidem werden wollen. Bei YB gegen Lugano resümiert der Blue-Kommentator in den Schlussminuten in aller Selbstverständlichkeit für ein breites Publikum: «Der xG-Wert von YB ist bei 1,01. Statistisch gesehen hat YB also genau so viele Tore auf dem Konto, wie das sein sollte. Lugano hat 0,82, man war aber nicht effizient genug.» Die Masseinheit Expected Goals hat einen steilen Aufstieg hinter sich: Ihre Erwähnung ruft kaum mehr Naserümpfen hervor, sondern gilt als stichhaltigstes Argument in jeder Matchanalyse. xG hat sich derart etabliert, dass es in Berichten mittlerweile nicht einmal mehr jene Erklärung braucht, die jahrelang in jedem Text stand: Der Computer hat ausgerechnet, wie viele Tore das Team gemäss seinen Chancen eigentlich hätte schiessen müssen. Aber was taugt xG eigentlich?

In seinem Buch «Matchplan» zeigte «11 Freunde»-Reporter Christoph Biermann auf, wie alles anfing: Nerds teilten Mitte der Zehnerjahre das Feld in kleine Quadrate ein und definierten für jeden Ort die Wahrscheinlichkeit, dass mit einem Abschluss von dort ein Tor fällt. Die Erkenntnis: Nur in der Region um den Fünfmeterraum und den Penaltypunkt ist die Chance besonders hoch. Sobald es etwas weiter weggeht oder sich der Winkel verschlechtert, gelten Tore als unwahrscheinlich. Die Position etwa, von der YBs Hadjam gegen Lugano traf – leicht seitlich ausserhalb des Strafraums –, kommt im rudimentären Modell von damals auf bloss 3 bis 5 Prozent Trefferquote.

Seither haben sich die Modelle weiter verfeinert. Jedem erfassten Abschluss werden viele weitere sogenannte Qualifiers beigemischt. War der Schütze unter Druck? Schloss er mit dem Fuss oder mit dem Kopf ab? Handelte es sich um eine Kontersituation? Ging dem Abschluss ein weiter Pass oder eine Flanke voraus? Die Antworten auf diese Ja/Nein-Fragen hält bei den meisten Livemodellen ein Datentracker fest, der entweder im Stadion oder vor dem Fernseher sitzt. Sie verändern den xG-Wert noch einmal entscheidend – basierend auf Hunderttausenden Profifussballspielen aus 150 Ligen über die letzten Jahre.

Ein Modell mit Fehlern

Trotzdem findet der Experte: «Die Leute überschätzen die Objektivität von solchen Modellen. Ja, sie sind insofern objektiv, als sie alle verfügbaren Daten nutzen. Aber es bleiben Modelle. Und jedes Modell hat Fehler.» Das sagt David Sumpter. Er ist Professor für Angewandte Mathematik im schwedischen Uppsala und Autor des Buchs «Soccermatics – Fussball und die Magie der Zahlen». Seit letztem Jahr füttert der Brite mit seinem eigenen Unternehmen Twelve die Scoutingabteilungen von Klubs mit Daten. Expected Goals verfolgt er seit den Anfängen. Er weiss deshalb genau, dass das Modell sich der Qualität von Chancen gut annähert, aber manche Dinge schlicht nicht erfasst.

Wir machen die Probe aufs Exempel. Beim Spiel des FC Zürich in Sion läuft Zuber in die Tiefe und legt den Ball mit der Sohle am herausstürzenden Fayulu vorbei perfekt auf Perea zurück, der den fast ruhenden Ball zentral aus 7 Metern ins Netz schiesst. Auf der Linie steht einzig noch Verteidiger Lavanchy. Jeder Fan würde sagen: also wenn er den nicht macht … Und jeder Experte, der diese Szene einzeln beurteilen müsste, würde sagen: Das ist in mindestens 8 von 10 Fällen ein Tor. Der xG-Wert müsste also bei 0,8 liegen. Viele Modelle haben mit der Komplexität solcher Situationen aber offensichtlich ihre liebe Mühe. Anbieter Opta, der von Blue genutzt wird und dessen Zahlen via Fotmob.com frei einsehbar sind, kommt für das Perea-Tor auf einen xG-Wert von 0,43. Noch zurückhaltender gibt sich die in der Scoutingbranche weitverbreitete Datenplattform Wyscout. Dort hat die Chance einen Wert von 0,34. Sprich: Nur jede dritte solche Gelegenheit würde reingehen, was schlicht undenkbar ist.

perea-ezgif
SRF

Mit der Genauigkeit von xG ist es in einzelnen Szenen also nicht immer weit her. Sumpter sagt, ein Mensch, der Chancen auf einer Skala von 1 bis 10 bewerte, würde ähnlich gut abschneiden. Trotz der teils erheblichen Unterschiede bei der Bewertung – manche Torchance wird auf einem Portal doppelt so hoch eingestuft wie anderswo – hat sich gezeigt, dass sich dies im Verlauf der Spieltage ausgleicht. Ende Saison beträgt die Differenz kaum noch 5 Prozent, jedes xG-Modell widerspiegelt das Geschehen auf die Dauer also in etwa ähnlich.

Chancen ebenso wichtig wie Tore

Nicht berücksichtigt wird übrigens der Schütze selber, ob jetzt also Erling Haaland oder Severin Hottiger abschliesst, ist dem Modell egal. Natürlich verfügen Stürmer in Topligen über bessere Finisher-Qualitäten, aber die Abweichung vom Durchschnitt ist vernachlässigbar. Cristiano Ronaldo hat zum Beispiel während eines grossen Teils seiner Karriere xG nicht übertroffen. Harry Kane ist einer der wirklich wenigen, denen das konstant gelingt, aber auch nicht im Übermass. Was diese Spieler eher auszeichnet, ist, dass sie einfach wahnsinnig oft in gute Abschlusspositionen kommen, etwa weil sie die richtigen Läufe machen. Gute xG-Werte sind für Scouts also geradeso interessant wie effektive Tore oder die Chancenauswertung. Das datenbasierte Wissen hatte sicher auch einen Einfluss darauf, dass man heute zum Beispiel viel weniger Weitschüsse sieht als noch vor 15 Jahren

Inzwischen gibt es Anbieter, die dank Machine-Learning in Analysen weitere Parameter berücksichtigen. Mit einem Standbild lässt sich zum Beispiel tracken, wo die Verteidiger bei einem Abschluss effektiv positioniert waren und wie der Goalie beim Absprung stand. Auch die Höhe des Balls und die Geschwindigkeit des Schützen spielen in diesen komplexeren Berechnungen eine Rolle.

David Sumpter sagt, es gebe bei der Verfeinerung im Prinzip keine Grenzen – ausser beim Nutzen. «Ich kann Ihnen ein aufwendiges 3D-Modell bauen, das aufzeigt, ob der Verteidiger mit seinem rechten Fuss in jener Zehntelsekunde den Schuss hätte blocken können oder nicht. Aber wozu? Es ist sinnlos.» Seine Firma hat ganz andere Daten im Fokus: zum Beispiel über welche Seite gegen Team A mehr Chancen kreiert werden und welcher Spieler im Pressing die meisten Fehler begeht. xG-Werte für einzelne Ereignisse seien schlicht nicht relevant.

Das führt uns zu Sumpters Lieblingsthema: Wozu ist xG überhaupt gut? Der Mathematiker hat dazu eine überraschende Meinung. «Es bringt nichts, wenn Journalisten xG auf ein einzelnes Spiel anwenden. Ein richtiger Matchbericht ist da viel aussagekräftiger.» Sumpter erklärt: «Im Fussball ist sehr viel Zufall im Spiel. Das gilt vor allem für die Tore, aber auch Chancen verteilen sich oft beliebig. Die Kräfteverhältnisse in einem Spiel können gleich sein, aber mal hat ein Team zwölf gute Chancen, mal nur vier. Viele kleine, unkontrollierbare Details geben dafür den Ausschlag.» xG berücksichtigt etwa nicht, wann Teams zu Chancen kommen, also ob bei Führung mit einem Konter kurz vor Ende oder bei ausgeglichenem Spielstand zu Beginn. Das führt zu Verzerrungen. Genauso wie vom Schiedsrichter aberkannte Tore, etwa nach einer Millimeter-Abseitsentscheidung, die im Modell nicht einfliessen. Sie sagen aber ebenfalls etwas über das Spiel aus und nehmen in Zusammenfassungen viel Raum ein.

Ab zwölf Spielen fraglich

Wenn Trainer nach einem Spiel sagen, sie hätten eigentlich gewinnen müssen wegen höherer xG-Werte, ist das laut Sumpter meist eine unbrauchbare Ausrede. Erst nach vier Spielen könne man auf Basis von xG eine Tendenz feststellen. Wenn es hier bedeutende Abweichungen zu den Toren gibt, lässt sich von Glück oder Pech reden. Dann spielt ein Team gerade über seinen Verhältnissen oder kommt zu schlecht weg. Am interessantesten wird es ab sieben Spielen. Wenn es dann immer noch zu Abweichungen kommt, liegen tiefere Gründe vor. Irgendetwas, was das Modell nicht begreift, muss das Team gut machen, wenn es trotz tiefen xG-Werten gute Resultate erzielt.

Nach zehn bis zwölf Spielen, sagt Sumpter, werde xG langsam überflüssig. Ab da sagen die tatsächlichen Tore mehr aus als die erwartbaren. Auf die Saison 2024/25 umgemünzt, heisst das: Wenn Winterthur und GC gemäss Modell deutlich besser dastehen müssten, nützt ihnen das herzlich wenig. Es ist vielleicht Pech, wenn man ein oder zwei Mal kurz vor Schluss ein Gegentor kassiert, aber nicht mehr, wenn es sich über eine halbe Saison hinwegzieht. Das hat dann auch mit Mentalem zu tun. Und das kann bis jetzt noch kein Modell erfassen.

xpoints
Umstrittene Aussagekraft: Die aktuelle Tabelle nach erwartbaren Punkten. Quelle: Wyscout

Kommentare