Da Dortmund på et tidspunkt i sidste sæson lå håbløst sidst i Bundesligaen, blev de alligevel rangeret som det næstbedste tyske hold af et betting-syndikat. Hvorfor? Vi prøver at give forklaringen i denne serie om "expected goals model," som er en ny og avanceret form for skudstatistik. BetXpert-brugeren zAAz har dykket ned i fænomenet, som kan hjælpe dig med at sortere en masse minus-værdi fra.

I fodbold hører man ofte klicheen “tabellen lyver aldrig”. Det er svært ikke at lade sig overbevise, da disse tre ord bliver genfortalt af trænere, spillere, eksperter, kommentatorer og fans hver eneste sæson.

Virkeligheden er dog langt mere kompliceret, da fodbold er en sport fyldt med tilfældigheder. Disse tilfældigheder er ofte afgørende for udfaldene af fodboldkampe, da mål er en sjælden begivenhed i fodbold i forhold til andre sportsgrene.

Vi har alle sammen været vidne til, at det ene hold dominerer det andet hold i 90 minutter, men alligevel taber efter et langskud, der bliver rettet af på vejen og snyder målmanden. Tilfældighederne faldt altså ud til det ene holds fordel; de var heldige, om man vil.

Det er almen viden, at held og uheld udligner sig over tid, hvorfor tabellen er mere retvisende desto længere vi kommer hen i sæsonen. I statistik kaldes det law of large numbers, når man skal forklare, at tilfældighederne udlignes på lang sigt. Der vil dog altid være heldige og uheldige hold, selv over en hel sæson.

Betydningen af held og uheld vil være endnu mere markant i løbet af sæsonen, da det udlignes i takt med antallet af spillede kampe. Eksempelvis lå Dortmund sidst i Bundesligaen, da der var spillet 13 kampe i den forgangne sæson. I den forbindelse udtalte ejeren af betting-syndikatet Smartodds, at Dortmund stadig var Tysklands andet bedste hold ifølge deres modeller.

De havde bare været ekstremt uheldige, hvorfor de lå på sidstepladsen. De mange tilfældigheder har den konsekvens, at tabellen ikke altid er den bedste indikator for holdenes styrke. Derfor skal man være påpasselig med at anvende tabellen i sin betting, da der skal en del kampe til, før at den giver et nogenlunde retvisende styrkeforhold klubberne imellem.

Betting handler nemlig om at forudsige fremtiden. Dette gør man bedst, hvis man kender til holdenes reelle styrke, hvor held og uheld er sorteret fra. Man kan ikke forvente at et hold, der har haft heldet tidligere vil have det samme held fremadrettet. Derfor udvikler man modeller, der kan give et mere præcist billede af holdenes reelle styrke. Det er her expected goals (forkortet ExpG) kommer ind i billedet.

Kan sortere minusværdien fra

Expected goals er det antal forventede mål et hold burde have scoret og indkasseret i sæsonen, når man sorterer tilfældighederne fra. Man prøver kort sagt at kvantificere holdenes reelle styrke ved at kigge på det spillemæssige fremfor resultaterne.

Det giver først og fremmest et mere nuanceret statistisk grundlag, når man skal sætte en chancevurdering på en kamp. Derudover får man et billede af, hvilke hold der har været heldige og uheldige i sæsonen. Konceptet vil være en øjenåbner, hvis man tidligere har taget tabellen og holdenes resultater for gode varer. Det var det i hvert fald for undertegnede.

ExpG er ikke nødvendigvis et redskab til at finde valuebets, da det til en vis grad er inkorporeret i oddsene. Det er nemlig ikke gået bookmakerne og betting-syndikaternes næse forbi, at ExpG indeholder et kæmpe potentiale. Et kendskab til ExpG giver dog en helt anden forståelse for oddssætningen, da oddsene i langt højere grad giver mening.

Jeg har personligt fået sorteret en del dårlige bets fra, da jeg opdagede, at oddsene simpelthen var langt mere nuanceret end min egen fortolkning af tabellen, holdenes form og hjemme/udebane-statistikken.

Har man et redskab, som kan frasortere en masse minusværdi fra, så er det jo i den grad noget, der kan ses på betting-bundlinjen.

Selve beregningen af ExpG sker hovedsageligt med baggrund i holdenes skudstats, men dette vil jeg uddybe senere i artiklen. Indledningsvis vil artiklen beskrive selve baggrunden for at anvende stats i fodboldbetting. Det er nemlig med til at forklare, hvad der gør ExpG til noget specielt.

Fodboldens spåkugle

I fodbold-betting er man optaget af "metrics", der har en høj korrelation med fremtidig succes. Man ønsker kort sagt at finde stats, der giver et fingerpeg om fremtiden. Dette gøres eksempelvis ved at dele sæsonen op i to, hvorefter man identificerer de stats fra første halvdel af sæsonen, der har den højeste korrelation med holdenes antal point i den anden halvdel af sæsonen.

Jo højere korrelationen er, desto bedre er statistikken til at forudse fremtiden. Et holds antal indkast fortæller eksempelvis ikke det store om holdets fremtidige succes, hvorfor korrelationen er lav.

Undersøgelser har vist, at målforskel er den statistik fra tabellen, der har den højeste korrelation med fremtidige point. Målforskel er altså bedre end tidligere point til at forudse fremtidige point. Det skyldes, at målforskel er mere retvisende for et holds styrke end placeringen i tabellen. Derfor er det en bedre indikator for fremtidig succes.

Undersøgelser har ligeledes vist, at skudforsøg-ratio er en rigtig god indikator for fremtidig succes. Tallet udtrykker den andel af skudforsøg, som et hold har haft i dets kampe. Det beregnes således: skudforsøg for / (skudforsøg for + skudforsøg imod).

Korrelation med fremtidig succes er faktisk den højeste blandt alle lettilgængelige statistikker med undtagelse af skud på mål-ratio.

Hvilsoms - ualmindelige - mange mål

Det skyldes, at der er en del tilfældigheder involveret, når det kommer til udfaldet af afslutninger. Eksempelvis scorede Hobros Mads Hvilsom på 33% af sine forsøg i den forgangne sæson. Det vil han have svært ved at opretholde på lang sigt, da han med stor sandsynlighed var ualmindeligt heldig.

Messi scorer eksempelvis kun på 20% af sine skud, hvilket i forvejen er lidt af bedrift, da der i gennemsnit kun scores på 10% af alle skud. Undersøgelser har faktisk vist, at kvaliteten af spilleren, der afslutter, ikke har specielt stor betydning for udfaldet af slutningen. Der er selvfølgelig enkelte spillere, der er helt exceptionelle til at afslutte, men generelt er der langt mere tilfældighed end evner involveret, når det kommer til udfaldet af afslutninger.

Der er til gengæld meget lidt tilfældighed forbundet med det at komme frem til afslutningerne. De gode hold og de bedste spillere er ikke markant bedre til at afslutte end alle andre - de kommer bare frem til flere og større chancer. Derfor har skudforsøg og skud på mål (indenfor rammen) tidligere været de foretrukne stats blandt statsnørderne i betting-miljøet. Dette ændrede sig med opdagelsen af expected goals.

Expected goals er mere end bare skudstats; det er den hardcore udgave af skudstats. Derfor er korrelationen med fremtidig succes også højere. Der er endnu ikke offentliggjort en stat med højere korrelation med fremtidig succes end en variant af ExpG. Derfor er det et magtfuld redskab, hvis man vil kende til holdenes reelle styrke. Man skal dog være villig til at bruge rigtig mange timer foran computerskærmen, hvis man vil beregne det selv. Det er nemlig ikke helt ligetil, hvis det skal være nøjagtigt. Hvis dette ikke slår én ud, så vil det følgende afsnit skitsere metoden for beregning af ExpG.

Metoden bag: Sådan beregner du ExpG

Selve udregningen tager udgangspunkt i alle holdenes skudforsøg. Man prøver at beregne sig frem til, hvor mange mål det enkelte hold burde have scoret og indkasseret ud fra deres skudstats. Skudforsøg er dog ikke bare skudforsøg. Eksempelvis vil en afslutning fra det lille felt have langt større chance for at gå i mål end et skud uden for feltet.

Ligeledes er et skud med foden betydeligt farligere end et hovedstød, hvis begge foretages fra samme afstand til målet. Disse faktorer prøver ExpG at tage højde for, da man tildeler hvert enkelt skudforsøg en sandsynlighed for at gå i mål. Herved adskiller ExpG sig fra simple skudstats, hvor alle skud bliver gjort lige. Dette er en afgørende forskel, da det har vist sig, at visse hold kommer frem til større chancer end andre.

De føromtalte sandsynligheder finder man ved at tjekke mange tusinde afslutninger igennem. Man laver simpelthen en database med afslutninger, hvor man har informationer om hver enkelt afslutning. Herefter opdeler man afslutningerne på baggrund af de faktorer, man finder relevante. Der er rigtig mange muligheder, men de mest almindelige faktorer er afstand til mål, fod/hovedstød, assist-type (indlæg, bold i dybden, ingen assist etc.) og situation (åbent spil, standardsituation, kontra etc.).

Det kan dog blive meget vildere, da man eksempelvis kan kigge på angrebets fart, målmandens placering, hvorfra assisten kom osv. Disse informationer er dog ikke frit tilgængelige, hvorfor det ikke er aktuelt for os dødelige. Antallet og valget af faktorer har betydning for de tal, man får regnet sig frem til. Jo flere faktorer, desto mere præcist er ExpG.

Efter man har udvalgt de relevante faktorer, undersøger man, hvor ofte de forskellige skud går i mål med udgangspunkt i sin database bestående af tusindvis af skud. Eksempelvis finder man sandsynligheden for, at et hovedstød fra det lille felt efter en dødbold er gået i mål historisk set.

Dette gør man så med alle de forskellige afslutningskombinationer. Disse sandsynligheder ligger til grund for ens udregning af holdenes ExpG, hvor man giver hvert enkelt skud en sandsynlighed for at gå i mål. Hvis et hovedstød fra det lille felt efter en dødbold er gået i mål 15% af gangene historisk set, så vil et hold få 0,15 ExpG, hvis de har et forsøg af denne karakter.

Derefter lægger man alle skudforsøgenes sandsynligheder sammen for hvert enkelt hold, hvortil man har holdenes forventede antal scorede mål for sæsonen. Hvis et hold har to skud, hvor det ene har 15% chance for at gå i mål og det andet skud har 10%, så har holdet 0,25 forventede antal scoret mål (ExpG for).

Det samme gør man med holdenes indkasserede skud, hvorved man får holdenes forventede antal indkasserede mål (ExpG imod). Disse to tal er en rigtig god indikator for et holds offensive og defensive styrke. Man kan samtidig beregne ExpG-ratio, der gør en i stand til at rangere holdene ift. hinanden efter bare 8-10 kampe. Et holds ExpG-ratio beregnes således: ExpG for / (ExpG for + ExpG imod). Dette tal er især tidligt på sæsonen langt mere retvisende for et holds styrke end placeringen i tabellen, da tabellen typisk først er nogenlunde retvisende efter 25-30 kampe.

FCM-ejer blev rig af ExpG

ExpG har faktisk været benyttet i en del år af diverse betting-syndikater, hvor det eksempelvis var med til at gøre ejeren af FC Midtjylland, Matthew Benham, til milliardær. Han ejer nemlig syndikatet Smartodds, hvor man kort sagt lever af at fastsætte sandsynligheder på udfaldene af fodboldkampe. Hertil anvendes en variant af ExpG, der dog må forventes at være langt mere avanceret, end det vi kender til.

ExpG er dog det nye sort i statsmiljøet, hvor det har været under konstant udvikling de sidste par år. Der sidder en del amatører og arbejder på ExpG, men det er kun en lille del af resultaterne, der er blevet gjort tilgængeligt for os dødelige. Det er næsten kun på Premier League, at man kan finde ExpG i øjeblikket. Jeg spår dog, at flere forskellige amatører vil gøre deres arbejde tilgængeligt for de større ligaer indenfor den nærmeste fremtid. Det er dog bare et gæt. Det ville dog gøre ExpG lidt mere anvendeligt, da man derved ikke skulle gøre det hele selv. 

Der går sandsynligvis ikke længe, inden at man kan finde ExpG for de forskellige ligaer på nettet. Der blev allerede i forrige sæson offentliggjort en variant af ExpG for Premier League, hvor tallene blev opdateret efter hver runde. [1] Den alternative tabel for Premier League 14/15:

Hold ExpG for ExpG imod ExpG-ratio
Chelsea 64,5 33,1 0,661
Arsenal 68,1 36,5 0,651
Manchester City 71 40 0,639
Southampton 55,4 39,8 0,582
Liverpool 54,2 41,3 0,569
Manchester United 52 43,1 0,547
Stoke 47,7 46,5 0,507
Crystal Palace 44,1 44,9 0,496
Tottenham 49 54,1 0,475
Newcastle  43,4  48,2  0,474 
West Ham  51,1  56,6  0,474 
Aston Villa  38,4  46  0,455 
Everton  38,2  45,9  0,454 
Leicester  44,3  56,2  0,441 
Sunderland  38,8  50,4  0,435 
 Swansea 41,2  53,7  0,434 
 Burnley 43,2  57,3  0,43 
West Bromwich  39,2  52,5  0,427 
Queens Park Rangers  46,7  65,9  0,415 
 Hull 35,4  52,4 0,403
ExpG for = De mål holdet måtte forventes selv at score
ExpG imod = De mål holdet måtte forventes at indkassere
ExpG-ratio =  ExpG for / (ExpG for + ExpG imod)
 

Det har sidenhen vist sig, at eksempelvis Swansea bliver undervurderet af ExpG, hvorfor man undersøger nye måder, der kan præcisere tallene. Expected goals er nemlig stadigvæk i det tidlige stadie, hvor der vil være børnesygdomme. ExpG har dog stadig sin berettigelse, da det giver et langt mere nuanceret syn på styrkeforholdene i løbet af sæsonen.

Konceptet bliver derfor mere og mere udbredt, hvorfor det ikke kun omtales i den hardcore gruppe af statsnørder. Man kan allerede nu støde på begrebet i fodboldartikler fra engelske skribenter.

Der går ikke længe, inden at ExpG vil blive anvendt af den menige better. Jeg kigger eksempelvis allerede på det i min egen betting, hvor det har været et positivt bekendtskab. ExpG giver en bedre forståelse for oddssætningen, da man får et helt andet syn på styrkeforholdet klubberne imellem.

Tabellen snyder nemlig én, hvis man prøver at tjene penge på dens mange tilfældigheder. Det kræver langt mere avanceret statistik, hvis man vil slå bookmakerne på stats. Expected goals er endnu ikke den hellige gral, når det kommer til at slå bookmakerne med baggrund i stats, men det er tætteste vi kommer i øjeblikket.

To be continued

Dette er den første artikel i en serie om expected goals model. Konceptet er nemlig ikke uden faldgruber, forbehold og ubesvarede spørgsmål, hvilket jeg vil berøre i den næste artikel om emnet. Derudover vil jeg komme med mit bud på fremtidsudsigterne indenfor ExpG. Det kan nemlig blive rigtig avanceret, da der indsamles enormt meget data fra fodboldkampe nu om dage.

Jeg vil ligeledes beskrive, hvordan jeg selv helt konkret bruger det, og hvordan man henter nogle af de data, der ligger til grund for ExpG. De er muligvis frit tilgængelige, men det er ikke helt lige til at indsamle dem.

[1] Kildehenvising: cartilagefreecaptain