Fjerde - og foreløbig sidste del - i serien om Expected goals model. Denne gang kigger forfatteren zAAz på fejl og mangler, egne erfaringer samt fremtidsudsigterne indenfor stats i fodboldbetting. Det kan nemlig blive meget vildere endnu.
Vi har i de første tre artikler om expected goals model - den avancerede form for skudstatistik - været inde på, hvorfor tabellen sandsynligvis ofte lyver - selvom man påstår, at den aldrig gør det. Vi har kigget på, hvordan modellen bl.a. differentierer hovedstød og skud fra hinanden, og hvordan man får expected goals model lavet om til en chancevurdering.
Inden vi skal se på, hvor vild en fremtid vi har i vente med fodboldstats, så vil jeg først forklare, hvorfor man skal være påpasselig med at stirre sig blindt på tallene. Expected goals model er nemlig ikke uden fejl:
1) ExpG-stats indeholder en vis mængde usikkerhed, da de skuddata, der er tilgængelige i øjeblikket, er delvist mangelfulde. Det er et problem, da de tal man ender op med afhænger af de data, man fodrer modellen med: Mangelfuldt input giver mangelfuldt output.
Eksempelvis kender vi ikke til forsvarsspillernes position i skudøjeblikket, hvilket har stor betydning for skuddenes kvalitet. Et skud frit for mål og et skud med tre forsvarsspillere i skudlinjen burde have to vidt forskellige sandsynligheder for at gå i mål. Det er bare ikke tilfældet i øjeblikket, da ingen har adgang til data om forsvarsspillernes positioner. Derfor vil man fejlvurdere visse hold, da nogle er bedre til at presse modstanderen i skudøjeblikket end andre.
Derudover antager modellen, at alle målmænd er gjort lige. Det er ikke tilfældet i virkeligheden, da visse målmænd redder flere skud end andre. Kvalitetsforskellen mellem målmænd har herved betydning for et holds antal indkasseret mål, hvilket ExpG ikke opfanger.
Denne forskel mellem målmænd er svær at tage højde for, da det kræver en god mængde skuddata at bedømme den enkelte målmands redningsevner. Det skal dog siges, at kvalitetsforskellen mellem målmænd i den samme liga er forholdsvis lille. Det er også grunden til, at det er svært at skelne de gode målmænd fra de dårlige.
ExpG er (også) præget af tilfældigheder
2) Alle stats i fodbold er præget af tilfældigheder; ExpG er ingen undtagelse. Det har den betydning, at to hold med identisk styrke ikke nødvendigvis bliver målt ens af ExpG. Præcisionen øges i takt med antallet af spillede kampe, men ExpG kan sagtens fejlvurdere et hold efter 10 kampe. Det vil dog være mere præcist end målstats i starten af sæsonen, da sidstnævnte indeholder en del tilfældigheder over få kampe.
Man skal være opmærksom på, at ExpG er mest anvendeligt på ligaer med styrkeforskelle mellem holdene. Hvis holdene i en liga er fuldstændig ens i styrke, så vil ExpG-stats udelukkende måle tilfældigheder. Derfor virker ExpG bedst på ligaer, hvor midterholdene ikke udgør en alt for stor gruppe.
Premier League er eksempelvis en god liga for ExpG, da man har tophold, subtophold, midterhold og bundhold. ExpG er derimod mindre anvendeligt på MLS, da holdene bliver begrænset af et lønloft.
Derudover virker ExpG bedst på de ligaer, hvor holdene ikke svinger for meget i kvalitet i løbet af sæsonen. Det er jo ikke anvendeligt med stats om fortiden, hvis det ikke er retvisende for holdenes styrke fremadrettet. Det er eksempelvis et problem i de lavere rækker i England, hvor holdene med et moneyboost kan gå fra at være midterhold til tophold henover vinteren. Det ser man ikke i samme grad i de større ligaer, da det kræver væsentligt flere penge.
Fortiden, jo tak, men hvad sker i fremtiden?
3) ExpG fortæller noget om fortiden, men det er fremtiden, vi er interesseret i. Vores mål er jo at forudsige holdenes styrke i den opkommende kamp. Der er dog ingen garanti for, at et hold vil spille godt i fremtiden, selvom de har spillet godt tidligere på sæsonen. Det bliver man nødt til at være opmærksom på, da man ellers vil fejlvurdere visse hold.
Man kan sige, at hold ofte har en fundamental styrke, hvilket de sjældent afviger alt for meget fra. Det går selvfølgelig lidt op og ned i løbet af en sæson, men på længere sigt bevæger holdene sig gerne mod deres underliggende niveau. Det er en form for regression to the mean, hvilket brugeren Skilled-Highroller har skrevet en uddybende artikel om.
Eksempelvis vil Chelsea stadig være at regne for et af de bedste hold i England, selvom de måske ikke har spillet deres bedste fodbold i denne sæson. De har så mange dygtige spillere, at det nærmest kun kan gå fremad. Dette kan ExpG ikke tage højde for, hvilket er et rigtig stort problem. Jeg vil derfor anbefale, at man kigger på flere stats end ExpG, da det giver et bredere perspektiv af holdene.
Det kunne eksempelvis være målstats for de sidste 30-50 kampe, da det fortæller noget om holdenes styrke historisk set. Det kunne også være holdenes lønbudget (ift. ligaen), da det er en rigtig god indikator for holdenes styrke på længere sigt. Det viser sig også, at bestemte typer for boldbesiddelse fortæller noget om holdenes styrke. Det vil jeg komme ind på i næste afsnit, der kigger på fremtiden indenfor stats i fodboldbetting.
Farlig boldbesiddelse: Fremtidens stats
Jeg vil vove den påstand, at det kræver meget avancerede stats, hvis man vil have en statistisk edge over bookmakerne. Alle andre har også adgang til tabellen, holdenes form, tidligere indbyrdes opgør, hjemme/udebane-statistik osv. Man kan simpelthen ikke slå bookmakerne på fodbold ved at fortolke de her stats. Expected Goals er godt nok en avanceret statistisk model, men den er i sig selv heller ikke nok.
Man er nødsaget til at kombinere flere stats, der fortæller os noget meningsfuldt om holdenes styrke fremadrettet. En af disse meningsfulde stats er farlig boldbesiddelse.
Der var en årgang, hvor boldbesiddelse var det helt store. Guardiola havde lige vundet The Treble med Barca, og alle klubber var indstillet på at skulle spille tiki-taka. Det smukke kombinationsspil, hvor bolden blev holdt nede på jorden og trillet ind over stregen.
Det viste sig dog, at de færreste hold kunne gøre Barca kunsten efter. De fleste hold trillede bolden kønsløst rundt på egen banehalvdel i stedet for at angribe modstanderens mål. Man begyndte at se lidt skævt til boldbesiddelse-stats, da det ofte bare var et udtryk for ligegyldige pasninger.
Boldbesiddelse er dog ikke ligegyldigt; man skal bare fokusere på det væsentlige. Det viser sig nemlig, at de bedste hold har bolden oppe omkring modstanderens mål langt mere end de dårlige hold. Det skyldes, at mål stammer fra skud, og skud stammer fra farlige boldbesiddelser. Derfor fortæller farlige boldbesiddelser noget om holdenes mulighed for at skabe chancer, hvilket er nødvendigt for at score mål.
Der er kampe, hvor det ene hold dominerer fuldstændig, men simpelthen mangler det sidste held med den afgørende aflevering. Her vil stats for farlig boldbesiddelse kunne fortælle os mere om kampens forløb end ExpG. Derfor er disse former for boldbesiddelses-stats et godt supplement til ExpG.
Boldbesiddelser på modstanderens tredjedel (og især inde i feltet) er generelt en rigtig god indikator for et holds offensive styrke. Ligeledes er modstanderens antal af boldbesiddelser på ens egen tredjedel (og inde i feltet) en rimelig indikator for defensiv styrke.
Chelseas tal snyder
Man kan eksempelvis se, at de bedste hold i Premier League har bolden mest omkring modstanderens mål*. Det er her interessant, at Chelsea har nogle af de bedste boldbesiddelses-stats, men samtidig har middelmådige ExpG-stats.
De har kort sagt haft svært ved omsætte den farlige boldbesiddelse til chancer. Det er til dels selvforskyldt, men der er uden tvivl også tilfældigheder involveret. Jeg tør i hvert fald godt spå, at Chelsea bliver bedre til at omsætte den farlige boldbesiddelse til chancer fremadrettet.
Desværre er avanceret boldbesiddelse-stats kun offentligt tilgængeligt for Premier League i øjeblikket. Man kan dog håbe, at disse boldbesiddelse-stats bliver offentligt tilgængelige for flere ligaer på et tidspunkt. Der findes eksempelvis offentligt tilgængelige ExpG-stats for de største ligaer i Europa, så det er nok bare et spørgsmål om tid.**
Generelt kan man sige, at vi bevæger os hen imod stats, hvor alle aktioner på banen bliver vejet og vurderet. Herved kan man vurdere holdene på baggrund af tusindvis af datapunkter i stedet for bare 10-15 afslutninger per kamp. Et firma som Prozone er allerede i gang med at udvikle teknologier, der gør dem i stand til at vurdere samtlige aktioner, en spiller foretager i en kamp.
Det har jeg lært: Dum, dummere - lidt mindre dum
Danske Piet Hein beskrev vejen til visdom således:
Dum dig
og dum dig
og dum dig igen;
men mindre
og mindre
og mindre
Det er i sandhed den udvikling, jeg har gennemgået det sidste års tid. En forståelse for ExpG blev starten på én lang læringsproces, der gav mig et helt andet syn på betting. Jeg har tidligere begået enormt mange fejl i min betting, men der er blevet færre og færre af dem.
Det skal siges, at jeg ikke er blevet rigere efter at have fået en forståelse for ExpG, men jeg er så sandelig heller ikke blevet fattigere. Det handlede egentlig i første omgang om at få skåret de tabsgivende vaner væk, og det har uden tvivl sparet mig en masse penge.
Jeg har tidligere sat en masse bets med udgangspunkt i tabellen, form, hjemme/udestatistik osv. Disse bets var én stor underskudsforretning, da jeg ikke havde nogen edge i forhold til bookmakerne. Det var først efter mit møde med ExpG, at jeg indså, hvordan man skal benytte statistik i sin fodboldbetting.
Man er nødt til at grave et par spadestik dybere, end man er vant til, hvis man vil hive noget meningsfuldt ud af fodboldstats. Derudover indså jeg, at tilfældigheder er en enorm stor del af fodbold. Det er vigtigt at forstå, da man ellers lader sig narre af ”Tabellen, der aldrig lyver”.
Det skal dog siges, at jeg ikke benytter ExpG aktivt i min betting længere. Jeg kiggede på det rigtig meget i sidste sæson, hvor jeg lavede chancevurderinger på samtlige kampe i La Liga og Serie A. Jeg måtte dog erkende, at ExpG ikke kunne stå alene, hvis man ville slå bookmakerne.
Der mangler simpelthen nogle flere lag, når man skal vurdere holdenes styrke. Det er eksempelvis boldbesiddelse-stats, der nogle gange giver et andet syn på holdene. De er desværre ikke tilgængelige i øjeblikket, hvilket besværliggør tingene lidt.
Et skridt på vejen til visdom
Jeg læser dog stadig en del om expected goals, da jeg finder emnet yderst interessant. Man bliver nemlig også klogere på fodbold, da det afkræfter en masse myter om sporten. Der er dog stadig en del ubesvarede spørgsmål, hvorfor jeg lige afventer situationen, inden jeg benytter det aktivt i min betting igen.
Jeg har nemlig også erkendt, at bookmakerne er rigtig skarpe til at sætte odds på de større fodboldligaer. Man står overfor nogle stærke kræfter, når man prøver at slå oddsmarkederne. Man skal se markederne som en stor samlet pulje af viden, der konstant bliver klogere.
Det er næppe et fair match-up for undertegnede, da jeg stadig har en masse at lære om fodboldbetting. Jeg er til gengæld blevet langt mere bevidst om mine mangler i forhold til tidligere. Når man konstant lærer noget nyt, så begynder man at stille spørgsmålstegn ved alt, man ved om fodboldbetting. Det gør én ydmyg, da man indser, at man sjældent ved noget med sikkerhed. Og ydmyghed er sundt, da selvsikkerhed vil koste én rigtig mange penge i betting.
Jeg vil slutte af med at sige, at expected goals ikke er den hellige gral, når det kommer til at slå bookmakerne. Det er dog et skridt på vejen til visdom.
__________________
* Forskellige boldbesiddelse-stats for Premier League i denne sæson:
objective-football.blogspot.com.es/2015/07/territory.html
objective-football.blogspot.com.es/2015/10/18-yard-box.html
** ExpG-stats for Premier League, La Liga, Bundesligaen og Serie A:
cartilagefreecaptain.sbnation.com/2014/2/12/5404348/english-premier-league-shot-statistics
cartilagefreecaptain.sbnation.com/2014/2/15/5409046/la-liga-shot-statistics
Denne variant af ExpG er rigtig avanceret, hvorfor tallene er forholdsvis præcise. Tallene bliver opdateret en gang imellem, men ikke nødvendigvis efter hver runde.