Skakkens ELO-rating kan også bruges til fodbold - fx til at finde værdi-odds i næste Superliga-runde.

Dybest set går al ordentlig betting ud på at sætte sandsynligheder for de udfald man som spiller er interesseret i, og derefter sammenligne disse sandsynligheder med de odds der er udbudt på de pågældende udfald. Men man vinder kun hvis man er bedre til at sætte sandsynligheder end bookmakeren, og hvordan bliver man det?

På Betxpert har det tidligere været beskrevet, hvordan man arbejder sig frem mod en realistisk sandsynlighed ved at analysere forskellige faktorer, men for mange vil det være nødvendigt at have et udgangspunkt, som man derefter kan korrigere for skader, motivation osv.

Løsningen kan være et rating-system, der rater de enkelte hold indbyrdes og som automatisk kan konverteres til en sandsynlighed for de forskellige udfald. I denne artikel beskrives et af de mere anerkendte systemer, ELO-rating.

Hvad er ELO-rating?

ELO-rating er opfundet af den ungarske skakspiller Arpad Elo. Før hans rating-system var rangering af skakspillere ikke optimalt, og Elo ønskede derfor et system der bedre afspejlede hvordan spillerne rangerede indbyrdes.

Fodboldens pendant til det gamle, ikke-optimale, skatrating-system kunne være FIFA's verdensrangliste, der ind i mellem har overordentligt svært ved at afspejle den sande top10, som man ville forvente den så ud, hvis alle hold mødte hinanden på neutral grund.

Og faktisk kan ELO-ratingen også bruges til fodbold.

Det grundlæggende princip for ELO-rating er simpelt. Til hver kamp smider hver deltager eksempelvis 5% af deres rangliste-point i en pulje. Vinderen tager alle points i puljen, og hvis det bliver uafgjort, deles puljen. Så hvis favoritten vinder får han ikke ret mange point ud af det, hvorimod en overraskende sejr vil bidrage med en stor rating-forbedring for den vindende underhund.

For at anvende samme system til fodbold, er det blevet tilrettet en smule for at tage højde for hjemmebanefordel, målforskel i resultatet, samt en faktor der tager højde for kampens vigtighed.

Hjemmebanefordelen kan afspejles ved at hjemmeholdet bidrager med mere end udeholdet. I stedet for 5% hver afgiver hjemmeholdet 6% og udeholdet kun 4%. Lad os se på et simpelt eksempel for at illustrere princippet:

FCK (1200 point) møder Esbjerg (800 point) i parken. 6% af FCK’s point er 72 point, og 4% af Esbjergs point er 32 point. Ved kampens start har FCK altså 1200-72 lig 1128 point og Esbjerg 800-32 lig 768 point. Puljen er på 104 point. Herunder er vist et forsimplet eksempel på hvordan 3 kamp resultater vil påvirke point fordelingen efter kampen.

 

1-0

0-0

0-1

FCK

1128+104=1232

1128+52=1180

1128+0=1128

Esbjerg

768+0=768

768+52=820

768+104=872

Som det ses i eksemplet har det meget større effekt når Esbjerg vinder end når FCK vinder. Logikken er at en FCK-sejr langt hen af vejen var forventet, så deres øjeblikkelige rating bør ikke ændre sig ret meget. Hvis Esbjerg kan vinde i parken, så er det omvendt et tegn på at de er bedre end deres øjeblikkelige rating. Et uafgjort resultat vil sænke FCK’s rating en anelse og hæve Esbjergs rating relativt mere.

Næste skridt i fodbold-justeringen af ELO-systemet er at tilføje en korrektion for resultatets målforskel. Tanken er at det er mere imponerende at vinde 4-0 end 3-2. Denne korrektion vil blive forklaret i det næste afsnit, hvor vi går ind i de mere nørdede detaljer.

Hvordan beregnes ELO-rating (lidt nørdet)?

Den korrekte beregningsmetode er noget mere indviklet end ovenstående simple eksempel, men det grundlæggende princip er det samme. Har du haft nok matematik da du gik i skole og vil undgå mere, så spring dette afsnit over og gå videre til de følgende afsnit.

Først beregnes forskel i rating før kampen. Der lægges 100 point til hjemmeholdes rating for at afspejle hjemmefordel.

Delta Rating=Dr=RatingHjemme-RatingUde+100

Dr bruges til at beregne sandsynligheden for en sejr til hjemmeholdet med følgende formel.

Part1=10^(-1*Dr/400) ; betyder 10 opløftet ikke i anden men i (-1*Dr/400)

Win Expectancy=We=1/(Part1+1)

En We på 0,5 betyder at kampen er helt lige, 0,75 at der er 75% chance for en hjemme sejr samt 25% chance for en udesejr osv. Nu vil den skarpe læser nok bemærke at fodboldkampe har det med at have 3 mulige udfald og ikke kun 1 eller 2. Denne umiddelbare svaghed kan dog afhjælpes med lidt statistik, som jeg vil komme ind på senere. Lad os gå videre til næste del af beregningen.

Kampens resultat skal bruges til at beregne faktor G.

Goaldifference=G=(11+Målforskel)/8

Ved 0-0, 1-1 eller lignende bliver G=11/8=1,375. Ved 0-2, 5-3 eller lignende bliver G=(11+2)/8=1,625.

Faktor K er en variabel der ændres efter kampens vigtighed. Hvis man vil forenkle sine beregninger kan man bare vælge at bruge en fast værdi fra 20 til 60. Jo større værdi jo mere vil de nyeste kampe tælle. I de senere beregninger er K sat til 40 for alle kampe. K er på wikipedia fordelt på følgende måde for landskampe.

Kamptype

K faktor

VM slutrunde

60

EM slutrunder etc.

50

Kvalifikations turneringer

40

Andre mindre turneringer

30

Venskabskampe

20

Kilde: http://en.wikipedia.org/wiki/World_Football_Elo_Ratings

Sidste faktor der skal bruges er kampens resultat, W. Den fastsættes simpelt som 1 for en hjemmesejr, 0,5 for et kryds og 0 for en udesejr.

Nu kan vi beregne effekten af kampens resultat på de 2 holds rating med følgende formel:

Point ændring hjemmehold=P=K*G*(W-We)

Endelig kan udeholdets point ændring beregnes:

Point ændring udehold=-1*Point ændring hjemmehold

Inden det støver helt til, kommer der lige et par eksempler.

Eksempel 1

FCK (1200) - Esbjerg(1000) resultat 2-0

Dr=1200-1000+100=300

Part1=10^(-1*300/400)=0,1778

We=1/(0,1778+1)=0,849

G=(11+2)/8=1,625

K=40 (fast værdi antaget i disse beregninger)

P=40*1,625*(1-0,849)=10

FCK ny rating 1210 og Esbjerg ny rating 990.

Eksempel 2

Viborg (753) - Silkeborg(1149) resultat 2-1

Dr=753-1149+100=-296

Part1=10^(-1*-296/400)=5,50

We=1/(5,5+1)=0,154

G=(11+1)/8=1,5

K=40 (fast værdi antaget i disse beregninger)

P=40*1,5*(1-0,154)=55

Viborg ny rating 808 og Silkeborg 1094.

ELO-rating og Superligaen

I det følgende er ovennævnte ELO-rating anvendt med Superligaen som prøveklud. Analysen er startet med sæsonen 1998/1999 og herefter er alle kampe frem til og med 10. runde i sæsonen 2014/2015 anvendt. Totalt over 16 sæsoner. Start-rating for sæsonen 1998/1999 er vurderet ud fra holdenes placering i sæsonen 1997/1998. Det giver totalt lidt over 3200 kampe til evalueringen. Lidt stats for testen.

Parameter

Værdi

Antal kampe

3228

Antal hele sæsoner

16

Hold med flest kampe

539 kampe (FCK, Brøndby, Aab)

Laveste point tal på noget tidspunkt

Lyngby 653

Højeste point tal på noget tidspunkt

FCK 1326

Ringeste snit alle kampe

B93 721

Bedste snit alle ratings

FCK 1164

Herunder er gennemsnit, antal kampe, højeste og laveste rating for alle hold, der i den pågældende periode har spillet i superligaen. Snittet for samtlige hold i en runde vil altid være 1000 point.

Hold

Top rating

Bund rating

Snit rating

Antal kampe

FCK

1326

928

1164

539

Brøndby

1259

828

1092

539

AaB

1215

882

1049

539

FCM

1196

902

1056

473

OB

1222

819

1043

506

AB

1179

758

1008

199

Silkeborg

1152

787

965

410

Viborg

1137

738

959

365

FCN

1234

818

990

407

Esbjerg

1204

759

986

442

Herfølge

1135

787

951

168

Vejle

1085

735

889

169

Lyngby

1094

653

912

234

B93

780

670

721

34

Aarhus Fremad

899

836

862

34

AGF

1111

773

936

465

Sønderjyske

1045

698

888

277

Køge

939

677

788

101

BK Frem

885

782

815

34

Randers FC

1125

768

948

277

Horsens

1118

805

938

233

FC Vestsjælland

951

835

909

44

Hobro

990

843

937

11

Bemærk at antal kampe ikke automatisk er antal sæsoner gange 33, da holdene starter inden kamp 1 med en rating som også tælles med. Et elevatorhold vil derfor have en del sæsoner med 34 ratings.

Superliga-konklusioner ud fra ELO-ratingen

Det bliver nu tydeligt hvordan ELO-rating kan anvendes mere detaljeret end et kig på tabellen eller de enkelte resultater. Det er blandt andet muligt at konkludere følgende baseret udelukkende på holdenes præstationer i Superligaen:

  • Det bedste hold der har spillet en Superliga-kamp gennem de sidste 17 sæsoner var FCK, da de i sæsonen 2011/2012 slog Brøndby 2-1 på udebane i 10. runde. Efter den kamp havde FCK en rating på 1326 point, den hidtil højeste rating.
  • Det ringeste hold der har spillet en Superliga-kamp gennem de sidste 17 sæsoner var Lyngby, da de i sæsonen 2001/2002 tabte i sidste runde med 2-0 i Brøndby. Efter den kamp havde Lyngby en rating på 653 point. Det var den sæson hvor Lyngby spillede sidste del af turneringen med et amatørhold.
  • Ser vi bort fra ovenstående specielle situation var de ringeste hold der har spillet en Superliga-kamp gennem de sidste 17 sæsoner, B-93 med 670 point og Køge med 677 point.
  • B-93 fik i den ene sæson de var i Superligaen det ringeste snit for alle Superligahold i den givne periode.
  • Set over alle sæsoner er FCK klart den bedste klub i Superligaen. Brøndby er en næsten lige så suveræn nr. 2 overall, hvorefter der kommer et tætpakket felt bestående af AaB, FCM og OB.
  • FCK, Brøndby og Aab er de eneste 3 hold der har spillet alle sæsoner i Superligaen de sidste 17 år.
  • Hobro har på kun 11 kampe opnået en højere max score (990) end 5 andre hold nogensinde har opnået.

Hvis tallene analyseres yderligere kan følgende data uddrages.

Hold

Antal runder som nr. 1

% af total tid som nr. 1

Største stigning på 6 runder

Største fald på 6 runder

FCK

288

53,4

97

-116

Brøndby

133

24,7

139

-126

AaB

39

7,2

182

-132

FCM

33

7,0

130

-103

OB

11

2,2

107

-125

AB

10

5,0

142

-130

Silkeborg

8

2,0

140

-170

Viborg

7

1,9

133

-129

FCN

7

1,7

110

-106

Esbjerg

5

1,1

131

-138

Herfølge

0

0,0

100

-108

Vejle

0

0,0

117

-81

Lyngby

0

0,0

86

-131

B93

0

0,0

84

-54

Aarhus Fremad

0

0,0

61

-27

AGF

0

0,0

133

-124

Sønderjyske

0

0,0

152

-118

Køge

0

0,0

99

-88

BK Frem

0

0,0

84

-85

Randers FC

0

0,0

144

-115

Horsens

0

0,0

102

-151

FC Vestsjælland

0

0,0

83

-59

Hobro

0

0,0

124

-16

Fra ovenstående kan man blandt andet drage følgende konklusioner.

  • FCK har været Superligaens bedste hold over halvdelen af tiden de sidste 17 år.
  • Brøndby eller FCK har været top dog 75% af tiden.
  • Der er kun 10 hold der har prøvet at være det aktuelt bedste hold i superligaen.
  • AaB har haft den suverænt bedste stime med 182 points stigning i 6 kampe. Det er selvfølgelig svært for FCK at få bedste stime da de kommer fra et højt leje, så selv 6 sejre vil ikke kaste helt så mange point af sig.
  • Det taler til FCK’s ære at de ikke er blandt de hold der har haft det største pointtab på 6 runder, selv om de har haft det største potentiale for en nedtur. Største nedtur på 6 kampe tegner Silkeborg sig for med et tab af 170 point på 6 runder.

Der er selvfølgeligt muligt at gå mere i detaljer med de mange data, men ovenstående illustrerer hvad man blandt andet kan opnå med et rating-system (i dette tilfælde ELO). Og nej, jeg er ikke specielt fan af FCK.

ELO-rating og sandsynligheden for 1-X-2

Nå, nu har vi set på en masse teori og et praktisk eksempel hvor Superligaen er anvendt, men ud over at det er skægt at se top og bund etcetera, så er det jo sjovest hvis rating kan anvendes til at få en fordel overfor bookmakerne. En fordel skal forstås som en forbedret evne til at forudsige sandsynligheden for kampenes udfald og derved en bedre identifikation af value.

For hver kamp kan man nedskrive forskellen på hjemmeholdets og udeholdets rating (Dr, uden 100 point for hjemmefordel) samt kampens resultat. Når man har over 3000 kampe, så kan intervaller af Dr overfor sandsynlighed for kampens udfald tegnes ind i en x-y graf og et bedste fit for sandsynligheden som funktion af Dr kan fastlægges.

Resultatet af denne analyse ser ud som følger i tabelform:

Forskel rating

Procent 1

Procent X

Procent 2

Antal kampe

0-25

42,4

30,4

27,2

92

26-50

41,2

29,9

28,9

211

51-75

50,0

28,2

21,8

188

76-100

49,4

28,1

22,5

178

101-125

48,1

27,6

24,4

156

126-150

51,1

23,4

25,5

141

151-175

55,4

19,4

25,2

139

176-200

52,1

25,7

22,1

140

201-225

62,0

22,8

15,2

92

226-250

60,9

21,7

17,4

92

251-275

59,7

29,2

11,1

72

276-300

76,2

21,4

2,4

42

301-325

64,2

17,0

18,9

53

326-350

65,4

23,1

11,5

26

351-375

76,0

20,0

4,0

25

376-400

78,3

17,4

4,3

23

401-425

81,8

0,0

18,2

11

426-450

71,4

28,6

0,0

7

451-475

100,0

0,0

0,0

4

476-500

100,0

0,0

0,0

2

501-525

100,0

0,0

0,0

3

Det er klart at statistikken ikke kan bruges til det store for ratingforskel 426-450 da dette kun er forekommet 7 gange. Løsningen på dette er det førnævnte x-y plot, hvor bedste rette linje kan bestemmes. Denne linje vil selv for intervaller uden den store mængde data, kunne fastlægges meget præcist ud fra data, da de omkring læggende data vil understøtte det pågældende interval. Dette kaldes også intrapolation. Skal man udtale sig om sandsynligheden for rating forskel 570 skal man extrapolere da man er uden for den kendte datamængde, man er ikke inde midt i den. Extrapolation er meget mere usikker (man har færre omkring læggende data), og det skal man derfor passe på med at anvende.

Samme tabel kan laves for kampe hvor udeholdet har højeste rating dvs. Dr bliver negativ:

Forskel rating(alle tal herunder er negative)

Procent 1

Procent X

Procent 2

Antal kampe

0-25

41,2

30,6

28,2

85

26-50

47,0

25,4

27,6

181

51-75

37,2

31,7

31,1

164

76-100

30,4

27,1

42,5

181

101-125

33,1

32,5

34,4

154

126-150

36,6

24,4

38,9

131

151-175

33,7

20,8

45,5

101

176-200

31,6

24,2

44,2

95

201-225

23,4

33,0

43,6

94

226-250

32,6

25,3

42,1

95

251-275

19,6

37,3

43,1

51

276-300

22,9

18,8

58,3

48

301-325

16,0

22,0

62,0

50

326-350

19,2

7,7

73,1

26

351-375

15,0

25,0

60,0

20

376-400

0,0

29,2

70,8

24

401-425

28,6

35,7

35,7

14

426-450

14,3

0,0

85,7

7

451-475

0,0

25,0

75,0

4

476-500

0,0

0,0

100,0

2

501-525

0,0

0,0

100,0

2

Den bedste rette linje mellem rating forskel og sandsynlighed for et givent tegn, bliver givet ved følgende formel for samtlige kampe, både hjemmehold favorit og udehold favorit.

P(1-tal)=42,0% + 0,0861*Dr + 0,00003*Dr*Dr  R2=0,95

Hvor Dr = Hjemmehold rating – Udehold rating

Hvor R2 er ligningens forklaringsgrad, dvs. hvor mange af de givne kampresultater kan forklares med formlen. I dette tilfælde betyder det at hver gang der spilles 20 Superliga-kampe kan udfaldet i de 19 af dem forklares med ovennævnte formel. Egentligt ret imponerende når formlen intet kender til skader, landskampe, motivation etc.

P(Kryds)=29,9% + 0,0049*Dr – 0,0001*Dr*Dr  R2=0,55

For kryds skal det nævnes at data især for udehold favorit er en noget rodet affære, hvilket også afspejles i den lave R2 værdi. Laves en formel kun baseret på hjemmehold favorit-kampene ser det ud som følger:

P(Kryds)=29,8% - 0,0288*Dr R2=0,60

Lidt bedre, men stadig ikke for imponerende. Der er færrest kampe der ender uafgjort, og i hver kategori er der oftest under 20 kampe der ender uafgjort, dvs. usikkerheden fra bare een kamp bliver alt for stor. Løsningen kan dog være at finde sandsynligheden for 1 og 2, og så må resten jo være kryds. Så lad os bestemme sandsynligheden for 2-tal:

P(2-tal)=28,1% - 0,0812*Dr + 0,00007*Dr*Dr  R2=0,91

Summen af de 3 sandsynligheder skal selvfølgelig være 100%, så vi ændrer sandsynligheden for kryds så summen bliver 100%.

P(Kryds)=100-P(1-tal)-P(2-tal)

Herved fremkommer nedenstående fordeling af sandsynligheder for en kamp, hvor hjemmeholdet har en 200 point højere rating end udeholdet.

1-tal

Kryds

2-tal

61,6%

23,7%

14,7%

Ovennævnte formler kan enten anvendes vha. lommeregner eller et lille regneark. Herved får man en simpel fremgangsmåde for konvertering af ELO-rating til sandsynlighed for 1-X-2.

Show me the money

Bevæbnet med ovenstående formler og 17 års ELO rating er vi klar til at afsløre værdi-odds hos bookmakerne. Lad os se nærmere på den næste runde i Superligaen (tjek MatchCenter for fredagens, lørdagens, søndagens og mandagens kampe). Kampene er listet herunder med holdenes ELO-rating, og de tilhørende beregnede sandsynligheder for 1-X-2:

Hjemme

Ude

ELO hjemme

ELO ude

Dr

P-1

P-X

P-2

AaB

Hobro

1048

949

99

50,8

28,4

20,7

FCN

Sønderjyske

1064

975

89

49,9

28,7

21,4

FCM

Silkeborg

1159

798

361

77,0

15,1

7,9

Brøndby

FCV

1049

926

123

53,0

27,8

19,2

FCK

Randers

1068

1026

42

45,7

29,5

24,8

Esbjerg

OB

1001

937

64

47,6

29,2

23,2

Helt usædvanligt er der tale om 6 kampe med bedste hold på hjemmebane. Største favorit er FCM mod Silkeborg (nr. 1 på ELO mod nr. 12, lige som i tabellen), mens den mest lige kamp er FCK - Randers. Herunder er bedste odds fra Betbrain.com listet sammen med value beregninger. TB% er også oplyst, for at vise, at med tæt på perfekt tilbagebetaling, vil der være mange såkaldte value bets (der er ingen bookmaker edge, der først skal overvindes).

Hjemme

Ude

Odds 1

Odds X

Odds 2

TB%

Value 1

Value X

Value 2

AaB

Hobro

1,7

4,05

6,05

1,000

86,4

115,2

125,5

FCN

Sønderjyske

1,88

3,75

4,8

0,993

93,8

107,5

102,9

FCM

Silkeborg

1,48

4,84

8

0,993

113,9

73,1

63,3

Brøndby

FCV

1,7

3,9

5,9

0,986

90,2

108,4

113,1

FCK

Randers

1,85

3,63

4,78

0,975

84,5

107,1

118,6

Esbjerg

OB

1,95

3,67

4,55

0,995

92,9

107,1

105,5

Value er beregnet som odds på det givne udfald gange med sandsynligheden (fra ELO rating) for dette udfald. Følgende kan observeres fra tabellen.

  • Størst value er der i en Hobro-sejr i Aalborg. Hobro vil vinde hver femte kamp, men man får odds 6 for dette udfald.
  • Alle hjemmeholdene er overvurderede af bookmakerne ifølge ELO, på nær FCM der er endnu større favorit end bookmakerne tror.
  • Ringeste spil vil være Silkeborg til odds 8. ELO beregner at det rette odds bør være 12,6.
  • Skulle ELO spille ville det altså blive 5 gange X2 og en enkelt hjemmesejr til FCM.

AaB-Hobro 2: Odds 6,05 hos Betsafe

ELO-ratingen siger 20 procents chance for udesejr, dvs flot værdi i oddset: betvalue på 121%. Husk dog de kampkonkrete faktorer - tjek nyheder, trupnyt etc i MatchCenter

Det rette spil er singlespil for at minimere udsving i ens kapital, men er man til den klassiske 3 ud af 6 for 20 rækker (fra den gang alle kampe blev spillet kl. 15, og man sad og hørte Sport i 3’eren) så ville ELO spille følgende (X2 odds fra Betbrain.com).

Hjemme

Ude

Spil

Odds

AaB

Hobro

X2

2,39

FCN

Sønderjyske

X2

2,07

FCM

Silkeborg

1

1,48

Brøndby

FCV

X2

2,34

FCK

Randers

X2

2,11

Esbjerg

OB

X2

2,06

Udvid med kampkonkrete faktorer

Skal man bygge lidt oven på nøgen ELO-rating til udvælgelse af value spil, så bør man tage ovenstående sandsynligheder, og korrigere dem for alle de typiske ting der får et hold til ikke at præstere som forventet.

Brug Betxpert’s liste over skader, til at se om nogle fra startelleveren ikke er med. Undersøg om holdet har haft spillere med til landskamps samling, har spillet europæiske kampe, eller måske sparer spillere pga. kommende vigtigere kampe. Er deres seneste Superliga-resultater (der indgår i ELO) baseret på kampe, hvor noget af ovenstående kan spille ind? Møder de et hold, hvor de altid har det svært pga. psyke eller spillestil?

Hvis man har undersøgt ovenstående og andre forhold man mener er vigtige, så kan man lave den endelige vurdering af om der er value. Den hurtige version kan være at undersøge, hvorfor ens value på eksempelvis Hobro muligvis ikke er der alligevel. Kan man ikke finde svaret på det, så kan man tage spillet hvis ellers man stoler på sin research.

Hvad kunne næste skridt være?

Vi er nået til afslutningen på denne introduktion til ELO-rating, et af de mulige rating systemer til at rangere fodboldhold. Ud fra historiske data er en sammenhæng mellem ELO-rating og 1-X-2 sandsynlighed fastlagt. Det er illustreret, med næste Superliga-runde som eksempel, hvordan man afslører mulig value.

Der er mange andre måder man kan gribe rating an på, men jeg håber dette har åbnet øjnene for nogle til hvordan man evt. kan komme i gang med mere systematisk value spil. Man har nu lidt inspiration til et udgangspunkt, for fastsættelse af sandsynligheder for de mulige udfald. Dette var så det første spadestik ned i rating materien. Man kunne jo vælge at se lidt mere på eksempelvis følgende.

  • Fastlæg sammenhæng mellem Dr og handikap resultater.
  • Anvend ELO på andre ligaer.
  • Varier de enkelte parameter (hjemmefordel, K-faktor etc.), og test om det giver en bedre forudsigelse.
  • Inkluder form i sandsynligheds fastlæggelse. ELO optjent i de sidste 6 kampe.
  • Inkluder goal difference rating systemet (søg på google.com for at lære mere).
  • Inkluder andre rating systemer.

Som altid, held og lykke med jeres spil.

X