Elo og norsk toppfotball: 2000 til i dag (metoden)

Teksten er senest endret 1. april 2017. I lys av resultatene fra 2000-2015 og mine utregninger har jeg endret hjemmebanefordelen. Se nærmere i det riktige avsnittet under.

Jeg følger statsviteren Anders Sundell på Twitter, og i august skrev han følgende.

Jeg ble inspirert, og lurte på hvordan det ville sett ut hvis en gjorde samme gjennomgang i norsk toppfotball.

Prinsippene bak Elos poengsystem
Arpad Elo utviklet på oppdrag for det amerikanske sjakkforbundet et poengsystem som var ment å vise en sjakkspillers sanne styrke relativt til andre sjakkspillere. Når to spillere møtes, vil poengforskjellen mellom de to spillerne avgjøre hvem av dem som er forventet å vinne og med hvor stor sannsynlighet. Har spiller A 200 poeng mer enn spiller B før en kamp har spiller A 76 % sannsynlighet for å vinne kampen. Når kampen er over, sammenlignes det faktiske utfallet med det forventede utfallet. Jo større spriket er mellom det faktiske utfallet og det forventede utfallet, jo større antas prestasjonen å være og jo flere poeng bytter side. Formelen for å beregne en oppdatert Elo-rating etter en kamp er følgende:

R’ = R + K x (S – E)

der R’ er en spillers nye rating, R er den gamle ratingen, K er den såkalte K-faktoren (forklart under), S er det faktiske utfallet av en kamp (1=seier, 0,5=uavgjort, o=tap) og E er det forventede utfallet (der 1 er 100 % sannsynlighet for å vinne kampen og 0 er 0 %).

Det finnes i sin tur en annen, mer komplisert formel for å regne ut det forventede utfallet av en kamp (Den finnes her, som første formel under avsnittet Theory). I korte trekk kan en si at 100 poeng differanse gir en seierssannsynlighet på 64/36, 200 poeng gir 76/24, 300 poeng gir 85/15 og 400 gir 91/9.

K-faktoren
Systemet er ikke vannsikkert: Det finnes ikke én sann Elo-rating. Men en kan finne en rating som gjengir virkeligheten med mer eller mindre nøyaktighet. Det sentrale er den såkalte K-faktoren. Er K-faktoren for lav, blir systemet for treigt til å håndtere raske endringer i spillernes styrke. Er K-faktoren for høy, spiller de nyeste kampene en for stor rolle i en spillers rating.

Når jeg har sett på norsk toppfotball, har jeg brukt K-faktoren 32 det første året (2000), og deretter K-faktor 20 for alle etterfølgende år. Dette er omtrent på linje med det FIDE (det internasjonale sjakkforbundet) bruker, der spillere med færre enn 30 kamper har høyere K-faktor på sine kamper enn spillere som er mer etablerte. FIDE bruker K=20 i sjakk, og Nate Silvers FiveThirtyEight.com bruker K=20 både for NFL og for NBA.

Målfaktoren og hjemmebanefordel
Ikke bare bør det ha betydning hvilken styrke motstanderlaget har, men også med hvor mye et lag vinner en kamp med. En 3-0-seier bør vektes sterkere enn en 1-0-seier. Gjengen bak World Football Elo Ratings har en modell der K-faktoren suppleres med en målfaktor: Tomålsseire gir 1,5 ganger K-faktoren, tremålsseire 1,75 ganger K-faktoren, firemålsseire 2 ganger K-faktoren (og så videre med 0,25 for hvert ekstra mål). Jeg har brukt samme formel i min utregning.

WFRE har også regnet at hjemmelaget i en fotballkamp har en fordel verdt 100 poeng. FIFA bruker det samme i deres rangering av kvinnelandslagene i verden, som bruker et system etter Elo-prinsippene. Også denne hjemmebanefordelen har jeg overført til norske forhold.

Tillegg: Jeg har gått igjennom sesongene 2000-2015 i Tippeligaen med hjemmebanefordel. Ser en på forholdet mellom hjemmeseire og borteseire (ikke medregnet uavgjorte kamper) er forholdet mellom dem 64/36 (64 % hjemmeseire, 36 % borteseire). I grunnen samsvarer dette godt med en hjemmebanefordel med 100 poeng. I praksis fører derimot en så høy hjemmebanefordel til at hjemmelaget konsekvent overvurderes. I 2006-sesongen førte dette for eksempel til at bortelaget var forventet å vinne i bare 6 % av kampene, mot et faktisk resultat på 36 % – seks ganger så mye.

Tar en utgangspunkt i at bortelaget er forventet å vinne i 36 % av tilfellene, varierer hjemmebanefordelen sesong for sesong, mellom 25 og 46 poeng. Med virkning fra 2009-sesongen har jeg derfor justert ned hjemmebanefordelen til 35 poeng, og 30 poeng for 1. divisjon.

Justering av poengsummen
Et problem med Elo-poengsystemer er tendensen til poenginflasjon. Dette er naturlig når det hele tiden flyter inn nye spillere i et lukket system, slik som i sjakkens verden. De færreste nye spillere blir mestere som Magnus Carlsen, og de avgir poeng som flyter oppover i systemet til presumptivt bedre spillere. Opprykk og nedrykk mellom divisjoner gjør at også norsk fotball ikke er et lukket system.

En metode for å bøte på dette er å justere lagenes poengsummer etter sesongslutt opp eller ned mot et gitt måltall. FiveThirtyEight gjør dette både for NFL og NBA, noe som dels gjør at gjennomsnittet i NFL og NBA kan holde seg stabilt over tid, men også at det skjer en «regression to the mean» mellom sesongslutt og sesongstart som bør reflekteres i statistikken.

Justering etter FiveThirtyEights metode er ikke helt overførbar fra USA fordi både NFL og NBA har en flat struktur på sine divisjonsmodeller. I norsk og europeisk toppfotball er strukturen derimot hierarkisk. Jeg har derfor valgt å sette to ulike måltall: 1200 for Tippeligaen og 1050 for 1. divisjon. Differansen på 150 er den differansen som over tid ville ha etablert seg mellom de to divisjonene hvis en ikke justerte etter sesongslutt (jeg har regnet på dette). For lag som rykker opp eller ned mellom divisjonene må en justere mot den divisjonen laget kommer fra, med unntak for vekslingen mellom 1. og 2. divisjon. Her må en justere mot 1050 fra forrige tellende resultat, med mindre laget som rykker opp aldri før er rangert med Elo-rating. Da starter laget normalt sett med 1000 poeng.

Normalt blir det årlige justeringstallet derfor 1200/1050. Når snittet i en sesong har blitt mer enn +/- 1 prosent fra måltallet har jeg satt et litt lavere eller høyere justeringstall alt ettersom for å bevege denne differansen tilbake mot 0, uten å spise for mye av gangen (justeringstallet er satt slik at en kan nå 0 over to sesonger).

Når det gjelder den faktiske justeringen, justeres et lags poengsum opp eller ned med en tredjedel fra det som avsluttet en sesong. Rosenborg avsluttet for eksempel sesongen 2015 med en poengsum på 1410 (60 foran Molde på andreplass), men startet sesongen 2016 med 1340 (2/3 av 140, den del av poengsummen som oversteg 1200 – 40 poeng foran Molde på andreplass).

Advertisements

3 kommentarer

Filed under Uncategorized

3 responses to “Elo og norsk toppfotball: 2000 til i dag (metoden)

  1. Tilbaketråkk: Elo og norsk toppfotball – sesongstart i Tippeligaen | Som vanlig, altså

  2. Tilbaketråkk: Norsk toppfotball 2000-2015 – del 1 (RBK, SIF, Stabæk, Odd) | Som vanlig, altså.

  3. Tilbaketråkk: NFF-Elo: Sesonginnspurten | Som vanlig, altså.

Legg igjen en kommentar

Fyll inn i feltene under, eller klikk på et ikon for å logge inn:

WordPress.com-logo

Du kommenterer med bruk av din WordPress.com konto. Logg ut / Endre )

Twitter picture

Du kommenterer med bruk av din Twitter konto. Logg ut / Endre )

Facebookbilde

Du kommenterer med bruk av din Facebook konto. Logg ut / Endre )

Google+ photo

Du kommenterer med bruk av din Google+ konto. Logg ut / Endre )

Kobler til %s