Elo og norsk toppfotball: 1997 til i dag (metoden)

Jeg følger statsviteren Anders Sundell på Twitter, og i august skrev han følgende.

Jeg ble inspirert, og lurte på hvordan det ville sett ut hvis en gjorde samme gjennomgang i norsk toppfotball.

Prinsippene bak Elos poengsystem
Arpad Elo utviklet på oppdrag for det amerikanske sjakkforbundet et poengsystem som var ment å vise en sjakkspillers sanne styrke relativt til andre sjakkspillere. Når to spillere møtes, vil poengforskjellen mellom de to spillerne avgjøre hvem av dem som er forventet å vinne og med hvor stor sannsynlighet. Har spiller A 200 poeng mer enn spiller B før en kamp har spiller A 76 % sannsynlighet for å vinne kampen. Når kampen er over, sammenlignes det faktiske utfallet med det forventede utfallet. Jo større spriket er mellom det faktiske utfallet og det forventede utfallet, jo større antas prestasjonen å være og jo flere poeng bytter side. Formelen for å beregne en oppdatert Elo-rating etter en kamp er følgende:

R’ = R + K x (S – E)

der R’ er en spillers nye rating, R er den gamle ratingen, K er den såkalte K-faktoren (forklart under), S er det faktiske utfallet av en kamp (1=seier, 0,5=uavgjort, o=tap) og E er det forventede utfallet (der 1 er 100 % sannsynlighet for å vinne kampen og 0 er 0 %).

Det finnes i sin tur en annen, mer komplisert formel for å regne ut det forventede utfallet av en kamp (Den finnes her, som første formel under avsnittet Theory). I korte trekk kan en si at 100 poeng differanse gir en seierssannsynlighet på 64/36, 200 poeng gir 76/24, 300 poeng gir 85/15 og 400 gir 91/9.

K-faktoren
Systemet er ikke vannsikkert: Det finnes ikke én sann Elo-rating. Men en kan finne en rating som gjengir virkeligheten med mer eller mindre nøyaktighet. Det sentrale er den såkalte K-faktoren. Er K-faktoren for lav, blir systemet for treigt til å håndtere raske endringer i spillernes styrke. Er K-faktoren for høy, spiller de nyeste kampene en for stor rolle i en spillers rating.

Når jeg har sett på norsk toppfotball, har jeg brukt K-faktoren 20. Dette er omtrent på linje med det FIDE (det internasjonale sjakkforbundet) bruker. Likevel, hos FIDE har spillere med færre enn 30 kamper høyere K-faktor på sine kamper enn spillere som er mer etablerte. FIDE bruker K=20 i sjakk, og Nate Silvers FiveThirtyEight.com bruker K=20 både for NFL og for NBA.

Målfaktoren og hjemmebanefordel
Ikke bare bør det ha betydning hvilken styrke motstanderlaget har, men også med hvor mye et lag vinner en kamp med. En 3-0-seier bør vektes sterkere enn en 1-0-seier. De som driver World Football Elo Ratings har en modell der K-faktoren suppleres med en målfaktor: Tomålsseire gir 1,5 ganger K-faktoren, tremålsseire 1,75 ganger K-faktoren, firemålsseire 2 ganger K-faktoren (og så videre med 0,25 for hvert ekstra mål). Jeg har brukt samme formel i min utregning.

WFRE har også regnet at hjemmelaget i en fotballkamp har en fordel verdt 100 poeng. FIFA bruker det samme i deres rangering av kvinnelandslagene i verden, som bruker et system etter Elo-prinsippene. Også denne hjemmebanefordelen har jeg overført til norske forhold, men med langt mindre vekt enn WFRE og FIFA.

I praksis vil nemlig en fordel på 100 poeng (som tilsvarer 28 % fordel mellom to lag som ellers skal være like gode) føre til at hjemmelaget konsekvent overvurderes. Som eksempel: I 2006-sesongen ville dette ført til at bortelaget var forventet å vinne i bare 6 % av kampene, mot et faktisk resultat på 36 % – seks ganger så mye. En mer riktig hjemmebanefordel er 30 poeng (ca. 9 % mellom to ellers like gode lag), som gir et forventet resultat nært det faktiske.

Justering av poengsummen
Et problem med Elo-poengsystemer er tendensen til poenginflasjon. Dette er naturlig når det hele tiden flyter inn nye spillere i et lukket system, slik som i sjakkens verden. De færreste nye spillere blir mestere som Magnus Carlsen, og de avgir poeng som flyter oppover i systemet til presumptivt bedre spillere. Opprykk og nedrykk mellom divisjoner gjør at også norsk fotball ikke er et lukket system.

En metode for å bøte på dette er å justere lagenes poengsummer etter sesongslutt opp eller ned mot et gitt måltall. FiveThirtyEight gjør dette både for NFL og NBA, noe som dels gjør at gjennomsnittet i NFL og NBA kan holde seg stabilt over tid, men også at det skjer en «regression to the mean» mellom sesongslutt og sesongstart som bør reflekteres i statistikken.

Justering etter FiveThirtyEights metode er ikke helt overførbar fra USA fordi både NFL og NBA har en flat struktur på sine divisjonsmodeller. I norsk og europeisk toppfotball er strukturen derimot hierarkisk. Jeg har derfor valgt å sette to ulike måltall: 1500 for Tippeligaen og 1350 for 1. divisjon (med 150 poeng mindre for hvert nivå nedover). Differansen på 150 er den differansen som over tid ville ha etablert seg mellom de to divisjonene hvis en ikke justerte etter sesongslutt. For lag som rykker opp eller ned mellom divisjonene må en justere mot den divisjonen laget kommer fra. For lag som rykker opp fra 2. divisjon (nivå tre) får laget poengsum etter følgende formel: ((antall seire i foregående sesong – antall tap i foregående sesong) * 10) / 1,5) + 1200.

Normalt blir det årlige justeringstallet derfor 1500/1350.

Når det gjelder den faktiske justeringen, justeres et lags poengsum opp eller ned med en tredjedel fra det som avsluttet en sesong. Rosenborg avsluttet for eksempel sesongen 2015 med en poengsum på 1699 (65 foran Molde på andreplass), men startet sesongen 2016 med 1633 (2/3 av 199, den del av poengsummen som oversteg 1500 – 44 poeng foran Molde på andreplass).

Reklamer

4 kommentarer

Filed under Uncategorized

4 responses to “Elo og norsk toppfotball: 1997 til i dag (metoden)

  1. Tilbaketråkk: Elo og norsk toppfotball – sesongstart i Tippeligaen | Som vanlig, altså

  2. Tilbaketråkk: Norsk toppfotball 2000-2015 – del 1 (RBK, SIF, Stabæk, Odd) | Som vanlig, altså.

  3. Tilbaketråkk: NFF-Elo: Sesonginnspurten | Som vanlig, altså.

  4. Tilbaketråkk: Norsk fotball og Elo: 2018-sesongen | Som vanlig, altså.

Legg igjen en kommentar

Fyll inn i feltene under, eller klikk på et ikon for å logge inn:

WordPress.com-logo

Du kommenterer med bruk av din WordPress.com konto. Logg ut /  Endre )

Google+-bilde

Du kommenterer med bruk av din Google+ konto. Logg ut /  Endre )

Twitter-bilde

Du kommenterer med bruk av din Twitter konto. Logg ut /  Endre )

Facebookbilde

Du kommenterer med bruk av din Facebook konto. Logg ut /  Endre )

w

Kobler til %s