Expected goals ze szczyptą rezerwy

Expected goals ze szczyptą rezerwy

Tegoroczne EURO było jednym z pierwszych turniejów objętych tak szczegółowymi analizami dotyczącymi gry zawodników oraz ich zaawansowanych statystyk. Wiele dyskusji dotyczących formy zespołów, największych rozczarowań oraz niespodzianek rozbijało się najczęściej o argumenty wyciągane z obliczeń goli oczekiwanych tzw. expected goals. Statystyka ta jest już od dawna z kibicami piłkarskimi i analitykami, ale w tym roku była traktowana jako dowód ostateczny, niczym delfijska Pytia przesądzająca o losach greckich miast. Podobnie jak antyczna wieszczka, modele, mimo że karmione surowymi danymi pokazują rezultaty mogące prowadzić do wielu nieporozumień.

Współczynnik ma przede wszystkim pokazać prawdopodobieństwo strzelenia bramki w momencie uderzenia strzału przez zawodnika w określonych warunkach. Do przetrawienia tego wszystkiego używa się wszelkich dostępnych statystyk, co daje dziesiątki jeśli nie setki tysięcy sytuacji strzeleckich. Pierwszy problem to „określone warunki”. Wielu twórców modeli w sposób transparenty publikuje swoją metodologię, pokazując co biorą pod uwagę w momencie strzału. Najbardziej popularna strona ze statystykami fbref.com publikuje ten współczynnik biorąc pod uwagę: pozycje strzelca, typ ataku, rodzaj podania, część ciała, z jakiej został oddany strzał. Dodatkowo jeszcze są brane pod uwagę pozycje zawodników drużyny przeciwnej oraz charakter akcji (kontra, sytuacja jeden na jednego). Pierwszy problem to wada każdego modelu, czy wszystkie warte uznania współczynniki zostały wzięte pod uwagę.

Można nawet się zastanowić, w jakim stopniu pozycja piłkarza jest na tyle unikatowa, że trudno wyciągnąć z tego jakąś większą zależność. Czy hattrick Garetha Bale’a w 2010 roku w meczu z Interem, gdzie wszystkie bramki strzelił lewą nogą,płaskim uderzeniem na dalszy słupek były podobne, czy może jednak moment spotkania, wynik, pozycja drużyny, przeciwnik miały wpływ na skuteczność strzelca? Niektórzy ironicznie sugerowali, że najprościej jest przemnożyć liczbę strzałów przez 0,095 i wyjdą rezultaty zbliżone do modeli przygotowanych przez analityków, albo po prostu przyjąć zasadę, że im więcej strzelasz, tym więcej masz bramek.

Współczynnik pokazuje rezultat przeciętnego zespołu rywalizującego z przeciętnym rywalem i prawdopodobieństwo, jakie z tego wynika. Dlatego dużym problemem dla modeli jest odpowiednia interpretacja wyników najlepszych drużyn, gdyż jakość zawodników pozwala im na osiąganie lepszych statystyk niż średnia, a szczególnie gdy trafiają do klubów piłkarze będącymi unikalnymi talentami/ Gole oczekiwane oznaczają, że liderujący zawodnicy lub drużyny oddały więcej strzałów, lub były one lepszej jakości od średniej. Oczywiście jest jeszcze kwestia tego, czy model uwzględnia lub nie coś, co powoduję, że dana drużyna/zawodnicy są wyjątkowo lepsi od pozostałych.

Modele sprawdzają się znakomicie przy analizie rezultatów z kilkunastu, kilkudziesięciu meczów, bo pokazują trend i ogólną jakość, mogącą być sugestią, czy drużyna jest śpiącym gigantem, czy jedzie na farcie. Tutaj też pojawia się kwestia będąca związana z powrotem do średniej. W „Futbonomii” pojawiło się to hasło pod względem piłkarzy, którzy mają serie dobrych meczów, a potem wracają do swojego poziomu. Powrót do średniej ma być przestrogą, dla decydentów piłkarskich przed braniem zawodnika na podstawie wycinka jego umiejętności.

Z jednej strony oczywiście jest to oczekiwane, jeżeli przeszłość sugerowała gorsze rezultaty, ale zawierzanie temu jest niebezpieczne, gdyż jest to klasyczny „syndrom hazardzisty”. Nawet jeśli rzut monetą to 50% szansy na wypadnięcie orła lub reszki, to wypadające dziesięć razy pod rząd orły nie oznaczają, że za jedenastym razem w końcu wypadnie reszka. Jeżeli powtórzymy rzut tysiąc, albo dziesięć tysięcy razy ostatecznie wyniki powinny być zbliżone do 50/50, ale wciąż istnieje szansa, że będą one zdecydowanie od siebie oddalone. Drużyna, która nie strzela na tyle, ile sugeruje model, lub odwrotnie może nie wrócić do starej średniej, a obecne rezultaty stają się „nową normalnością”

Paradoks hazardzisty ma też w pewnym stopniu znaczenie w interpretowaniu współczynnika w jednym meczu. Wyciąganie wniosków z jednego pomiaru kompletnie nie ma sensu, a często zdarzało się to podczas EURO, gdzie liczono, że współczynnik np. 2,3 do 0,7 oznacza, że pierwsza drużyna powinna mieć dwie bramki, a druga żadnej. Oczekiwana bramka nie jest strzeloną bramką, tak samo pojedynczy strzał nigdy nie będzie się równać jeden. Sumowanie w mojej opinii jest trochę dziwaczne, gdyż każde uderzenie to „rzut kostką”, które nawet przyjmując prawdziwość działania przyjętego modelu jest niezależne. Każde uderzenie to indywidualny rzut i trudno oczekiwać, że kolejny strzał z tej pozycji akurat wpadnie. Chociaż należy pamiętać, że przy wielu uderzeniach w akcji, kolejne mają na siebie wpływ, co niektóre modele biorą pod uwagę. Pojedyncze mecze to jeszcze wiele innych czynników, które mogą zaciemniać obraz. Sumowanie bez większego kontekstu też wiele nie tłumaczy. Drużyna z 0,7 mogła mieć jeden dobry strzał, albo rzut karny, a później skutecznie bronić wyniku, podczas gdy przeciwnicy bili głową w mur strzelając wiele razy zza pola karnego przy niskim współczynniku.

Wraz z większym zainteresowaniem skomplikowanymi analizami pojawią się dokładniejsze statystyki poszczególnych bramek pozwalające na budowanie szczegółowych modeli tworzących przewidywania nie tylko dla konkretnych drużyn, ale też preferencji zawodników. Pierwsze kroki było widać już w czasie trwania EURO. Na pewno trzeba uważnie przyglądać się rezultatom, ale z ostrożnością, Nie należy tak jak „luddyści” iść na modele statystyczne z kijami tak jak czyniono z maszynami parowymi w XIX wieku bojąc się ich, ale nie należy im wszystkiego zawierzać. Najważniejszy jest kontekst, a kolejne narzędzie zawsze może pomóc w głębszej analizie niż przeszkodzić. Traktowanie współczynnika goli oczekiwanych jako „młota na heretyków” mającego być ostateczną bronią przeciwko osobom mającym inne zdanie nie przystoi.

Fot. Tiresais by Wikipedia