«Былое и думы», Эпилог сезона
Прошла неделя с даты окончания РПЛ и настало время подвести его итоги по продвинутой статистике и проверить, насколько прогнозированные после 22 тура места команд соответствуют реальным.. Места в таблице по метрикам xG клубы занимают исходя из суммы ожидаемых очков xPTS. Красным выделены по 2 худших результата по каждому параметру, золотым - по 2 лучших. В таблицу для большей наглядности внесены ставшие уже постоянными дополнения. В частности, поскольку в итоговом обзоре сезона прошлого мы установили очень большое влияние количества пенальти в пользу одной (или нескольких) команд относительно среднего показателя по турниру на xPTS, их количество представлено отдельным столбцом, чтобы можно было оценить влияние на ожидаемые очки.

Также присутствуют столбцы с «ошибками судей». Они разделены на 2 раздела. Первый - признанные ошибками в Решениях ЭСК ДСИ РФС. Включены в «ошибки» только результативные: КК, вторые ЖК, голы и пенальти. Второй столбец - оценка «жесткости» судейства для команды и представляет собой отношение общего количества фолов к числу вынесенных предупреждений / удалений. Баланс судейских ошибок по Правилам ИФАБ из Таблицы убран, поскольку является объектом дополнительно рассмотрения. А эти 2 - независимые ни от кого, кроме самих судей - приведены.
Небольшое вступление перед разбором таблицы. Уже 2 года попыток разбирать на Спортсе продвинутую статистику РПЛ показывает - юзеры не сильно разбираются в продвинутой статистике, и главное - не очень этого хотят. Поэтому разбирающиеся могут просто пропустить текст на зеленом фоне, а остальным напомним основные принципы такой аналитики - может добавится в число разбирающихся еще кто-то, помимо автора и еще примерно 3 человек. «Ожидаемый гол - xG» - характеристика любого удара по воротам соперника. Она не рассчитывается по какой либо формуле, а равна проценту забитых голов ударами из этой точки, в этой ситуации (со штрафного, углового или с игры) и таким способом (головой, левой/правой ногой, другой частью тела) за весь период сбора данных. Причем у лучших статистических порталов существует разделение баз по Лигам, что особенно важно для турниров невысокого уровня вроде РПЛ. При этом учитывается число и расположение обороняющихся. Т.е. счетчик (человек обсчитывающий игры) делает скрин удара на экране монитора, фиксирует условия удара, а компьютер из базы портала проверяет, сколько голов было забито таким образом и сколько таких ударов было всего. В итоге получается величина, которая равна вероятности забить таким ударом. Все xG ударов за матч складываются, и получается сумма xG за матч для каждой команды и для ее соперника - xGA. Дальше получившиеся суммы оцениваются компьютером по чуть более сложной формуле, но мы попробуем упрощенно объяснить ее так: в первом приближении сравниваются случившиеся ранее итоги матчей (ничьи или чьи-то победы) при таком же соотношением xG. Это называется «математическим ожиданием» итогового результата. И именно по нему получаются «ожидаемы очки - xPTS» в каждой игре, которые из тура в тур суммируются как и реальные очки в итоговой таблице РПЛ. Так что бытующая у большинства болельщиков РПЛ убежденность, что продвинутая статистика вещь выдуманная «ботаниками», истине не соответствует - все опирается на реальные удары, игры и голы. Опыт почти полувекового применения такой модели показывает примерно 90% совпадение модели с практикой. Единственная особенность - такой процент достигается при примерно 250 играх в турнире, а при 240, как в РПЛ, - он на уровне 80%. Важное понятие в продвинутой статистике, которое надо для понимания ее влияния на результат команды - регрессия к среднему. Она состоит в том, что значительная разница между ожидаемыми голами/очками и реальными для любой команды по мере увеличения числа игр должна снижаться.
Теперь - к итогам. Краснодар - первый по атакующим показателям - ожидаемым голам xG и реализации - превышении общего числа забитых мячей над количеством ожидаемых голов. Но в обороне, что в конечном счете и определило исход борьбы за титул, лидерство уступил Зениту. У СБГ не только самые малые ожидаемые пропущенные xGA, но и спасения ворот (разница между xGА и количеством пропущенных голов) - третьи в лиге. Приоритет обороны над атакой в итоговом результате - общая тенденция для всех лиг, обсчитываемых порталом UnderStat.com, как говорится: «Атака выигрывает матчи, а оборона - титулы» (С). И разница между ожидаемыми очками xPoints и набранными Зенитом в +11 это отражает. Именно на этом основывался наш прогноз после 22 тура о победе Зенита над Краснодаром в итоге сезона, который и оправдался на 100%. Хотя не будем забывать о погрешности, вносимой чрезмерным количеством пенальти в пользу клуба, но в случае с Зенитом она роли не сыграла.
Спартак по ожидаемым очкам стал третьим, где мы ожидали его увидеть в прогнозе, в том числе и в реальной таблице чемпионата, где они остались 4-ми. Хотя на тот момент Спартак был шестым, но по закону «регрессии к среднему» благодаря сбалансированности атакующих и оборонительных метрик должны были подняться и по турнирной таблице, и по ожидаемым очкам. Занять же призовое место в сезоне КБ помешало явное их пренебрежение к РПЛ в последних играх в пользу Кубка, чего в марте месяце знать не мог никто (вообще интересная закономерность - по метрикам xG весной Спартак Карседо - полный аналог Спартака Станковича осени прошлого сезона).
Поэтому Локомотив бронзу в сезоне все же сохранил, несмотря на поражения в очных матчах с конкурентом. Ключевой в вопросе сохранения 3 места стала победа над Балтикой, которая по прогнозу должна была остаться 5, но в итоге скатилась на 6. Причина - как раз за последние 8 туров у команды Талалаева произошел абсолютный провал и было набрано всего 4 очка, хотя по xPoints должно было добавиться 11. Причина - такая же, как у Зенита, только со знаком «-»: развалившаяся игра в обороне. За 8 туров ожидаемые пропущенные xGA Балтики выросли в 1,5 раза, а спасения упали с +9 до +5. Это неминуемо привело к катастрофе в набранных очках - отклонение от ожидаемых изменилось с +4 на -3.
Чем воспользовался ЦСКА, катившийся в марте в рамках «регрессии к среднему» на 7 место в соответствии со своими ожидаемыми очками xPoints. И в прогнозе мы осторожно надеялись, что Динамо и Рубин не успеют догнать КС до конца чемпионата. Но случилось чудо - авральная замена ГТ привела к победам в 2 последних играх сезона и не дала случиться самому низкому месту ЦСКА в РПЛ в 21 веке. Хотя на самом деле эффект замены тренера на командах- лидерах срабатывает крайне редко, в отличие от аутсайдеров. В том же ЦСКА 5 лет назад замена тренера по ходу турнира привезла к сползанию на 6 место с разделенного 3-5, а не к возврату в зону ЛЧ. Может потому тогда Олича уволили, а нынче Игдисамова планируют утвердить в качестве ГТ на новый сезон. По продвинутой же статистике место ЦСКА выше ожидаемого объясняется опять же надежностью в обороне (по спасениям - сразу за Зенитом) и отличной реализацией (сразу за тройкой лидеров), что вернули +8 превышения набранных очков над xPTS, которые были до начала весны и 5 место в итоговой таблице.
Феномен Динамо, случившийся при Карпине, когда команда имела реализацию и спасения на уровне худших команд РПЛ, при том, что по ожидаемым очкам xPoints и ожидаемым голам xG шли в лидерах, Динамо Гусева преодолеть смог, хоть и не полностью. Катастрофические «-7» разницы между xPTS и набранными очками сменились на «-2», показатель не блестящий по результату всего сезона, но соответствующий «+5» при Гусеве. Причина - отказ Гусева от интенсивного прессинга, «хоронившего» Динамо против играющих в большинстве своем от обороны соперников. Такая вот особенность РПЛ - за игру с высокой линией обороны команду наказывают, что Челестини в ЦСКА тоже не смог победить.
Рубин - полный антипод Динамо, хотя в таблице РПЛ они рядом. Откровенная ставка Рахимова на игру в «автобус» приносила результат осенью, и с приходом Артиги не сильно поменялась, по крайней мере по метрикам xG. Скажем по ожидаемым голам Рубин превосходит только Сочи - абсолютного аутсайдера сезона. Но акцентированная ставка на быстрые атаки приносит результат - по перебору очков (+8) казанцы на втором месте в РПЛ. Другая лидирующая позиция клуба - спасения ворот достигаются не столько надежностью Ставера, сколько глубоко эшелонированной обороной, хотя от «автобусности» Рахимова вроде анонсирован отказ.
Ростов наши прогнозы оправдал полностью, заняв 10 место.
Команды второй восьмерки таблицы xPTS так детально разбирать не будем, отметим только чудесное преображение Крыльев Советов при Булатове - Молоше, которое перечеркнуло наш прогноз на вылет Крыльев, и отправку «в одно лицо» вратарем Пари НН Медведевым своей команды в ФНЛ. 2 проигранных из-за его ошибок игры с Оренбургом и ЦСКА также перечеркнули наш прогноз на сохранение их в РПЛ.
Судейские вопросы глубоко в этом материале разбирать не будем, хотя в последнее время они пользуются особым вниманием «защитников» своих клубов. Причина - и без того большой текст поста. Наше глубокое убеждение - судейские ошибки влияют больше на результаты конкретных игр, чем на итоговую таблицу турнира. Пример - 2 последовательных игры Зенита, вызвавшие наибольший резонанс весной: не совсем справедливая из-за судей победа над Балтикой уже в следующем туре была компенсирована абсолютно несправедливым по игре поражением в Оренбурге. Хотя анализ ошибок, признанных ЭСК, показывает, что «не любимчики» и «фавориты» все же есть. И это ЦСКА со сразу 7 признанными ошибками против красно-синих. Просто для понимания, всего за чемпионат ДСИ РФС признал 28 ошибок судей, из которых 25% - против ЦСКА. Такого кажется не было вообще никогда за всю историю РПЛ. Главный же фаворит судейского корпуса - Ахмат, с теми же 25 процентами ошибок в свою пользу из всех.
Что касается обычного рассмотрения итогов судейства с точки зрения Правил, а не их интерпретации со стороны Мажича и Ко, если здоровье позволит, постараемся его тоже сделать чуть позже.
Вся статистика с портала UnderStat.com