Как работают наши прогнозы НФЛ

Рекомендации

Детали

FiveThirtyEight признает свою любовь к рейтингу Эло - простой системе, которая оценивает команды или игроков на основе результатов личных встреч - и мы использовали ее для оценки участников в баскетболе, бейсболе, теннисе и других видах спорта на протяжении многих лет. Тем не менее, спортом, которым мы стали заниматься, был профессиональный футбол. Еще в 2014 году мы разработали рейтинги NFL Elo, чтобы прогнозировать исход каждой игры. Гайки и болты этой системы описаны ниже.

Прогнозы игры

По сути, Эло присваивает каждой команде рейтинг силы (в среднем по НФЛ около 1500). Эти рейтинги затем используются для расчета вероятностей победы в играх на основе разницы в качестве между двумя участвующими командами, плюс корректировки на изменения в стартовом квотербеке, месте проведения матча (включая пройденное расстояние) и любых дополнительных выходных дней, которые были у каждой из команд. вступает в конкурс. После игры рейтинг каждой команды меняется в зависимости от результата, степени неожиданности результата и размера выигрыша. Этот процесс повторяется для каждой игры, от начала в сентябре до Суперкубка.

Для любой игры между двумя командами (A и B) с определенными рейтингами Эло перед игрой шансы на победу команды A составляют:

ELODIFF - это рейтинг команды A минус рейтинг команды B, плюс или минус разница в нескольких корректировках:

    Настройка домашнего поля 55 точек в основании, в зависимости от того, кто был дома, плюс 4 очка Эло на каждые 1000 миль путешествовал. Это означает, что гиганты получают бонус Эло в 55 очков, когда «принимают» Джетс (несмотря на то, что обе команды называют MetLife Stadium своим домом), в то время как Патриоты получают бонус Эло в 65 очков, когда, скажем, Зарядные устройства приходят в гости. Для игр с нейтральной площадкой, таких как Суперкубок, нет базовой настройки домашнего поля.
1 win скачать на андроид

Если только команда каким-то образом не добьется Суперкубка в год проведения.

">1 или международные игры, хотя для Суперкубка предусмотрена регулировка расстояния прохождения. Для игр, в которых не присутствует значительное количество фанатов, базовое преимущество домашнего поля составляет 33 очка. Настройка модели

9 сентября 2020 г.

  • Заднее сиденье 25 ЭЛИ всякий раз , когда команда сходит до свидания недели ( в том числе , когда топ-посеяны команды не играют во время открытия недели плей - офф). Наше исследование показывает, что команды в этих ситуациях играют лучше, чем можно было бы ожидать от одного только их стандартного Эло, даже после учета эффектов домашнего поля.
  • Регулировка плей - офф , который умножает ELODIFF на 1.2 перед вычислением ожидаемых вероятности выигрыша и точки разворотов для игр плей - офф. Мы обнаружили, что в плей-офф НФЛ фавориты, как правило, обыгрывают аутсайдеров с большим отрывом, чем мы ожидаем, исходя только из их рейтингов в регулярном сезоне.
  • Регулировки квотербек , который присваивает каждой команде , и каждый отдельный QB прокатный рейтинг производительности, который может быть использован для регулировки команды «эффективный» Эло вверх или вниз в случае серьезной травмы или других изменений QB. (Подробнее о том, как работает эта настройка, см. Ниже.)
  • Мы также протестировали эффекты для погоды и тренеров (включая как главных тренеров, так и координаторов), но обнаружили, что ни один из них не улучшил прогностическую ценность нашей модели при тестировании на истории настолько, чтобы гарантировать включение.

    Интересный факт: если вы хотите сравнить прогнозы Эло с разбросом точек, например с линией Вегаса, вы также можете разделить ELODIFF на 25, чтобы получить разброс для игры. Просто не забудьте включить все многочисленные корректировки, указанные выше, чтобы получить наиболее точную прогнозируемую линию.

    По окончании игры рейтинги перед игрой повышаются (для победившей команды) и снижаются (для проигравшей). Мы делаем это, используя комбинацию факторов:

    • К-фактор. Все системы Elo имеют специальный множитель, называемыйK, который регулирует, насколько быстро рейтинги меняются в ответ на новую информацию. Высокий K-фактор говорит о том, что Эло очень чувствителен к недавним результатам, в результате чего рейтинги сильно колеблются в зависимости от результата каждой игры; низкий K-фактор заставляет Эло медленно менять свое мнение о командах, поскольку каждая игра имеет сравнительно небольшой вес. В нашем исследовании NFL мы обнаружили, что идеальный K-фактор для прогнозирования будущих игр - 20 - достаточно большой, чтобы новые результаты имели вес, но не настолько, чтобы рейтинги менялись каждую неделю.
    • Дельта прогноза. Это разница между двоичным результатом игры (1 - выигрыш, 0 - проигрыш, 0,5 - ничья) и вероятностью выигрыша перед игрой, предсказанной Эло. Поскольку Elo по сути является системой, которая корректирует свои предыдущие предположения на основе новой информации, чем больше разница между тем, что произошло на самом деле, и тем, что она предсказывала в ходе игры, тем больше она в ответ меняет рейтинг каждой команды перед игрой. Поистине шокирующие результаты похожи на тревожный сигнал для Эло: они указывают на то, что его ожидания перед игрой, вероятно, были совершенно неверными и, следовательно, нуждаются в серьезном обновлении.
    • Множитель запаса победы. Двух вышеуказанных факторов было бы достаточно, если бы мы оценивали команды только на основе побед и поражений (и, да, Донован Макнабб, иногда равных). Но мы также хотим иметь возможность принимать во внимание то,как команда выиграла - доминировали ли они над соперниками или просто обгоняли их. С этой целью мы создали множитель, который дает командам (постоянно уменьшающимся) зачетные победы, беря натуральный логарифм их разницы в баллах плюс 1 балл. \ Begin Множитель перемещения = \ ln \ times \ frac \конец Этот фактор также содержит дополнительную поправку на автокорреляцию, которая является проклятием всех систем Эло, которые пытаются приспособиться к балльной марже. С технической точки зрения автокорреляция - это тенденция временного ряда коррелировать с его прошлыми и будущими значениями. С точки зрения футбола, это означает, что рейтинги хороших команд по шкале Эло рискуют быть завышенными, потому что фавориты не только выигрывают чаще, но и имеют тенденцию увеличивать маржу в своих победах, чем проигравшие в своих. Поскольку Эло уделяет больше внимания более крупным победам, это означает, что команды с самым высоким рейтингом могут со временем непропорционально увеличивать свои рейтинги без каких-либо корректировок. Чтобы бороться с этим, мы уменьшаем множитель запаса победы для команд, которые были более крупными фаворитами в игре.

    Специальное примечание: в случае ничьей множитель становится 1,525, или в 2,2 раза больше натурального логарифма 2 (что на основе приведенной выше формулы фактически предполагает, что абсолютный запас победы в любой игре должен быть не менее 1).

    Умножьте все эти факторы вместе, и вы получите общее количество очков Эло, которые должны перейти от проигравшего к победителю в данной игре. (Эло - это закрытая система, в которой каждое очко, полученное одной командой, является очком, потерянным другой.) Другими словами: Эло команды после игры - это просто ее Эло перед игрой плюс или минус сдвиг Эло, подразумеваемый результатом игры - и, в свою очередь, этот послематчевый Эло становится предыгровым Эло для следующего матча команды. Круг жизни.

    Мы также корректируем рейтинг каждого стартового квотербека в зависимости от его результатов в игре с учетом качества защиты соперника. (Подробнее о том, как работает этот процесс, читайте дальше.)

    У Эло есть свои ограничения. Помимо изменений в квотербеке, он не знает о сделках или травмах, которые происходят в середине сезона, поэтому он не может корректировать свои рейтинги в режиме реального времени из-за отсутствия важного игрока, не являющегося игроком QB. Со временем он теоретически обнаружит такое изменение, когда производительность команды упадет из-за травмы, но Эло всегда играет в догонялки в этом отделе. Обычно каждый раз, когда вы видите существенное несоответствие между прогнозируемым спредом Эло и линией Вегаса для игры, это происходит потому, что у Эло нет средств корректировки ключевых изменений в составе, а это делают букмекеры. (Но это должно происходить гораздо реже после добавления наших корректировок QB, поскольку составители шансов не склонны сильно сдвигать линии - или вообще - в ответ на изменения в позициях, отличных от QB.)

    Регулировка защитника

    Новинка 2019 года, новая функция

    3 сентября 2019 года мы добавили способ учета изменений в производительности и персонале квотербека, наиболее важной позиции в игре. Вот как это работает:

      Обе команды и отдельные защитники имеют скользящие рейтинги, основанные на их последних выступлениях.
        Результативность измеряется в соответствии с «VALUE», регрессией между общим количеством ярдов QBR ESPN над заменой и базовыми числами очков (включая статистику ускорения) в данной игре, скорректированной с учетом качества противостоящей защиты.
          Формула для ЗНАЧЕНИЯ: -2,2 * Попытки передачи + 3,7 * Завершенные действия + (Ярды передачи / 5) + 11,3 * ТД с передачей - 14,1 * Перехваты - 8 * Количество раз увольнений - 1,1 * Попытки в спешке + 0,6 * Ярды на спешке + 15,9 * Рашинг ТД .

        За сезоны до завершения регистрации мешков на уровне игры (до 1981 г.) срок мешков обнуляется.

        ">3

      • Этот показатель также корректируется с учетом качества защиты соперника путем вычисления скользящего рейтинга для разрешенного QB VALUE команды, вычитания среднего значения в лиге из VALUE, который оппонент обычно уступает за игру, и использования этого для корректировки производительности QB для рассматриваемой игры. Так, например, если команда обычно теряет VALUE на 5 очков выше, чем средняя команда, мы бы скорректировали производительность отдельного QB вниз на 5 очков VALUE, чтобы учесть более легкую защиту противника.
    • Для отдельных QB скользящий рейтинг обновляется каждые 10 игр. (т. е.Rating_new = 0.9 * Rating_old + 0.1 * Game_VALUE ).
    • Для команд скользящий рейтинг обновляется каждые 20 игр.
      • Это означает, что краткосрочные «горячие» и «холодные» полосы отдельных QB имеют прогностическую ценность, которая может вызвать ненулевую корректировку QB перед игрой, даже если у команды был один и тот же стартер в каждой из своих предыдущих 20 игр.
    • Текущий рейтинг представляет собой ЗНАЧЕНИЕ, которое мы ожидаем от квотербека (на индивидуальном или командном уровне) против проходящей защиты среднего качества в следующем старте. Чтобы преобразовать значение VALUE в Elo, текущий рейтинг можно умножить на 3,3, чтобы получить количество очков Elo, которое, как ожидается, будет приносить QB по сравнению с незадрафтованной заменой новичка.
  • Корректировка Эло квотербека применяется перед каждой игрой путем сравнения текущего рейтинга VALUE стартового QB с текущим рейтингом команды и умножения на 3,3.
    • Например: когда Аарон Роджерс был травмирован в середине сезона 2017 года, его скользящий рейтинг VALUE составлял 66. Переключаемый рейтинг VALUE команды Green Bay Packers составлял 68, а запасной Бретт Хандли имел личный рейтинг 14. Итак, при корректировке рейтинга VALUE. Эло Пакерса для их следующей игры с Хандли, стартовавшим вместо Роджерса, мы бы применили корректировку3,3 * (14-68) = -176.

      ">4 к базовому рейтингу Эло Грин-Бей, равному 1586, в рамках его игры на 7-й неделе против Святых. Это фактически оставило бы Packers как команду Эло 1409 года с Хандли в центре (до внесения корректировок для домашнего поля, путешествий и отдыха), снижение вероятности выигрыша Грин-Бэй с 63 до 39 процентов для игры, несмотря на то, что вы играете дома. В таких случаях корректировка QB может иметь огромный эффект!

    Средний рейтинг QB VALUE команды в сезоне 2019 года составлял около 49,5 (или около 163 очков Эло), и этот показатель в масштабах лиги существенно вырос за всю историю НФЛ по мере того, как пасы стали более распространенными и эффективными. Таким образом, скользящий рейтинг, который сделал бы QB одним из лучших в футболе в 1990-х годах, сейчас будет считаться только средним, даже несмотря на то, что нулевой точкой в ​​наших рейтингах остается результативность незадрафтованного новичка-новичка на уровне замены.

    Последнее замечание по поводу этих рейтингов касается того, как они устанавливаются изначально. Мы объясним предсезонный рейтингкоманды Эло ниже, но вот как предсезонный рейтинг устанавливается для корректировки квотербека:

    • Перед началом сезона каждому стартовому квотербеку присваивается предсезонный рейтинг, основанный либо на его предыдущем выступлении, либо на его позиции на драфте (в случае дебютного старта новичков).
      • Для ветеранов, у которых от 10 до 100 стартов карьеры, мы берем их окончательный рейтинг с конца предыдущего сезона и возвращаем его к рейтингу среднего старта QB НФЛ на одну четверть до следующего сезона.
      • Для игроков, у которых меньше 10 или больше 100 стартов, мы вообще не меняем их рейтинги.
      • Новичкам, которые дебютируют на старте, мы присваиваем начальные рейтинги на основе позиции на драфте. Новичку без драфта всегда присваивается нулевой рейтинг за его первый старт. Для сравнения, первый общий выбор получает рейтинг +113 баллов Эло перед своим первым стартом.
    • Предсезонный рейтинг QB также присваивается на командном уровне. Они состоят из одной трети веса, придаваемого предыдущему скользящему рейтингу QB команды в конце сезона, и двух третей веса, приданного предсезонному скользящему рейтингу предполагаемого лучшего стартера команды.

    Предигровые и предсезонные рейтинги

    Вот как Эло работает на уровне каждой игры и что входит в наши корректировки квотербека. Но откуда вообще берутся предсезонные рейтинги команд?

    Мы используем два источника для определения начальных рейтингов команд в сезоне:

    • В начале каждого сезона каждая существующая команда переносит свой рейтинг Эло с конца предыдущего сезона, за исключением того, что он возвращается на одну треть в сторону среднего значения 1505. Это наш способ хеджирования для карусели межсезонья. драфта, свободное агентство, обмены и тренерские изменения. В настоящее время у нас нет никакого способа подстроиться под фактические движения команды в межсезонье, кроме изменений в квотербеке, но большая доза регресса к среднему значению - следующая лучшая вещь, поскольку НФЛ имеет встроенные механизмы (например, потолок заработной платы), которые способствуют достижению паритета, подталкивая плохие команды вверх и сбивая с толку хорошие.
    • Для сезонов с 1990 года мы также используем итоговые значения побед в Вегасе, чтобы помочь установить предсезонный рейтинг Эло, переводя сверхнормативные ожидаемые победы в шкалу Эло. (Это дополнение к модели помогло значительно повысить точность прогнозов при тестировании на исторических данных, немногим более чем наполовину по сравнению с добавлением корректировки QB.) В качестве примечания: отчасти поэтому мы смешиваем прогнозируемый начальный рейтинг QB с предсезонным периодом. Рейтинг команды QB - мы предполагаем, что изменения в квотербеке "запечены" в Вегасе выше / ниже и должны быть скорректированы, чтобы избежать двойного учета улучшений, добавленных улучшением в QB.

    Эти два фактора объединены: одна треть веса отдается регрессивному Эло, а две трети веса отдается Эло, выигравшему в Вегасе. Эта смесь и формирует предсезонный рейтинг Эло команды.

    Обратите внимание, что рейтинги на конец сезона предыдущего года относятся к «существующим» командам. У команд расширения есть свои правила. Для недавно основанных клубов в современную эпоху мы присваиваем им рейтинг 1300 - что фактически является уровнем Эло, на котором команды расширения НФЛ играли с момента слияния AFL 1970 года. Мы также присвоили этот номер новым командам AFL в 1960 году, позволив рейтингам разыграться с нуля, поскольку AFL действовала параллельно с NFL. Когда команды AFL объединились в NFL, они сохранили рейтинги, которые они создали, играя отдельно.

    Для новых команд на заре НФЛ все немного сложнее. Когда НФЛ начиналась в 1920 году как «Американская профессиональная футбольная ассоциация» (в 1922 году они переименовали ее в «Национальную футбольную лигу»), это была мешанина независимых профессиональных команд из существующих лиг и противников, которые в некоторых случаях даже не были членами APFA. Для команд, которые ранее не играли в профессиональной лиге, мы присвоили им рейтинг 1300; для существующих команд мы смешали эти 1300 баллов с рейтингом, который давал им оценку количества лет, которые они провели с момента основания своей профессиональной команды.

    Эта корректировка применялась к 28 франшизам в течение 1920-х годов, а также к Detroit Lions (которая присоединилась к НФЛ в 1930 году после того, как была основана как профессиональная команда в 1929 году) и Cleveland Rams (которые присоединились к ней в 1937 году после того, как сыграли сезон во второй AFL). С тех пор ни одной команде не требовалась эта точная настройка, хотя мы также используем ее версию для исторических команд, которые прекратили свою деятельность на определенный период времени.

    Не то чтобы других странных ситуаций не было. Во время Второй мировой войны Chicago Cardinals и Pittsburgh Steelers ненадолго объединились в общую команду, известную как Card-Pitt, а до этого Steelers объединились с Philadelphia Eagles, чтобы создать восхитительно прозванный Steagles. В этих случаях мы взяли среднее значение рейтингов двух команд на конец предыдущего сезона и выполнили пересчет среднего годового значения этого числа, чтобы получить предсезонный рейтинг Эло. После того, как мэшап закончился и команды были разделены, Стилерс и Кардиналс (или Иглз) получили тот же предсезонный рейтинг с пересчитанным средним значением, который подразумевается их совместным выступлением в предыдущем сезоне.

    И не забывайте о Кливлендских Браунах и Балтиморских Воронах. Технически НФЛ считает нынешних Браунов продолжением франшизы, которая началась при Поле Брауне в середине 1940-х годов. Но состав этой команды был по сути передан Ravens на их первый сезон в 1996 году, в то время как «New Browns» пополнились драфтом расширения в 1999 году. Из-за этого мы решили, что предсезонный Elo 1996 Ravens должен быть Browns 1995 года. Эло в конце года, с применением межсезонной техники возврата к среднему, и что начальное Эло Браунов 1999 года должно быть 1300, как и у любой другой команды расширения.

    Симуляторы сезона

    Теперь, когда мы знаем, откуда берутся начальные рейтинги команды и квотербека за сезон и как эти рейтинги обновляются по мере изменения расписания, последняя часть нашей головоломки Эло - это то, как все это вписывается в нашу интерактивную графику НФЛ, которая предсказывает весь сезон.

    В любой момент сезона интерактивный список показывает актуальный рейтинг Эло каждой команды (а также то, как этот рейтинг изменился за последнюю неделю и как любые изменения в QB влияют на эффективное Эло команды), а также ожидаемый полный рейтинг команды. -сезонный рекорд и его шансы на победу в своем дивизионе, выход в плей-офф и даже победу в Суперкубке. Все это основано на наборе симуляций, которые разыгрывают оставшуюся часть расписания с использованием Эло для прогнозирования каждой игры.

    В частности, мы моделируем оставшуюся часть сезона десятки тысяч раз, используя метод Монте-Карло, отслеживая, как часто каждая смоделированная вселенная дает определенный результат для каждой команды. Важно отметить, что мы запускаем эти симуляции «в горячем режиме» - то есть рейтинг Эло команды не высвечивается на протяжении всей симуляции, а изменяется после каждой симулированной игры в зависимости от ее результата, который затем используется для симуляции следующей игры, и так далее. Это позволяет нам лучше уловить возможные вариации в том, как команда может разыграть сезон, реалистично моделируя горячие и холодные полосы, которые команда может вести в течение сезона.

    В наших симуляциях также определяется, какой квотербек будет начинать каждую игру, с учетом травм, дисквалификации и отдыхающих стартеров. Например, мы можем знать, что квотербек отсутствует на 1-й и 2-й неделях, но наверняка вернется на 3-ю неделю. Или наш прогноз может содержать некоторую неопределенность в отношении травмы квотербека и предполагать, что у него будет только 10 процентов шансов сыграть на следующей неделе, но 50-процентный шанс сыграть на следующей неделе и так далее. В случаях, когда мы не знаем наверняка, какой квотербек начнет игру, корректировка квотербека команды представляет собой средневзвешенное значение возможных корректировок стартового квотербека.

    В конце сезона вы обнаружите, что интерактив позволяет вам экспериментировать с различными постсезонными непредвиденными обстоятельствами в зависимости от того, кого вы выбрали для победы в данной игре. Это делается путем детализации только до смоделированных вселенных, в которых произошли выбранные вами результаты, и наблюдения за тем, как эти вселенные в конечном итоге разыгрались. Это удобный способ увидеть, что именно нужно вашей любимой команде, чтобы получить благоприятный сценарий плей-офф, или просто изучить влияние каждой игры на остальную лигу.

    Полная история НФЛ

    В сочетании с нашим интерактивом Elo у нас также есть отдельная панель инструментов, показывающая, как рейтинг Elo каждой команды повышался или понижался на протяжении всей истории. Эти диаграммы помогут вам отследить, когда ваша команда была в лучшем или худшем состоянии, а также ее приливы и отливы с течением времени. Данные в диаграммах относятся к 1920 году (если применимо) и обновляются с каждой игрой текущего сезона. Важное предупреждение: исторические интерактивные рейтинги будут отличаться от рейтингов, найденных в нашем интерактивном прогнозе на текущий сезон, потому что исторические рейтинги изменяются. не содержат корректировок наших защитников. (Если вас интересуют исторические данные по корректировке QB, они доступны на нашей домашней странице данных.)

    Создатели моделей

    История версий

    2.0 Добавлены корректировки квотербека, а также специальные корректировки для расстояния прохождения, недель до свидания и спредов рейтингов плей-офф. 4 сентября 2019 г.

    1.1 Рейтинги увеличены до 1920 года с новой процедурой рейтинга для команд расширения и других особых случаев. Возврат к среднему сезонному значению установлен на 1505, а не на 1500. 10 сентября 2015 г.

    1.0 В текущем сезоне введены рейтинги Эло; основные исторические данные восходят к 1970 году. 4 сентября 2014 г.