mikaprok (mikaprok) wrote,
mikaprok
mikaprok

Category:

Play Off



Околоматематика.

Сетон-Томпсон как-то заметил: терять свое время за наблюдением чужих упражнений (бесплатно) может только человек, чье время ничего не стоит.

Собственно, вся неизбывная любовь к спорту у англичан держится исключительно на ставках. Отсюда трепетное отношение к болению и навязывание социальным низам определенных подкрепляющих привычек для коллективного финансирования собственных удовольствий.

Может быть это покажется удивительным, но в 2018 году мы имеем тот же способ заработать (потерять) деньги, что и в 1980х, 90х и 2000х: каждый букмейкер выставляет свои коэффициенты, как бог на душу положит. Разумеется, говорят о немыслимой работе нанятых математиков, сборе статистике, которому позавидует любое государство первого мира и инсайде (не без того).

Не знаю, не знаю. Так ли всё перечисленное недоступно простым смертным?:-)

Вот усредненные вероятности на победу трех команд от 10 топовых букмейкеров, сделанные до начала турнира:
- 16,6% у Бразилии;
- 12,8% у Германии;
- 12,5% у Испании.

Сейчас коэффициент скорректировался, с небольшим отрывом лидирует Испания (несмотря на ничью).

Но, извините, почему бы действительно не использовать высокоточную технику, заодно проверив ее на «детекторе лжи».






Четверо исследователей из Университета Дортмунда взяли всю доступную публичную статистику о футбольных первенствах, ранжирование команд и случаи потенциальных сюрпризов на Чемпионатах Мира и Европы последних 50 лет, ну и до кучи имеющиеся коэффициенты букмейкеров.

Кроме того, они попытались перечислить некоторое количество факторов «далекого» влияния. Например, ВВП страны-участницы турнира.

Основываясь на внушительном массиве данных они решили до момента предсказания немножко поучить машинку и отранжировать все обстоятельства по степени их влияния на исход поединков, а дальше уже применить к предсказанию 18-го года.

Кому интересны технические детали, см. специальные приложения метода «random forest».

Интересно, что из всего многообразия факторов, самыми значимыми оказались как раз имеющиеся коэффициенты букмейкеров и ранг команд FIFA (!), посчитанные как бы на ходу.

Менее значимым стали общее количество футболистов команды, успешно выступавших в трех предыдущих сезонах в Лиге Чемпионов и их возраст.

Относительно неважной, основываясь на имеющихся данных, является, например, национальность и время работы в должности тренера.

Случайность? :-)





Дальше начались симуляции начинающегося чемпионата.

Ее прогнали 100000 раз.

Первые несколько раз Испания выглядела безоговорочным лидером. Однако, на большом количестве попыток лучшие шансы появились у Германии.

Проблема в тяжелой турнирной сетке у Германии.

В целом, предсказание выглядит так: если ей удастся прорвется через четвертьфиналы, она станет лидером. Если нет, то из оставшихся выбираем Испанию.
О Бразилии речь не идет :-) Впрочем и предсказывали сотрудники немецкого ВУЗа.





В таком раскладе, на мой взгляд, совершенно не учтены сюрпризы, происходящие на уровне 1/8 на каждом крупном турнире. Иначе всё было бы слишком просто.

«Вот такая, понимаешь, загогулина»


https://telegram.me/mikaprok


Tags: #machine learning, #россия, #спорт, #статистика, #чм-2018, football, machine learning, math, russia, sport, statistics

Если бы каждый этап проходил 100 тыс. раз, это была бы полезная информация : )

Если бы каждый этап проходил 100 000 раз это был бы никому не нужно
Какие замечательные иллюстрации к посту!
Приятно, что немцы всё рассчитали – победа не за горами =).

Ставить то на кого?)

Может все же, учитывая политическую составляющую, на Россию?)

Несколько ставок надо делать
- А мы можем присоединиться?
- Да. На забег с яйцом и ложкой для леди старше двенадцати лет. Какие мысли по этому поводу, Дживс? Прошлогодняя победительница Сара Миллс будет фавориткой в забеге, сэр. Каковы ее шансы?
- Я еще не видел котировок, но она красиво несет яйцо.
Вторую реплику следует разделить на четыре отдельных реплики.
Ага, видимо форматирование при копировании пропало :-/

Я поставил на Россию, кстати. 1 к 42 как-никак :)
А в это время в другом полушарии объемная статья про лечение ADHD: "Evaluating KemPharm's KP415, Part 1: What Is ADHD?" статья на seeking alpha
Эх, химия и жизнь..
Пока наблюдается тотальное преимущество европейцев, из 15 на данный момент сыгранных матчей между европейскими командами и "остальным миром" у первых 11 побед, 2 ничьи и 2 поражения, включая неожиданное немецкое. Если так дальше пойдет, то в плей-офф будет 12 европейских команд (как, кстати, и предсказано выше), для сравнения, 4 года назад, в Бразилии, их там было 6. У букмекеров удивляют высокие ставки на Бразилию (латиноамериканцы никогда не выигрывали ЧМ проходящий в Европе) и низкие на ту же Францию. По идее должно бы быть примерно наоборот, а выиграть должен кто-то из тройки Германия, Испания, Франция.
> (латиноамериканцы никогда не выигрывали ЧМ проходящий в Европе)

1958 в Швеции, победила Бразилия. Давно, но всё-таки было.

> и низкие на ту же Францию

У французов в случае идеального сферического мундиаля в вакууме Хорватия в 1/8 и Португалия в 1/4 => достаточно высокие шансы влететь на ранних стадиях.
А вот высокие ставки на Бразилию и правда удивляют
Да, верно, 1958. Спасибо. Исправляю - в современную эпоху. Хорваты французам не соперники. Португалии слишком уж везло 2 года назад, не удивлюсь, если они в понедельник, в порядке компенсации, проиграют Ирану и поедут домой. Надоели!
Ну вот на счёт хорватов как сказать ;)
Чемпион - Франция, Франция - Хорватия 4-2. Люблю, когда я прав! Справедливости ради, хорваты с французами сыграли свой лучший матч и счет не вполне по делу.
Пока ничего и не началось, по большому счету :-)

oldadmiral

June 23 2018, 17:02:42 UTC 1 year ago Edited:  June 23 2018, 17:04:23 UTC

Бельгия чрезвычайно хороша. Фавориты, конечно, играют под нагрузками и еще прибавят (те кому посчастливится пробиться в плей-офф ;)), а относительно Бельгии это нельзя точно утверждать, но вне зависимости от этого Бельгия один из претендентов.
В общем-то для такого предсказания не нужны ни четверо исследователей, ни Университет Дортмунда, ни random forest, ни масса статистики и коэффициентов. Мне даже отчасти хочется верить, что они всё это слепили на коленке за 5 минут безо всяких там machine learning.
Кстати да, а деньги, выделенные на исследования, пошли на пиво.
Если бы не на коленке, то ЧМ должна стать Панама, но нет, все-таки на коленке :-(
Вы всё же не выдержали, написали про футбол :)
Хоть и в стиле, приличествующем дневнику почтенного аналитика, а не среднестатистического болелы :)
Я ответил на запрос таким образом.
Немецкие учёные скосплеили британских.

Есть подозрение, что сенсаций будет много. Их уже прилично.
"Интересно, что из всего многообразия факторов, самыми значимыми оказались как раз имеющиеся коэффициенты букмейкеров и ранг команд FIFA"
Вроде бы про влияние коэффициента букмейкеров напрашивается банальное объяснение, что это proxy variable для важных, но неучтенных в исследовании факторов, типа травм ведущих игроков. А что такое "ранг команды FIFA", если в двух словах?
Если я Вас правильно понял (что вряд ли), надо ставить против Бразилии на стадии от четвертьфинала.
Если верить исследованию, а это отдельный вопрос, то имеет смысл ставить на две сборные: Испанию до четвертьфинала и Германию после четвертьфинала.

niprabiil

June 21 2018, 12:20:32 UTC 1 year ago Edited:  June 21 2018, 12:22:07 UTC

В данном случае, я смотрю на приведённый Вами рейтинг Бразилии от топовых букмейкеров. Есть разрыв между этим рейтингом и уровнем игры, который бразильцы демонстрируют. Т.е. некто "играет" на магии имени бразильской сборной, давая ей высокий рейтинг, чтобы заработать в момент её провала, который произойдет в четвертьфинале или позже. Или это не так работает? :)
Смотря для кого работает, вы со стороны букмейкера смотрите или того, кто ставит? Играть против всегда менее выгодно, чем за, больше вероятностный разброс.
Со стороны букмейкера. Или сам букмейкер в своё казино не играет?
Зависит от устройства механизма: бывают площадки, на которых статистика определяется теми, кто ставит, в другом случае -- заранее выбранными переменными. Они в любом случае должны быть правдоподобны.
Казино нет смысла специально ставить, это и так происходит :-)
Понятно. Спасибо за дискуссию и за Ваш блог; уже год читаю, очень интересно :)
Спасибо вам!

mdmihalch

June 26 2018, 03:15:08 UTC 1 year ago Edited:  June 26 2018, 06:42:59 UTC

Спасибо за пост.
С удовольствием послежу - сколько позиций и дальше совпадёт))

Что-то начинает вытанцовываться
угу.. загогулина какая-то и получается))

Что делать, патриотизм подвел. Простим :-)
дауш.. получается - иногда)) может и подвести

mdmihalch

June 29 2018, 04:20:19 UTC 1 year ago Edited:  June 29 2018, 04:27:49 UTC

в принципе - картинка пока)) достаточно приличная..
не 100% конечно, но если бы такое было возможно - на что бы жили букмекеры))



всю схему есно портит)) GER..
но её невыход из группы вряд ли кто-либо предсказывал
Доверие к подобным прогнозам всегда портят сенсации. Если заложиться на них, то все хорошо :-)
в 2004 в долгосрочном прогнозе "протянул" по сетке греков до 1/2..
что позволило взять второе место (и 30% банка))) во внутрикорпоративных ставках
а только за счёт краткосрочных прогнозов совсем бы слажал))
пробовал потом повторить в сети - https://forum.guns.ru/forummessage/68/1000727.html
но не пошло особо.. и участников не набралось, да и ставок не было))
А вы по какой-то системе играете?

mdmihalch

June 29 2018, 14:06:23 UTC 1 year ago Edited:  June 29 2018, 16:20:35 UTC

Прогноз составляется в 2 этапа:

Этап 1 - долгосрочный прогноз (прием заявок - до начала чемпионата)
- указываются участники матчей плейофф (можно списком 8+4+2 команды при ЧЕ);
- указывается чемпион;
- указывается лучший бомбардир.
Примечание 1 (хитрость))): поступательность не обязательна - в финал можно ставить того, кто в полуфинале не стоял например))

Этап 2 - краткосрочный прогноз
- проставляются результаты групповых матчей (прием заявок - до начала чемпионата.. для удобства)));
- проставляются результаты матчей плейофф (прием заявок - до начала каждого матча)
Примечание 2: пропустил прогноз - не снимаешься, а просто не получишь очки за этот матч.
Примечание 3: для плейофф - ставим счет в основное и возможное дополнительное время,
а если ничья и - пенальти, то команде засчитывается победа с разницей в один мяч плюсом к голам в основное и дополнительное время..

Начисление очков:
1. Угадал победителя матча - 1 очко;
2. Угадал разницу забитых/пропущенных - 3 очка (1 - за победителя, 2 - за разницу);
3. Угадал счет - 6 очков (1 - за победителя, 2 - за разницу, 3 - за сам счет);
4. Угадал четвертьфиналиста - 10 очков;
5. Угадал полуфиналиста - 20 очков;
6. Угадал финалиста - 30 очков;
7. Угадал чемпиона - 50 очков;
8. Угадал лучшего бомбардира - 50 очков..

Вклад в общий банк одинаковый для всех участников на старте.
Распределение банка по результатам подсчета очков:
1-ое место - 50% банка
2-ое - 30%
3-е - 20%
А если очков поровну у всех участников? :-)
ну.. на такую вероятность можно отдельно ставить))
но это - не очень принципиально.. ведь получается, что разница в том - кто и кого потом угощает))
даже если кто-то из проигравших и не пришёл - общак за вечер в ноль легко уходит))
Правильно, главное не победа, а участие.
Они вроде бы угадали 15 участников плей-офф из 16? Это блестящий результат.
Они это ребята из исследования?
Только я обшибся - 14 из 16. Все равно - не дурно.
попробуем продолжить.. ветку))



1/8=87.5%, 1/4=50%, 1/2=50/25/0%, финал=50/0%, чемпион=0%
Наглядный урок спортивной математики
Ну вот получается и всё.. больше на схеме отмечать нечего))
1/8=87.5%, 1/4=50%, 1/2=25%, финал=0%, чемпион=0%



Спасибо за беседу))
Логично, энтропия растет.

Спасибо вам!
айэмсорри))

Все мы там были