Фактори, які впливають на перемогу міста в інтелектуальній грі “Мафія”, та їх аналіз

На написання цієї статті мене надихнула ситуація, коли в рейтингу клубу Baker street за 2016 рік я посів друге місце, маючи найбільший вінрейт серед тих, хто зіграв порогову кількість ігор (64), але при цьому заробивши всього одного кращого за рік. Це мене зацікавило, бо напасажирити можна місяць або турнір, але цілий рік об’єктивно не напасажириш. Тобто це означає, що мій стиль гри має певні риси, які допомагають вигравати велику кількість ігор на довгій дистанції, але не є дуже явними у кожній конкретній грі. Я став роздумувати над такою ситуацією і переді мною постало питання, а які ж стратегії впливають на перемогу тої чи іншої команди. Фактично мова йде не про особисту статистику гравців, які у клубі Baker street періодично роблять пан Заяць і пані Айдахо, а про безособову статистику по тих ситуаціях, які виникали в іграх.

Отож ближче до справи. Я мав у своїй вибірці 267 бланків, 229 із яких з іграми клубу Baker street і 38 бланків із іграми Mohyla mafia club. Та інформація, яку містять бланки — це, звісно ж, далеко не все, що відбувається у грі та впливає на перемогу червоних або чорних. Але все ж таки певні статистичні дані звідти взяти можна, а саме

- Перемога чи програш міста

- Чи шериф був застрелений у першу ніч

- Чи шериф був застрелений у другу ніч

- Кількість чорних перевірок у шерифа

- Чи була перевірка доном шерифа у першу ніч

- Чи робила мафія самостріл

- Чи ділили стіл при 10/9/8/6/4 гравцях

- Чи піднімали двох при 10/8/6 гравцях

- Чи піднімали трьох при 9 гравцях

- Чи сиділи всі три мафії поряд

- Колір гравця, якого зняли при дев’ятьох

- Кількість рук, якими зняли цього гравця

- Кількість червоних фолів

- Кількість чорних фолів

- Рік

- Клуб

Також у 58 бланках (переважно з Baker street) було зазначено кращий хід і у 26 бланках з Mohyla mafia club на моє прохання було вказано, чи мафія грала динаміку, чи статику.

Якщо розглянути просту описову статистику, то маємо такі результати:

- Місто перемагало у 40,07% ігор у вибірці. Решту, зрозуміло, виграла мафія.

- Шерифа стріляли у першу ніч у 16,85% ігор. За теорією імовірності мало би бути 14,28%. У другу ніч стріляли шерифа у 18,87% ігор. За теорією імовірності мало би бути 16,22%. Детальніше про імовірності застрелити шерифа у 1 або 2 ніч можна почитати тут: https://vk.com/wall-30886857_288?offset=last&f=replies . Очевидно, стратегія палити шерифа за посадкою дає певні, хоч і невеличкі, плоди.

Кількість бланків у вибірці, де були заповнені перевірки шерифа складає 180. Найчастішою кількістю чорних перевірок у грі є 1 перевірка. Майже така сама кількість ігор, де всі зроблені перевірки були червоними (в деяких іграх шерифа знімали при десятьох, а тому в них теж було зроблено 0 чорних перевірок). Трохи більше 20 ігор у вибірці — ігри з двома чорними перевірками. Ігор із трьома чорними перевірками всього 7.

- Мафія робила самостріл у 2,6% ігор.

- Ділили стіл при десятьох у 25,84% ігор.

- Ділили стіл при дев’ятьох у 5,99% ігор.

- Ділили стіл при вісьмох у 4,89% ігор.

- Ділили стіл при шістьох в 11,07% ігор.

- Ділили стіл при чотирьох у 4,15% ігор.

- Зняли двох при десятьох в 1,13% ігор.

- Зняли трьох при дев’ятьох у 2,25% ігор.

- Зняли двох при вісьмох в 1,51% ігор.

- Зняли двох при шістьох у 7,63% ігор.

- У 9,36% ігор три мафії сиділи поряд. За теорією імовірності має бути 8,33%. Детальніше про це тут: https://vk.com/mohylamafia?w=wall-30886857_278 . Загалом отримане значення є наближеним до розрахованого за теорією імовірності.

- Чорного при дев’ятьох (десятьох) заголосували у 44,14% ігор, а відповідно червоних знімають на 1-ому (0-ому) колі частіше.

Кількість рук, відданих за першого гравця, знятого на голосуванні, є нормально розподіленою навколо 5 із певним хвостом до 10. Загалом нічого дивного.

-За роками найбільша кількість бланків була з 2015 року, але бланків 2016-го було теж досить багато.

-Загалом найпоширенішою кількістю мафій, які вказує у своєму кращому ході перший убитий є лише 1 мафія. Тож грати за кращим ходом не є хорошою стратегією. На жаль, немає статистики по заповітах усіх убитих гравців, щоб це перевірити, але я припускаю, що повтори в заповітах дійсно вказують на чорних гравців.

- В динаміку грали рівно в половині ігор, де про наявність/відсутність динаміки було зазначено.

- Чорні в середньому отримують більше фолів у грі. Середня кількість фолів чорного гравця складає 1,17. Для червоного ж гравця середня кількість фолів складає 1,03. Але це доволі легко пояснити тим, що чорні гравці фактично є чорними у версії шерифа, а тому мають гнути свою версію гри, якщо треба, фолами. Якби у бланках була зазначена альтернативна команда, яку пропонували чорні, припускаю, що їхня середня кількість фолів не відрізнялася б від середньої кількісті фолів чорних гравців.
Тепер перейдімо до пошуку залежностей. Фактично я спробував визначити, що саме, як (позитивно чи негативно) і якою мірою впливає на перемогу міста. У статистиці така штука називається Logit-модель.

Текст, виділений курсивом, призначений для людей, які більш-менш розбираються у статистиці. Якщо Ви його не зрозуміли, нічого страшного.

Для цієї моделі було додатково створено такі змінні:

- Кількість перевірок шерифа у квадраті (для людей, які не знайомі зі статистичними методами, така змінна може здатися дивною, але нижче я поясню, що саме ми виміряли нею)

- Поділ на початку і всередині гри — змінна утворена додаванням ігор, де відбувся поділ столу при десятьох, дев’ятьох, вісьмох і шістьох.

Ці змінні окремо не значущі і тільки зменшують нам ступені свободи, а це критично важливо на не надто великій вибірці. Тому ми можемо їх сміливо об’єднати.

- Підняття двох усередині гри — змінна утворена додаванням ігор, де відбулося підняття двох гравців при шістьох і при вісьмох.

Причина утворення змінної така сама.

Перш ніж інтерпретувати отримані результати, маю зазначити, що зміни імовірності виграшу залежно від кожної окремої події не сумуються, оскільки функція не лінійна. Наприклад, подія А збільшує імовірність виграшу на 30%, а подія Б зменшує на 25%. Це абсолютно НЕ означає, що якщо відбулася подія А і подія Б, то імовірність виграшу збільшилася на 30–25=5%. (Для тих, хто знайомий зі статистикою, але не вивчав logit-моделі, поясню, що зміна імовірності розраховується шляхом підставлення середніх значень в усі змінні, крім тої, про яку пишемо. І зміна нашої змінної від 0 до 1 (більшість змінних у моделі набувають значень 0 або 1) спричиняє зміну функції на певне число. Це і є наш результат. Тобто це результат за інших середніх. А якщо ми знаємо точно якусь іншу змінну нашої моделі та підставимо її значення замість середнього по вибірці, то результат від зміни нашої першої змінної від 0 до 1 буде іншим.) 

Якщо ви не зрозуміли пояснення, то просто повірте на слово, що підсумовувати імовірності не можна.

Отож поїхали.

Якщо мафія стріляє шерифа в першу ніч, то вона зменшує імовірність міста виграти на 30,72%. Ефект є статистично значущим (це означає, що похибка не є настільки великою, щоб ми могли припускати, що цього ефекту нема). Тут загалом усе зрозуміло та логічно.

Якщо мафія стріляє шерифа у другу ніч, то вона зменшує імовірність міста виграти на коефіцієнт, який є статистично незначущим. Тобто ми не можемо говорити про якийсь вплив на перемогу міста від відстрілу шерифа у другу ніч. Можливо, з більшою вибіркою похибки стануть меншими і цей ефект стане значущим. В будь-якому випадку знак «-» біля ефекту від цієї події на перемогу міста є логічним.

Якщо Дон знайшов Шерифа у першу ніч, то це зменшує імовірність міста виграти на 33,15%. Ефект є значущим. Фактично після знайденого Шерифа Дон знає, кого атакувати, або відстрілювати у наступну ніч. Тобто із цим коефіцієнтом теж усе доволі логічно.

Самостріл мафії (не повірите!) збільшує імовірність міста на перемогу. Одразу зазначу, що я не фіксував у вибірці самостріл у тих іграх, де остання мафія стрілялася від безвиході. Я фіксував тільки ті самостріли, які були зроблені, як стратегія. На щастя для мафії, ефект є дуже незначущим. Тобто можна спокійно припустити, що жодного ефекту на перемогу міста самостріл не несе, а все насправді залежить від інших факторів.

Ділення столу (з або без підняття) при 10,9,8,6 гравцях має негативний, але незначущий ефект на перемогу міста.

А от якщо у цій грі ділили при чотирьох, то це збільшує імовірність міста не перемогу на 46,94%. Ефект є значущим. Такий високий результат можна пояснити двома способами:

1. Робити промах при чотирьох — погана стратегія, бо Ви даєте місту додаткову можливість розібратися.

2. Мафія набагато частіше робить промах при чотирьох, якщо у неї все погано за столом, а отже все одно найімовірніше проголосують проти неї.

Припускаю, що обидва пояснення релевантні.

Підняття трьох при дев’ятьох збільшує імовірність міста на перемогу на 47,01%. Ефект є значущим. Загалом теорія імовірності дійсно на боці того, щоб піднімати трьох при дев’ятьох. Особливо якщо застрелено шерифа у першу ніч із червоною перевіркою. Це дає можливість підняти за гру 5, а не 4 гравці, тобто додаткове право на помилку. Детальніше про розрахунок імовірності влетіти 3:3, якщо піднімати трьох, можна почитати тут: https://vk.com/mohylamafia?w=wall-30886857_314 .

Якщо ж ми підставимо в нашу модель ситуацію, коли застрелений у першу ніч шериф має 1 червону перевірку і місто піднімає трьох, то імовірність міста виграти складає 56,12%. Якщо ж місто у цій ситуації вирішує не піднімати трьох, а голосувати гравців по черзі, то імовірність міста виграти складає всього 16,85%. Коротше кажучи, якщо застрелений у першу ніч шериф залишає після себе тільки червону перевірку, то місто має однозначно піднімати трьох при дев’ятьох.

Є ще один спосіб підняти 5 гравців, а не 4 за гру: підняти двох при десятьох. Така дія збільшує імовірність міста на перемогу на 50,21%. Ефект є значущим. Проте такий високий ефект можна пояснити знову ж таки двома способами:

1. Підняття двох при десятьох дає додаткове право на помилку.

2. Зазвичай при десятьох двох піднімають, якщо впевнені, що серед них є мінімум 1 чорний. А ігри, де на нулі підняли чорного (хай і в парі з кимось) виграються частіше.

Нехай Вас не бентежать такі високі числа в останніх трьох ефектах. Похибка в них також досить висока, хоча і недостатньо висока, щоб сказати, що ці ефекти є незначущими. Припускаю, що на більших вибірках ефект буде меншим, але точнішим (із меншою похибкою).

Підняття двох при шістьох або вісьмох збільшує шанси міста на перемогу, але цей ефект не є значущим, тому ми його не можемо брати до уваги.

Якщо три мафії сидять поряд, то ефект від такої події на імовірність перемоги міста є негативним, але не значущим. Тобто можливість «перестукатися» не є аж надто великою перевагою.

Якщо перший, кого заголосували при дев’ятьох (десятьох) був чорний гравець, то імовірність міста на перемогу збільшується на 34,9%. Ефект є найбільш значущим серед усіх змінних. Отож баланси балансами, але для міста є надзвичайно важливим заголосувати чорного гравця при дев’ятьох.

Коли я включав до моделі такі змінні, як червоні та чорні фоли, я припускав, що ефект від червоних фолів на перемогу міста буде негативним, а від чорних фолів — позитивним. Насправді ефект від фолів обох кольорів є позитивним, але дуже незначущим. Тому вплив фолів на перемогу міста відсутній.

Змінні 2015 , 2016 і 2017 року порівняно до 2014 усі дають негативний, але не значущий, ефект на перемогу міста. Тобто у 2014 було більше червоних перемог, ніж у кожному з цих років, але не критично більше.

Те саме можна сказати і про клубний ефект. У Могилянському клубі трохи більше чорних перемог, ніж на Baker street, але не критично більше.

Я щойно описав результати по всіх змінних моделі, крім чорних перевірок шерифа. Ця змінна є значущою і до того ж має не лінійний, а квадратичний вплив на імовірність перемоги міста. Якщо просто, то спершу при збільшенні чорних перевірок імовірність міста виграти зменшується, а потім при збільшенні чорних перевірок ця ж сама імовірність збільшується.

У таблиці нижче наведено імовірність міста перемогти за інших середніх для кожної можливої кількості чорних перевірок у грі.

Уявімо, що Ви — шериф, який прокидається у першу ніч і робить чорну перевірку. Вітаю Вас! Ви щойно зменшили імовірність міста на перемогу на 15% ;-) . Але не засмучуйтеся! Якщо Ви знімете перевіреного чорного на голосуванні, то значно збільшите імовірність міста виграти. Пам’ятаємо, що імовірності не сумуються, тому підставивши в нашу модель 1 чорну перевірку і підняття чорного на 1-ому голосуванні, маємо імовірність виграшу міста 44,32%. Менше половини, але все-таки більше за 25,22%.

А взагалі модель показує ту істину, яку знає будь-який більш-менш хороший гравець у мафію: якщо знайшов чорну перевірку, колекціонуй до неї інші чорні перевірки, а якщо червону — збирай червоні перевірки.

Також у нас були дві змінні, які теоретично могли б впливати на перемогу міста, але ми маємо занадто мало спостережень за цими змінними, а це значить, що включивши ці змінні в загальну модель, програма викинула би ті спостереження, в яких ці змінні пропущені. Тобто включати їх у загальну модель сенсу не було, бо в нас би залишилася занадто мала кількість спостережень на таку кількість змінних.

Ці змінні — це динаміка та кількість чорних у кращому ході. Досить неточно, але ефект від цих змінних виміряти можна, зробивши модель того, як залежить перемога міста від окремо кожної з них. Результат може містити відхилення, оскільки не враховується ефект усіх інших факторів, які впливають на перемогу міста, і цей ефект (позитивний чи негативний) може помилково бути включений в ефект від вимірюваної змінної.

Якщо мафія використовує динаміку, а не статику, то ефект на перемогу міста є негативним, але оскільки ми маємо всього 26 спостережень похибка є дуже високою і ефект не є значущим. Я припускаю, що при збільшенні вибірки ефект від динаміки стане значущим.

Залежність між кількістю чорних гравців у кращому ході та імовірністю перемоги міста є значущою, а вплив позитивний. Водночас оскільки наша модель нелінійна, ми не можемо представляти результати у вигляді «Збільшення чорних гравців у кращому ході на 1 збільшує імовірність перемогти на х.». Тому результати ми представимо в таблиці для кожної кількості чорних гравців, які можуть бути у кращому ході.

Фактично ми бачимо, що зазвичай місто таки дослухається до кращого ходу. А дарма. Як уже було зазначено на початку, більшість кращих ходів містить одного або жодного чорного гравця.

Взагалі, було би цікаво мати більшу вибірку кращих ходів та динаміки, щоб включити ці змінні у нашу загальну модель. Тоді ефект від цих змінних (і модель загалом) був би виміряний точніше.

Як ми бачимо, найбільш значущою змінною, яка впливає на перемогу міста є підняття чорного гравця на першому голосуванні. Розгляньмо, що ж впливає на це найбільше. У модель було включено такі змінні, як кількість рук, які були поставлені проти цього гравця (як лінійна, так і квадратична змінна), кількість чорних перевірок за гру, перевірка Доном Шерифа у першу ніч, а також кількість фолів у грі.

Результати показують, що існує квадратична залежність між кількістю рук, які впали проти першого піднятого гравця та імовірністю, що це був чорний гравець. Ефект є значущим. Фактично, якщо проти першого піднятого гравця впало дуже мало чи дуже багато рук, то імовірність того, що він був чорним, є більшою, ніж якщо впала середня кількість рук. Якщо прибрати з вибірки спостереження, де трьома руками піднімали трьох при дев’ятьох і серед них був принаймні 1 чорний, то результат майже не змінюється. Детальний результат із числами буде наведено у таблиці нижче.

Кількість чорних перевірок у Шерифа впливає на імовірність того, що перший піднятий гравець був чорним позитивно, але незначуще. Так само незначуще впливає і перевірка Доном Шерифа у першу ніч, але негативно.

І тут ми приходимо до результату, який трохи виносить мені мозок, оскільки чисто статистично ми маємо значущий ефект, але мені особисто складно його пояснити з точки зору здорового глузду. Кількість фолів, схоплених усіма десятьма гравцями за всю гру, позитивно впливає на те, чи перший піднятий на голосуванні гравець був мафією. Не питайте, для чого я включав цю змінну в модель. Я сам собі ставлю це запитання і не можу пригадати. :-) Але залежність є залежність.

Тож результати моделі нам дають такі імовірності для різних кількостей рук, відданих проти першого піднятого з голосування (у вибірці є випадки від 3 до 10), а також різної кількості фолів, зібраних у грі (у вибірці є випадки від 1 до 23).

Ті комбінації рук та фолів, які свідчать про те, що скоріш за все перший піднятий на голосуванні був червоним, виділені червоним. Ті, які свідчать про те, що скоріш за все перший піднятий на голосуванні був чорним, виділені чорним.

Треба наголосити, що кількість фолів вказана не на момент, коли знімали першого гравця, а всього за гру. Тобто теоретично використовувати цю таблицю можна, сидячи на угадайці, коли кількість фолів наближена до загальної кількості фолів за гру. Наприклад, вирішуєте Ви угадайку, де вибираєте Ви між гравцем, у якого при дев’ятьох гравець пішов чорним, і гравцем, у якого при дев’ятьох пішов гравець червоним. Найчастішою кількістю рук, які падають проти першого піднятого на голосуванні гравця, є 5. Найчастішою кількістю фолів у грі є 11. Згідно з таблицею вище при дев’ятьох місто втратило чорного гравця з імовірністю 30,08% (тобто з імовірністю 69,92% при дев’ятьох пішов червоний гравець). Тобто ви з більшою імовірністю виграєте, якщо зіграєте у версію, що при дев’ятьох пішов гравець червоний, і проголосуєте проти того гравця, у версії якого він чорний.

До того ж, не обов’язково знати таблицю на пам’ять. Достатньо знати, що при трьох руках проти першого піднятого на голосуванні у грі має набратися 8 фолів і більше, щоб вважати, що перший піднятий — чорний; при чотирьох руках — 16 фолів; при п’ятьох руках — 19 фолів; при шістьох руках — 16 фолів; при сімох руках — 7 фолів; при вісьмох, дев’ятьох і десятьох руках проти першого піднятого за будь-якої кількості фолів він є, найімовірніше, чорним.

Обережно! Використання такої стратегії є небезпечним, оскільки не відомо чому саме фоли за всю гру можуть впливати на колір гравця, який пішов при дев’ятьох/десятьох! А тобто якщо на угадайці Ви маєте декілька сильних аргументів проти одного гравця і дуже слабкі аргументи проти іншого гравця, голосуйте за аргументами. Якщо ж аргументи рівносильні і Ви не знаєте, що робити, можете порахувати фоли та згадати кількість рук і проголосувати за табличкою.

Загалом у мене все. Хочу ще раз згадати, що інформація з бланків є цікавою, але не вичерпною для того, щоб пояснити основні фактори, які впливають на перемогу міста (мафії). Наприклад, у бланках немає інформації про альтернативну команду, яку пропонували чорні. Чи давав Дон свого чорного перевіреним чорним? Чи вскривалися у грі 2 шерифи чи 3? На якому колі вскрився шериф? Думаю, можна налічити ще з десяток факторів, які можуть впливати на перемогу міста (мафії).

Припускаю, що у випадку розвитку мафії до рівня визнаного спорту з великими чемпіонатами та призовими фондами (така тенденція зараз присутня), будуть серйозні збори даних і точніші моделі. Хтось скаже, що такі тенденції перетворять мафію на гру без драйву, а чисто з максимізацією імовірності перемоги своєї команди. Але повірте мені, у «великих» видах спорту (футбол, бейсбол і т.д.) подібні розрахунки вже давним-давно роблять, а драйву від тих ігор не поменшало. Тож висловлю на останок сподівання, що статистичні дослідження в мафії розвинуть цю гру до нового рівня.

Пан Тракієць (Олексій Гаманюк)

P.S. Хочу висловити подяку пану Шреку та пану Мерліну за бланки з Baker street, а також пані Леді та пані Еффі за бланки з Mohyla mafia club. Окремо вдячний своєму викладачеві Віктору Ханжину, який допоміг мені з деякими складними моментами в R. Без вашої допомоги це дослідження не відбулося би.

P.P.S. Хто знає R, ось вам скрінчики:

Основна модель:

Кращий хід:

Динаміка:

Перший чорний: