Парадоксы и вероятность

Математическое объяснение некоторых противоречий, не поддающихся логическому или интуитивному восприятию

Сергей Базанов
Paradox Review
5 min readOct 18, 2017

--

В жизни мы иногда встречаемся с ситуациями, которые, кажется, не имеют логического объяснения, но они существуют на самом деле.

Это парадоксы — нечто, существующее в реальности, но не поддающееся нашему восприятию и интуитивному пониманию.

Вот, например, небольшая подборка парадоксов, которые кажутся абсурдными, но на самом деле верны. Объяснение их связано с теорией вероятностей.

Парадокс дружбы

Вопрос: У вас больше или меньше друзей, чем у вашего среднего друга?

Вы можете быть удивлены, узнав, что, по всей вероятности, у вас меньше друзей, чем у вашего обычного друга, даже если вы думаете иначе. Этот забавный факт также справедлив для большинства ваших друзей. Вообще, у любого человека на Земле, скорее всего, меньше друзей, чем у его же среднестатистического друга.

Но, почему это так?

Этот парадокс может быть объяснен смещением выборки. Как правило, группы дружбы людей не являются случайными выборками из более широких слоев населения.

Скорее, они с большей вероятностью будут содержать людей с большим количеством друзей. Шансы индивидуума, входящего в данную группу друзей, перевешиваются количеством его друзей.

Взгляните на эту простую диаграмму:

На картинке узел D — это человек, у которого наибольшее количество друзей. А это означает, что у его друзей повышается «среднее число друзей у друзей».

В целом расчеты для этой диаграммы показывают, что среднее количество друзей у друзей выше, чем просто среднее количество друзей.

Это парадокс, но это так! Подтверждается не только теорией вероятности, но и реальным исследованием, в котором анализировались данные социальных медиа в мире. Вот результаты исследования.

Парадокс дня рождения

Сколько людей должно находиться в одном помещении, чтобы вероятность того, что по крайней мере двое из них родились в один день и месяц была выше 50%?
А как насчет шанса более 99,9%?

Это довольно таки известный парадокс, который, тем не менее, может оказаться достаточно сложным, чтобы по-настоящему его понять. Для удобства проигнорируем високосные годы и близнецов, и предположим, что дни рождения равномерно распределены в течение года. Под датой рождения будем понимать только день и месяц, не учитывая год.

Большинство людей полагают, что ответ на обе части вопроса должен быть достаточно высоким. В конце концов, в году целых 365 дней. Реальный же ответ, для большинства людей, оказывается на удивление низким.

В первом случае (вероятность совпадения дат рождения более 50%) необходимо всего 23 человека. Для шанса более 99,9% нужно всего 60 человек. Почему это так?

Камнем преткновения для большинства людей является осознание того, что по мере того, как в помещение добавляется больше людей, число возможных пар увеличивается. В общем, количество возможных групп размера k, которое может быть получена из пула n индивидуумов, вычисляется из комбинаторики:

Например, для 23 людей будет 253 возможных пары.

Теперь нам нужно найти вероятность, при которой хотя бы у одной из этих 253 пар даты рождения совпадают. Или наоборот, вероятность несовпадения.

Для любой пары людей существуют два возможных варианта: «даты их дней рождения совпадают» и «даты не совпадают». Очевидно, что вероятность совпадения дат равна 1/365. Это означает, что вероятность несовпадения составляет 364/365.

Для 253 пар вероятность отсутствия общих дат рождения (364/365) составит:

P(нет общих дат рождения) = (364/365)²⁵³

А вероятность того, что по крайней мере, у одной пары будет общая дата рождения составит:

P(общие даты рождения) = 1 — (364/365)²⁵³ = 0.507…

Это более 50%! Аналогичный подход показывает, что для 60 людей шанс совпадения их дат рождения будет более 99,9%.

Парадокс интервала

Вы замечали, что ожидание общественного транспорта на остановках занимает больше времени, чем это должно быть? Может быть, система всегда опаздывает?

Если интервал движения автобуса составляет в среднем 15 минут, как долго в среднем вы должны ждать, попав на остановку в случайное время?

На первый взгляд, ответ должен быть равным 7,5 минутам. Взгляните на диаграмму ниже:

Иногда вы будете приходить через несколько секунд после отправления предыдущего автобуса, а иногда незадолго до следующего. В среднем, вы будете приходить где-то посередине интервала движения, т.е. среднее время ожидания составит 7,5 минут. Правильно?

Но, это только в том случае, если автобус чётко соблюдает график движения и интервал прибытия на остановку. Однако, на самом деле трафик городского транспорта в часы пик менее предсказуем — и иногда автобус может прибыть раньше или позже запланированного. Например, в течение получаса время прибытия автобусов может выглядеть следующим образом:

Здесь второй автобус (средний на картинке) прибыл через двадцать минут после первого — т.е. на пять минут позже, чем нужно. Третий автобус (слева на картинке) прибыл через 10 минут после второго и через полчаса после первого — т.е. по графику!

Допустим, вы оказываетесь на остановке в случайное время в течение этого получаса. В две трети времени вы прибудете в течение более длительного (20-минутного) интервала со средним ожидаемым временем ожидания 10 минут. В оставшуюся треть времени вы прибудете в течение более короткого (10-минутного) интервала со средним временем ожидания 5 минут.

Умножая эти ожидаемые времена на их долю в общем времени, мы находим, что суммарное среднее время ожидания составляет 8,33 минуты — это больше, чем 7,5 минут, которые мы ожидали бы, если бы автобусы прибывали чётко по графику.

Фактически, 7,5 минут — это минимальное время ожидания. Если в интервале между прибытием автобусов на остановку есть какая-либо разница, то некоторые интервалы будут длиннее других. Более вероятно, что вы прибудете на более длительный интервал, чем на более короткий, и именно поэтому среднее время ожидания на самом деле больше, чем вы могли бы интуитивно предвидеть.

Разумеется, прибытие автобусов на остановку — это один из примеров этого парадокса. Однако, эта же логика применяется к любому сценарию, в котором событие неоднократно происходит с переменным временным интервалом между событиями.

На самом деле существует целый раздел теории вероятностей, называемый Теория обновления, который посвящен пониманию таких сценариев. И он имеет приложение для реального мира!

--

--