Anatoly Vorobey (avva) wrote,
Anatoly Vorobey
avva

еще раз о проблеме монти холла

Я не жалею, что написал о проблеме Монти Холла вчера, т.к. в результате перечитал еще раз википедию и несколько статей, и понял об этом вопросе что-то, чего не понимал раньше.

Итак, давайте вернемся к вопросу и сформулируем его еще раз. Есть три двери, за одной автомобиль, за другими двумя козы. Обозначим двери 1,2,3. Вы выбираете одну из дверей - пусть определенности ради это будет дверь номер 1. Ведущий, который знает, где находится автомобиль, открывает одну из оставшихся двух дверей, причем заранее известно, что он специально откроет дверь, за которой стоит коза. Он так и делает - предположим, он открыл дверь номер 3, и за ней коза. Теперь у вас есть шанс сменить свой выбор с первой двери на вторую. Стоит ли вам так поступить?

Я не буду заново объяснять, почему правильный ответ - "да, стоит, если сменить выбор, то с вероятностью 2/3 выиграешь автомобиль". Если вы с этим несогласны, почитайте Википедию, или английскую Википедию, или триста комментов у object'а, итд. итд. Давайте предположим, что мы все согласны с тем, что при смене выбора вероятность выигрыша оказывается 2/3 (66.6%), а не 1/2 (50%). Я хочу обсудить теперь два более тонких вопроса.

Во-первых, не все, кто знают правильный ответ, отдают себе отчет в том, насколько важно правило, что ведущий всегда специально открывает дверь с козой. Что если изменить это правило, и сказать, например, что ведущий открывает одну из оставшихся двух дверей наугад - если автомобиль, то мы отменяем всю попытку, а если коза, то предлагаем игроку сменить выбор, как раньше? Если сделать так, что вероятность выигрыша при смене выбора действительно оказывается 50%, а не 66.6% - т.е. менять выбор незачем (непонимание этого обстоятельства можно считать путаницей Монти Холла второго порядка, в отличие от более обычной путаницы, когда человек думает, что в обычном условии ответ 50%). В отличие от обычного условия, когда действия ведущего "не добавляют информации" (ведь он всегда может найти дверь с козой, чтобы открыть ее), в этой формулировке тот факт, что ведущий открыл дверь с козой, добавляет новую информацию - ведь ему мог попасться автомобиль, но не попался! - и меняет вероятности для двух других дверей. Чтобы убедиться в этом, можно расписать все возможности и посчитать количество вариантов. См. также программу object'а, которая это наглядно демонстритует во втором эксперименте.

Во-вторых, вот новая (для меня) информация. Что происходит - в обычной, "правильной" формулировке задачи - когда ведущий может открыть как вторую, так и третью дверь, потому что за обеими козы? Например, он выбирает наугад одну из них. Так вот, то, что он выбирает наугад, должно быть частью условия, иначе ответ необязательно равен 2/3! Подчеркну еще раз, чтобы не было путаницы: здесь речь идет не о выборе, какую дверь открыть вообще (как в прошлом абзаце), а только в случае, когда за обеими козы. Если ведущий в этом случае выбирает дверь не случайно - например, если он почему-то предпочитает дверь номер 3, может, она к нему ближе - тогда вероятность выигрыша не будет равна ровно 2/3, хотя она все равно будет где-то между 50% и 100%.

На самом деле то, что я только что написал, не совсем верно. Чтобы все прояснить, надо сначала все усложнить. Дело в том, что главный вопрос - какова вероятность выигрыша? - можно задать двумя разными способами, и это будут на самом деле две разные (хоть и очень похожие!) задачи. Вот эти два способа:

1. Предположим, какой-то игрок всегда выбирает сменить свой выбор. Пускай он это делает много раз, каждый раз после того, как ведущий открывает какую-то дверь с козой согласно условиям. В каком проценте случаев он выиграет?

2. Предположим, вы выбрали дверь 1, и ведущий открыл дверь 3 с козой согласно условиям. Какова вероятность выиграть, если вы сейчас смените дверь?

Эти две формулировки выглядят очень похожими, но на самом деле они разные. Эту разницу можно объяснить вот как. Обычно говорят, что выбор ведущего "не добавляет информации", потому что ведущий всегда может открыть дверь с козой согласно условиям. В первой формулировке задачи это действительно верно. Но во второй формулировке это всего лишь почти верно, потому что мы знаем, что открыта дверь номер 3, а не номер 2. Это хоть и небольшая, но дополнительная информация, и если у ведущего есть какие-то предпочтения в этом вопросе, они могут повлиять на вероятность выигрыша. Говоря математическим языком, во второй задаче речь идет об условной вероятности выигрыша при том обстоятельстве, что открыта дверь номер 3. В первой задаче речь идет о "просто" вероятности выигрыша, никакой условности в ней нет ("условная вероятность" означает "вероятность того, что случилось событие X, при условии, что верно обстоятельство Y").

Вот конкретный пример. Предположим, ведущий, если у него есть возможность, всегда предпочтет открыть дверь номер 2. Предположим, что вы теперь видите, что он открыл дверь номер 3. Тогда вероятность выигрыша при смене выбора для вас верна 100% - автомобиль точно находится за дверью номер 2, иначе ведущий бы ее открыл.

А если наоборот, ведущий всегда предпочтет, если возможно, третью дверь? Тогда, если мы видим, что он открыл третью дверь, вероятность выигрыша всего 50%. Это потому, что информация об открытой третьей двери берет на себя весь вес возможности "автомобиль за первой дверью" - ведь в таком случае ведущий всегда откроет третью дверь. Третья дверь будет открыть всегда и если автомобиль за первой, и если автомобиль за второй, так что информация об этом сохраняет исходно равные шансы этих двух возможностей.

Если же ведущий выбирает дверь (когда за обеими козы) наугад, то вероятность выигрыша действительно равна 66.6%, как в "правильном" решении.

В чем тут разница с первой задачей, из двух вышеописанных вариантов? В ней ответ всегда 66.6%, вне зависимости от предпочтений ведущего. Почему, как это объяснить? Дело в том, что она включает в себя и те случаи, когда ведущий открыл дверь номер 3, и те случаи, когда ведущий открыл номер 2. В ней мы действительно не получаем никакой новой информации. Например, предположим опять, что ведущий всегда стремится открыть третью дверь, если можно. Тогда: если известно, что открыта вторая дверь, то вероятность (условная) выигрыша при смене равна 100%. Если известно, что открыта третья дверь, то вероятность (условная) выигрыша при смене равна 50%. А если мы сделаем тысячу разных попыток, то в части из них ведущий откроет вторую дверь (когда у него не будет выбора, потому что автомобиль за третьей), в остальных случаях откроет третью. Доля выигрышей среди тех случаев, где открыл вторую, будет 100%, среди тех, где открыл третью - 50%, а доля выигрыша вообще, из всех попыток - все равно будет 66.6%.

Обычно, когда формулируют задачу Монти Холла, то формулируют именно задачу с условной вероятностью - т.е. "что мне теперь делать, если при мне открыли дверь с козой?". Так вот, чтобы правильным ответом было 2/3, такая формулировка должна включать в себя условие "когда ведущий выбирает между двумя дверьми с козами, он выбирает случайно". А всякие компьютерные проверки чаще всего, наоборот, проверяют первый вариант, в котором ответ всегда 2/3 (напр. программа object'а такова). Правда, надо отметить, что даже во втором варианте без уточняющего условия все равно можно посоветовать игроку сменить выбор. Вероятность выигрыша для него варьируется от 50% до 100%, и почти наверняка реально выше 50%, так что он ничего не проигрывает, а скорее всего выигрывает, от смены выбора.


Техническое приложение

Это приложение будет понятно только тем, кто знаком с теорией вероятностей.

С помощью условной вероятности можно смоделировать все варианты этой задачи - и тот, когда ведущий открывает всегда дверь с козой, и тот, когда он выбирает наугад, а открытие автомобиля отсеивается, и тот, когда он выбирает наугад только между двумя козами, и то, когда он между ними выбирает _не_ наугад. В некоторых из этий случаев выходит 1/2, в некоторых 2/3, в некоторых 1 - теорема Байеса все говорит и ничего не скрывает.

Поведение ведущего описывается вероятностями вида P31 = P(открывает номер 3 | автомобиль в 1) (для тех, кто незнаком, но все же читает: знак "|" надлежит читать как "при условии, что"). Поскольку мы предполагаем, что игрок выбрал дверь 1, ведущий всегда открывает 2 или 3, поэтому его поведение описывается числами P21, P22, P23, P31, P32, P33. Тот факт, что ведущий всегда открывает какую-то дверь, описан уравнениями P21+P31 = 1, P22+P32 = 1, P23+P33 = 1. Так что на самом деле свободных параметров у него всего три, а не шесть.

Сказать, что ведущий выбирает одну из дверей случайно, не глядя на то, где автомобиль - значит сказать, что P21=P31 = 1/2, P22=P32=1/2, P23=P33=1/2. Чтобы смоделировать глобальное предпочтение одной из дверей, можно просто заменить в каждой из этих формул 1/2 на p и 1-p.

Сказать (как в обычном условии), что ведущий никогда не открывает автомобиль- значить сказать, что P22 = P33 = 0. При этом поведение ведущего при автомобиле за второй или третьей дверью детерминировано: P32 = P23 = 1. Неизвестными остаются лишь числа P21, P31, т.е. выбор между двумя козами. Если этот выбор случаен, то P21 = P31 = 1/2. Если, например, ведущий всегда предпочитает в таком случае третью дверь, то P31 = 1, P21 = 0.

Наконец, само вычисление условной вероятности выглядит так. Пусть мы выбрали дверь номер 1, и ведущий открыл дверь номер 3. Мы выигрываем, если автомобиль находится за дверью номер 2.

P(выигрыш при смене выбора | открыта номер 3) = P (автомобиль в 2 | открыта номер 3) = (согласно теореме Байеса) P(открыта номер 3 | автомобиль в 2) * P (автомобиль в 2) / P(открыта номер 3)

= P32 * 1/3 / (1/3*P31 + 1/3*P32 + 1/3*P33) =

(здесь мы предполагаем, что вероятность автомобиля распределена по дверям равномерно; последний член - всего лишь подсчет вероятности открытия третьей двери по всем трем возможностям; теперь мы можем сократить 1/3 и получить)

= P32 / (P31 + P32 + P33)

Рассмотрим с помощью этой формулы все обсуждавшиеся выше варианты.

Если ведущий выбирает дверь 2 или 3 наугад всегда, не глядя на то, где автомобиль, то все вероятности в формуле равны 1/2 (включая P33! - т.е. он может открыть автомобиль), и ответ выходит 1/2 / 3*1/2 = 1/3. Этот ответ, казалось бы, противоречит 50%, которые мы хотим получить, если ведущий выбирает наугад, не глядя на автомобиль; но надо вспомнить, что только в этом случае мы "отсеиваем" часть результатов, не считая случай, когда открыт автомобиль, за неудачу. Иными словами, если бы проигрышем считался и тот случай, когда мы выбрали 1, ведущий открыл 3 с автомобилем, а мы поменяли на 2, где точно нет автомобиля, то всего наши шансы были бы 1/3; но все такие случаи - а их ровно 1/3, т.к. это ровно те, когда автомобиль за третьей дверью - мы отсеиваем из результатов, и вероятность становится больше в 3/2 раза, т.е. 1/2, как и полагается (вместо того, чтобы делить на общее число попыток x, мы делим на 2/3*x, т.е. умножаем на 3/2).


Если же ведущий всегда выбирает дверь с козой, то P33 = 0, P32 = 1, поэтому формула еще упрощается: 1 / (1+P31). Мы видим, что вероятность тогда меняется в границах от 1/2 до 1.

Если ведущий выбирает между козами наугад, то P31 = 1/2, и ответ выходит 2/3: стандартный правильный ответ.

Если ведущий предпочитает всегда третью дверь, то P31 = 1, и ответ выходит 1/2.
Если ведущий предпочитает всегда вторую дверь, то P31 = 0, и ответ выходит 1.
Subscribe
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 140 comments
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →