June 16th, 2015

knot

О мальчиках, девочках и теореме Байеса

Использование векторной алгебры позволяет многие задачи синтетической геометрии решать "автоматически". Вместо нетривиальных рассуждений ad hoc мы тупо пишем уравнения, упрощаем и получаем ответ. Что, возможно, и не так красиво, зато эффективно. Аналогично можно сравнить школьную алгебру и школьную арифметику образца 19 века (последнюю уже и не преподают толком в обычной школе: зачем, если все эти задачи про купцов и цыбики чая значительно упрощаются с введением иксов и игреков?).

Мне иногда кажется, что применение теоремы Байеса позволяет аналогичным образом "автоматизировать" многие задачи элементарной теории вероятностей. В качестве иллюстрации я приведу два решения одной задачи: классическое и байесовское.

Задача взята в фейсбуке Кости Кнопа; так как в комментариях уже есть ответы, я позволю себе привести тут решение - точнее, два решения.

Задача

Два мальчика (логическая задача)

Вы наверняка слыхали про вероятностную задачу "У мистера Брауна два ребенка, хотя бы один из них мальчик. Какова вероятность, что оба ребенка - мальчики". Классика. Ответ в ней 1/3, если вдруг кто позабыл. [Для дотошных и въедливых. Рассматриваются все семьи с двумя детьми, среди которых есть хотя бы один мальчик. Какую долю из них составляют семьи с двумя мальчиками?]

А теперь - намного менее известная вариация (придуманная 3-4 года назад). "У мистера Грина два ребенка. Один из них - мальчик, родившийся в среду. Какова вероятность того, что оба ребенка - мальчики?"

При решении этой задачи вероятность рождения детей в каждый день недели следует считать одинаковой, вероятности рождения мальчика и девочки считать одинаковыми, рождением близнецов пренебречь и т.п. В общем - чистая логика и чистый теорвер.

Прежде чем решать, попробуйте прикинуть ответ, а потом сравните свою прикидку с ответом, полученным вами в результате вычислений. Ну и поделитесь результатами прикидок, пожалуйста.

Я буду рассматривать ниже "неделю" из k дней. При k=1 мы получаем задачу про мистера Брауна, при k=7 - про мистера Грина, при k=365 - задачу "По крайней мере один из детей мистера Блю - мальчик, рожденный 1 апреля".

Классическое решение

[Spoiler (click to open)]

Подсчитаем сначала вероятность того, что в семье есть девочка.

Пусть в мальчик, родившийся в среду - старший ребенок. Тогда для второго ребенка у нас 2k вариантов (мальчик родился в понедельник, девочка родилась в понедельник, мальчик родился во вторник...), из них k - девочки. Аналогично мы имеем 2k и k вариантов для старшего ребенка, если мальчик, родившийся в среду - младший. На первый взгляд кажется, что вероятность девочки (k+k)/(2k+2k). Но на самом деле мы в знаменателе один вариант подсчитали дважды: когда в семье два мальчика, и при этом каждый родился в среду. Поэтому истинная вероятность того, что в семье есть девочка, (k+k)/(2k+2k-1) = 2k/(4k-1). Значит, вероятность того, что оба ребенка - мальчики, 1-2k/(4k-1) = (2k-1)/(4k-1). При k=1 это 1/3, при k=7 это 13/27, а в пределе при большом k получается 1/2.

Байесовское решение

Я слегка переформулирую задачу в духе байесовского подхода. У нас есть прибор, который чувствует мальчиков по запаху, но плохо. Если к прибору подходит мальчик, то лампочка прибора загорается с вероятностью 1/k (и уже не тухнет, пока ее не выключить). Когда к прибору подошли два ребенка Гринов, лампочка загорелась, но мы не успели заметить, после какого именно ребенка это произошло. Какова апостериорная вероятность того, что они оба - мальчики?

[Spoiler (click to open)]

Пусть событие M2 - то, что у Гринов два мальчика, а событие L - то, что лампочка загорелась. Тогда теорема Байеса говорит, что P(M2|L) = P(L|M2)P(M2)/P(L).

Априорная вероятность того, что оба ребенка - мальчики, P(M2)=1/4. Если известно, что ребенок - мальчик, то лампочка, когда он подойдет к прибору, не загорится с вероятностью 1-1/k, а если пол неизвестен, то с вероятностью 1-1/(2k). Отсюда P(L) = 1 - [1-1/(2k)]^2, P(L|M2) = 1 - (1-1/k)^2. После простых преобразований получаем P(L|M2) = (2k-1)/(4k-1).

Только ли мне кажется, что первое решение красивее, но второе эффективнее и в чем-то проще? И верно ли, что в преподавании теории вероятностей педагогически правильно как можно раньше вводить байесовский подход?

knot

Еще о теореме Байеса: задачка Монти Холла

В комментариях к предыдущей записи cheeha напомнила классическую задачку Монти Холла. Я хочу показать, что байесовское решение не только проще классического, но и позволяет увидеть неявное допущение в последнем.

Итак, перед нами три двери. За одной приз, две другие пусты. Вы выбираете дверь A, ведущий, который знает, где приз, показывает, что за дверью B пусто. Следует ли настаивать на A или открыть C?

Пусть A, B, C - события, которые состоят в том, что приз находится за соответствующей дверью. Пусть OB - событие, которое состоит в том, что ведущий открыл дверь B после того, как игрок выбрал дверь A. Найдем P(C|OB) (вычислить P(A|OB) можно аналогично и предоставляется читателю в качестве упражнения).

По теореме Байеса P(C|OB) = P(OB|C)P(C)/P(OB). A priori P(C)=1/3. Если приз лежит за дверью C, то ведущий обязательно выберет дверь B, поэтому P(OB|C)=1. А как вычислить P(OB)?

Очевидно, что P(OB) = P(OB|A)P(A) + P(OB|B)P(B) + P(OB|C)P(C). В этой сумме второй член равен нулю, а третий 1/3. Как быть с первым? Иначе говоря, что делает ведущий, если обе оставшиеся двери пусты?

Если ведущий подбрасывает монетку, выбирая одну из двух пустых дверей, то P(OB|A)=1/2. Тогда теорема Байеса дает P(C|OB)=2/3. Это и есть ответ, который обычно приводят.

Но что, если мы знаем, что ведущий очень ленив и стоит у двери C? Иначе говоря, мы знаем, что он всегда открывает ее, если только за ней нет приза. Это значит, что P(OB|A)=0, и P(C|OB)=1. Что понятно: если ведущий преодолел лень и пошел открывать дверь B, значит, за дверью C точно лежит приз. Аналогично если ведущий очень ленив и стоит у двери B, то P(C|OB)=1/2. Тут поучительно рассмотреть, как в этом случае меняется P(A|OB) по сравнению с априорным P(A).

Можно рассмотреть случай, когда ведущий не очень ленив, и иногда идет к другой двери без необходимости. В итоге можно доказать, что смена выбора игроком никогда не ухудшает его позиции, но может ее улучшить.

Мы видим, что байесовское решение не только проще, но и глубже "обычного".