May 18th, 2008

moose, transparent

парадокс симпсона

Две улитки, одну из которых зовут Басё, а другую - Исса, соревнуются в том, кто лучше умеет забираться на гору Фудзи. Каждая из улиток пытается забраться на гору 100 раз. У Басё получается добраться до вершины получается 68 раз из ста, а у Иссы - 75.

Казалось бы, ясно, что Исса - более опытный альпинист, чем Басё, верно?

Но, видите ли, мы упустили из виду, что на гору Фудзи есть два маршрута - пологий и легкий северный склон, и крутой, опасный южный. Оказывается, Басё в основном пытался заползти по сложному южному маршруту, а Исса - всё больше по легкому северному.

По северному, легкому, маршруту Басё пытался проползти 20 раз, и из них он добрался до вершины в 18-ти; а Исса пытался 80 раз, и получилось у него 65. Выходит, что Басё добивался успеха в 90% случаев, а Исса - в 81% случаев, поэтому Басё опытнее Иссы на северном склоне.

По южному, тяжелому маршруту, Басё пытался проползти 80 раз, и получилось у него в 50 - 62.5%. А Исса пытался по нему проползти 20 раз, и вышло у него всего в 10 из них - 50%. Выходит, что Басё опытнее Иссы и на южном склоне.

Но если все сложить, выходит, что Басё забрался на гору 68 раз из ста, а Исса 75 раз из ста, так что же, получается, что Исса опытнее Басё?

Нет. Мы знаем, что Басё - более опытный альпинист, и мы понимаем, как объяснить кажущееся противоречие: итоговый подсчет не учитывает того факта, что Басё намного чаще взбирался по более сложному маршруту, а Исса - наоборот.

Но если бы у нас не было этого факта, если бы мы вообще ничего не знали о двух маршрутах и о том, как улитки между ними выбирали - тогда, на основании одного только сравнения между 68/100 и 75/100, мы могли бы прийти к ложному выводу о том, что Исса опытнее. Действительно, откуда бы нам было знать, что внутри вопроса таится скрытая переменная - выбор маршрута - которая коренным образом меняет то, как надлежит интерпретировать результаты?



Это было наглядное объяснение парадокса Симпсона - настолько наглядное, насколько я смог придумать. В статье в Википедии есть несколько других примеров этого интереснейшего парадокса.