lyzakov_pavel (lyzakov_pavel) wrote,
lyzakov_pavel
lyzakov_pavel

Categories:

Байесовский анализ катастрофы MH17.

Оригинал взят у rsokolov в Байесовский анализ катастрофы MH17.
(ужасно много букв)

Во избежание преждевременной поломки мозга вводную часть рекомендуется пропустить.
==========================================
0. Напомню вкратце суть теоремы Байеса.

У нас есть некая гипотеза, h, и некоторые свидетельства, e.
Априорная вероятность того, что гипотеза истинна - P(h), что не истинна - P(~h)
Вероятность того, что гипотеза истинна с учетом данных: P(h|e). Это - то что нам нужно посчитать.

Далее - несколько более тонкие сущности.

Вероятность того, что гипотеза h, в случае ее истинности, приведет к появлению имеющихся данных: P(e|h)
А вероятность того, что рассматриваемая гипотеза, имеющая априорную вероятность истинности P(h), приведет к появлению имеющихся данных: P(e|h)*P(h)

Но следует также учитывать вероятность появления имеющихся данных даже в том случае, если рассматриваемая гипотеза совершенно неверна, а верна - обратная, ~h. Это - P(e|~h)
Вероятность того, что обратная гипотеза, имеющая априорную вероятность P(~h), приведет к появлению имеющихся данных: P(e|~h)*P(~h)

Если собрать из этих деталей велосипед, то получится:

P(h|e) = ( P(e|h)*P(h) ) / ( P(e|h)*P(h) + P(e|~h)*P(~h) ) - формула Байеса

То есть, вероятность того, что, с учетом имеющихся данных, рассматриваемая гипотеза - истинна, равна отношению вероятности появления данных при условии того, что гипотеза истинна, к общей вероятности появления данных, как в том случае, если гипотеза истинна, так и в том случае, если она не истинна.

Как это все в итоге работает.

Для каждого набора данных e мы оцениваем на глазок P(e|h) и P(e|~h), вставляем их в формулу Байеса, засовываем в нее априорную вероятность P(h), получаем на выходе апостериорную вероятность P(h|e), которую используем затем в качестве априорной для следующего набора данных. И так - пока не надоест. По ходу процесса P(h|e) может как расти, так и падать, но она всегда остается в пределах от 0 до 1.

Примечание:

На самом деле все эти расчеты происходят с учетом неких базовых знаний о мире, b, относительно которых нет никаких разумных сомнений (background knowledge). Поэтому, формально, следует записывать все эти вероятности как P(h|b), P(e|h,b) и т.д., но для читабельности я это b везде опускаю.

На самом деле разница между базовой информацией и конкретными данными довольно условна. По мере обработки информации, e включается в b, а P(h|e,b) переходит в P(h|b). То есть, априорная информация для каждого нового набора данных - это апостериорная информация после обработки предыдущих данных.

Изначально под базовой я имею в виду информацию, описывающую саму суть события и его предысторию.

==========================================
1. Теперь к делу.

1.a Я опускаю ту часть анализа, которая доказывает, что самолет был сбит ракетой. Это можно будет проделать отдельно, но особого интереса альтернативные версии не представляют.
В это доказательство вошли бы данные о повреждениях самолета, показания свидетелей, фотографии следа ракеты. Все эти данные при дальнейшем анализе я не учитываю.

1.b Вопрос стоит лишь о том, кто выпустил ракету - сепаратисты (h) или украинцы (~h).

1.c Я также не буду специально заострять внимание на конспирологической теории преднамеренного сбития Боинга с целью скомпрометировать сепаратистов. В большинстве случаев такая конкретизация гипотезы ~h (сбили украинцы) не требуется. На тот случай, если я упустил то место, где она может быть важной, я оцениваю ее априорную вероятность не выше 10%.
Подробнее см. это объяснение от avva. (Если воспользоваться вышеупомянутым Rule of Succession, то после 12 неконспирологических случаев сбития пассажирских лайнеров, вероятность конспирологического сценария - 7%.)

Я буду исходить из того, что как h, так и ~h, включают в себя все мыслимые и немыслимые мотивы и сценарии: укры хотели сбить самолет Путина, сепары хотели сбить самолет Аэрофлота, чтобы подставить укров, но привезли Бук не в то место (версия Наливайченко), включая, разумеется, и самую правдоподобную версию о непреднамеренной ошибке.

==========================================
2. Попробуем теперь оценить априорную вероятность гипотезы виновности сепаратистов, т.е. ту, которая следует из самых базовых фактов.

2.a Пусть мы вообще не знаем, что такое "самолеты", что такое "сбили", кто такие "украинцы" и "сепаратисты". Будем исходить из того, что, в отсутствие какой бы то ни было информации , вероятности того, что какой-то "самолет" "собьют" "украинцы" или "сепаратисты", равные: 50% на 50%.

2.b Поскольку мы знаем, что сепаратисты за три дня до этого сбили транспортный самолет над Изварино, то вероятность того, что именно они сбили Боинг повышается до 66%.
См. http://en.wikipedia.org/wiki/Rule_of_succession /"Отродясь такого не бывало, и опять то же самое."(c)/

Это, пока, без учета всех прочих обстоятельств.

Если кому-то покажется это место подозрительным, если кто-то захочет сказать, что вероятность последующих событий не зависит от предыдущих, как в случае с подбрасыванием монетки, то я предлагаю обратить внимание на то, что нам известно, что такое монетка и как она устроена, что нам уже известна вероятность выпадения "орла" и "решки". В данном же случае нам пока ничего не известно о возможностях украинцев и сепаратистов, об их желаниях сбивать самолеты, о том с какой частотой они это делают. Пока что есть только тот факт, что сепаратисты сбили самолет над Изварино.
А если бы нам было известно, что украинцы и сепаратисты сбивали самолеты с равной частотой, то вероятность так и осталась бы равной 50%, в полном соответствии с Rule of succession. Но пока что нам о частоте таких событий известно очень мало - был только один аналогичный случай.

2.c Далее начнем потихоньку вставлять конкретику.

С учетом того факта (e0), что самолет был сбит над территорией сепаратистов, что сепаратисты регулярно сбивали прочие самолеты и вертолеты (но при других обстоятельствах: из другого оружия, на другой высоте), что у украинцев вообще не было повода использовать ПВО, так как российские самолеты там не летали - я бы сказал, что вероятность P(h)повышается, как минимум, до 80%.

Например, если самолет падает на сторону тех, кто по нему стрелял, в 70% случаев, то один только этот фактор повышает вероятность с 66% до 82%:

P0(h) == P(h|e0) = P(e0|h)*P(h) / (P(e0|h)*P(h) + P(e0|~h)*P(~h)) = 0.7*0.66/(0.7*0.66 + 0.3*0.33) = 82%

Но округлим до 80%.

Это - основанная лишь на самых базовых фактах, b, т.е. без учета более конкретных свидетельств, априорная вероятность P0(h).

На самом деле, 20% вероятности обратного - это не так уж и мало. В жизни очень часто случается так, что в одном случае из пяти дело обстоит совсем не так, как в остальных четырех случаях. Так что проявлять осторожность перед тем, как делать окончательные выводы, вполне уместно - но точно так же уместно не ввязываться в длительные споры, если нет к тому особого интереса. Вероятность в 80% - это та ситуация, когда уместны такие обиходные выражения как "по всей видимости", "скорее всего", "вполне вероятно", но неуместны - "нам известно", "почти наверняка", "за пределами разумных сомнений".

Часто бывает так, что никаких конкретных свидетельств вообще нет. Например, если мы читаем о том, что в Донецке разорвался снаряд, то мы можем сказать, навскидку, что априорная вероятность того, что это был украинский снаряд, равна 95%, и на этом - успокоиться.

==========================================
3. Но в данном случае у нас есть множество самых разнообразных конкретных свидетельств.

3.a Например, известно, что сепаратисты успели расхвастаться в соц. сетях о том, что они сбили Ан-26 (e1).

Сам факт оставления сообщения в соц.сетях примем за данность (то есть, он включен в b), а конкретное содержание сообщения - за свидетельство. Какова вероятность того, что сепаратисты ошибочно приняли пуск украинской ракеты за свой собственный? Я бы сказал, что эта вероятность - не выше 10%. Накинем еще 5% на вероятность фейка, взлома, подставы и т.д. Сепаратисты ни о каких взломах не заявляли, а просто потерли сообщения, но будем щедры. Таким образом, P(e1|~h)=0.15. Какова вероятность того, что, выстрелив по украинскому самолету, они решили бы солгать и сказать, что это украинцы выстрелили по своему самолету? Они так поступают только в том случае, если они уже знают, что крепко подставились. Чтобы не возиться с хронологией сообщений, допустим, что вероятность того, что они бы решили похвастаться, и того, что они бы обвинили укров - равные. Тогда P(e1|h) = 0.5.

Получаем:

P1(h) == P(h|e1) == P(e1|h)*P0(h) / (P(e1|h)*P0(h) + P(e1|~h)*P0(~h)) = 0.5*0.8/ ( 0.5*0.8 + 0.15*0.2 ) = 93%

Соответственно, теперь вероятность того, что они стреляли по самолету - 93%.

Возможно возражение: с какой стати мы включаем факт появления сообщения от сепаратистов в число базовых?

Да, в этом есть небольшой мухлеж. В свое оправдание я скажу, что я считаю, что вероятность появления какого бы то ни было сообщения на сайте сепаратистов о о сбитии какого бы то ни было самолета, не зависящей от того, кто его на самом деле сбил, и близкой к 100%.

3.b Далее, у нас есть фотографии Бука, явно принадлежавшего сепаратистам (e2).

Пусть также в районе присутствовали прочие Буки и прочие штуки, никем не замеченные и не сфотографированные.
Может ли быть такое, что самолет был сбит украинским Буком, но в кадр попал только невинный Бук сепаратистов? Да, может быть. Эта вероятность - всяко ниже 50% (во всяком случае, я не встречал еще аргументов, что наличие снимков Бука, принадлежащего сепаратистам, доказывает, что стреляли не они), но сложно сказать, насколько.

С одной стороны, при прочих равных, вероятность того, что на все эти фотографии и видео сепарского Бука не найдется ни одной фотографии какого-то другого Бука - довольно мала; с другой, если принять конспирологическую теорию (априори - маловероятную), то можно сказать, что замыслившие сбить Боинг коварные укры свой Бук скрывали особо тщательно. Пусть и то и другое, суммарно будет весить 30%.

Тогда,

P2(h) == P(h|e2) = P(e2|h)*P1(h) / (P(e2|h)*P1(h) + P(e|~h)*P1(~h)) = 0.7*0.93/ (0.7*0.93 + 0.3*0.07) = 97%

3.c У нас также есть прослушки СБУ(e3). Какова вероятность того, что эта прослушка - подделанная? Очень малая, на самом деле, на самом деле, но пусть будет 20%. Вероятность того, что СБУ опубликует прослушку, оправдывающую сепаратистов, вообще нулевая, т.е. P(~ee3|h)=0; соответственно, P(ee3|h)=1

P3(h) == P(h|e3) = P(e3|h)*P2(h) / (P(e3|h)*P2(h) + P(e3|~h)*P2(~h)) = 1*0.97 / (1*0.97 + 0.2*0.03) = 99.4%

Т.е., по самой грубой прикидке, вероятность виновности сепаратистов превышает 99%

Изменение вероятности непричастности сепаратистов по ходу расчетов протекало так:

P(~h|e0)=20%
P(~h|e1)=7%
P(~h|e2)=3%
P(~h|e3)=0.6%

Tags: БУК, Боинг
Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 0 comments