Во время войн и восстаний часто очень неясно, сколько жертв. Группа анализа данных по правам человека использует статистические методы, которые также используются для подсчета пугливых видов, чтобы резко снизить уровень неопределенности. Это важно для принятия политических решений, а затем и для правосудия – если оно когда-нибудь произойдет.
С марта по июнь 1999 года от девяти до двенадцати тысяч мирных жителей и повстанцев были убиты в ходе террористической кампании сербской армии против албанского населения Косово. По крайней мере, так заключает отчет 2002 года, хотя зарегистрировано всего 4400 смертей. Поэтому доклад, подготовленный Группой анализа данных по правам человека (HRDAG), вызвал скептицизм и критику. Откуда у вас корявые пять тысяч незамеченных смертей?
Вмешиваться или не вмешиваться
Тем не менее, их оценка была подтверждена двумя исследованиями в 2010 году, когда мир был восстановлен и стало возможным обширное исследование местности. HRDAG — это организация со штаб-квартирой в США, основная миссия которой — вести учет насильственных конфликтов. Это часто важно для принятия международным сообществом решения о вмешательстве или нет. И, конечно же, после этого назначить ответственных и по возможности судить их.
HRDAG сама не отправляет наблюдателей в зоны конфликтов, а использует как можно больше существующих источников и совместно формирует общую картину на основе всех данных. Конечно, дело не только в подсчете жертв. См., например, гражданскую войну в Сирии:всевозможные гуманитарные организации и частные лица сообщают об очень хаотичной битве. Об одних и тех же жертвах иногда сообщают несколько источников. О смерти других жертв никто не сообщает.
Совершенно неверная картинка
Меган Прайс, исследователь HRDAG, выступила с докладом об этой работе на третьем Гейдельбергском форуме лауреатов. Это ежегодная встреча в августе лауреатов важнейших премий в области математики и информатики. «Если просто сложить количество жертв, о которых сообщают различные стороны, можно получить совершенно неправильную картину конфликта». Это имеет гораздо большее значение, чем просто бухгалтерский учет. Например, когда средства массовой информации, по наивному подсчету, сообщают, что конфликт разгорается после того, как в драку включилась другая сторона. Или они передают сообщение о том, что новое событие привело к значительному снижению еженедельного числа жертв. Это может оказать серьезное влияние на решение западных стран о вмешательстве. Или поддержать одну из сторон оружием или деньгами.
Существуют математические методы, позволяющие извлечь достаточно надежные оценки из таких беспорядочных данных:так называемая оценка нескольких систем. (МСЭ). В принципе простая, но очень трудоемкая очистка данных включает дедупликацию:обеспечение того, чтобы все сообщения о смерти могли быть отслежены до конкретных людей. Конечно, вам не нужна база данных, в которой несколько раз были убиты люди под разными именами. До января 2014 года HRDAG насчитала 260 000 сообщений о жертвах в сирийском конфликте, но после устранения дублирования их осталось 93 000. Это задокументированные случаи. Что вы можете сказать о реальном количестве жертв?
MSE использует математические методы, которые когда-то были разработаны для оценки того, сколько экземпляров животных, например зайцев, все еще обитает на определенной территории. Основной принцип — захват-повторный захват. Сначала вы ловите как можно наугад около сотни зайцев и ставите им метку. Через несколько недель вы вернетесь и поймаете еще сотню зайцев. Если популяция не слишком велика, во второй раз вы поймаете несколько уже помеченных зайцев. Относительный размер этого перекрытия между двумя выборками дает оценку размера общей популяции (пояснение с помощью формул см. в подписи к иллюстрации выше). Очевидно, что это оценка с запасом неопределенности, размер которого также зависит от A, B и M.
Таким же образом можно подсчитать множество безымянных жертв хаотического насильственного конфликта. Подобные методы ранее использовались для оценки количества ВИЧ-инфицированных в табуированной популяции и даже количества лесбиянок в очень консервативном регионе США. Практика также показала, что MSE работает и дает надежные оценки с разумной долей неопределенности.
Перекрывающиеся образцы
В условиях войны, такой как в Сирии, каждая организация, которая собирает данные о жертвах на месте в течение определенного периода времени, является образцом. Если несколько источников независимо сообщают об одной и той же жертве, это означает совпадение двух или более выборок. Если вы берете более двух выборок из генеральной совокупности, вы можете применить более сложные методы, чтобы также принять во внимание, что некоторые выборки могут не быть независимыми друг от друга. Например, HRDAG смогла составить карту забытых жертв конфликта в Косово и многих других.
Во время своего выступления в Гейдельберге Прайс привела пример этапа гражданской войны в Сирии, когда СМИ сообщили, что интенсивность боевых действий снизилась. Это было основано на простом подсчете зарегистрированных жертв. Анализ HRDAG показал, что дублирование между различными отчетами уменьшилось. Расчет показал, что бой только что разгорелся. Прайс:«Если полагаться на сообщения СМИ, можно сделать совершенно неправильные выводы о подобных конфликтах».
К сожалению, такие анализы, как HRDAG, требуют времени. Время, которое средства массовой информации себе не позволят, Прайс тоже это понимает. Тем не менее, она утверждает, что средствам массовой информации следует больше ограничиваться тем, в чем они хороши:освещением личных историй, раскрытием лица жертв. А всякую статистику и инфографику вооруженных конфликтов, которые собираются за один день в редакциях, читатели и зрители должны воспринимать с большой долей скептицизма.