Ведущий научный сотрудник ИПП Дмитрий Скугаревский дал интервью изданию «Бумага» относительно исследования Института проблем правоприменения, в результате которого ученые натренировали нейронную сеть, которая затем смогла разделить 4,4 миллиона сообщений и показать действительный уровень преступности в России. В интервью рассматриваются вопросы соотношения реального количества преступлений и зарегистрированного, а также процесс мобилизации права в России.
Когда в России чаще всего обращаются в полицию? Рассказывает ученый, проанализировавший больше 4 млн сообщений о происшествиях.
Ученые Европейского университета проанализировали 4,4 млн обращений в правоохранительные органы с помощью нейросетей, чтобы понять, в каких ситуациях люди идут в полицию. Самыми частыми оказались сообщения о бытовых происшествиях: драках, хулиганстве, угрозах, домашнем насилии или трупах на улице.
Руководитель проекта, ведущий научный сотрудник Института проблем правоприменения ЕУ Дмитрий Скугаревский рассказал «Бумаге», как работа полиции влияет на статистику обращений, насколько реальное количество преступлений может отличаться от зафиксированного и как большинство сообщений о травмах заключенных остается без ответа.
— Зачем вы анализировали обращения в правоохранительные органы с помощью нейронных сетей?
— Сразу оговорюсь, что мы анализируем сообщения в правоохранительные органы о происшествиях (горит трава, обнаружен труп, шумит сосед и так далее), а не обращения в прокуратуру с информацией о нарушении законов. Таким образом мы узнаем, почему и с какой целью люди сообщают о своей жизненной ситуации органам правопорядка; зачем и когда люди задействуют правовую машинерию. Этот процесс называется мобилизацией права.
Почему один человек позвонит в полицию после случая домашнего насилия, а другой предпочтет промолчать? Объяснить такое разное поведение могут наблюдаемые и ненаблюдаемые характеристики людей (у кого-то, например, был опыт общения с полицией), а также, что интереснее нам, различия в практиках работы полиции.
Может быть, в первом случае человек уверен, что ему поможет участковый, поскольку его фото висит на доске объявлений у подъезда, а во втором — даже и представления не имеет, кто его участковый и тем более, можно ли ему доверять. Дальше рассмотрим участкового: в первом случае у него есть время отработать каждое обращение, поговорить со всеми участниками конфликта, вникнуть в ситуацию, выступить медиатором, если потребуется. Во втором случае участковый погребен под валом бумаг (в основном постановлений об отказе в возбуждении уголовных дел) и физически не может обработать ваше заявление или сделает это формально, ограничившись отпиской. В итоге о первом случае насилия статистика узнает, а второй останется неизвестным.
Работая с обращениями в полицию, мы спускаемся на уровень реальных жизненных ситуаций людей до того, как правоохранители облекут их в правовую форму и отсеют, по их мнению, неправовое. Благодаря этому мы почти полностью наблюдаем процесс мобилизации права. Конечно, все жизненные ситуации уникальны, но их текстовое представление, фабула, записанная дежурным после звонка, может быть проанализирована количественно. Мы обучили нейронную сеть понимать смысл сообщения из контекста словоупотребления и выделили несколько десятков содержательных кластеров среди 4,4 млн сообщений в полицию (исследовались обращения в правоохранительные органы с 2015 по середину 2017 года — прим. «Бумаги»).
— В каких случаях чаще всего обращаются в полицию?
— Оказалось, что в лидерах среди обращений в полицию сообщения о бытовых происшествиях (22,5 %). Это всевозможные скандалы, стуки в дверь, тела, лежащие на улицах, мелкое хулиганство, драки (в том числе с ранениями), неприятный запах (посмотреть полный график с темами обращений можно по ссылке — прим. «Бумаги»). Перечисленное кажется сборной солянкой совершенно разных жизненных ситуаций. Так же посчитала нейронная сеть. Но мы руководствовались криминологическими основаниями, когда объединяли все эти события под зонтом «бытовых происшествий».
— Совпали ли результаты исследования с гипотезами, которые были у вас изначально?
— Важно понимать, что наше исследование — поисковое. Наука ставит перед собой целью объяснить мир вокруг, первый шаг к объяснению явления — его систематизация. Поэтому мы сначала хотели понять, с какими вопросами люди обращаются в правоохранительные органы России. Ответ, представленный на графике, удалось получить благодаря впечатляющему прогрессу, который человечество сделало в последние десять лет в машинном обучении. Мы применили существующие алгоритмы к новому домену и получили новое знание. Далее мы будем уточнять это знание в рамках проекта Российского научного фонда и перейдем от поисковых исследований к работе в рамке «теория — гипотеза — проверка».
— Насколько полученные вами данные, на ваш взгляд, отражают реальную ситуацию с преступлениями в России?
— По мнению НИИ Академии Генпрокуратуры и коллег, реальный уровень преступности в восемь раз выше зарегистрированного. Но для того, чтобы это узнать, нужен другой инструмент — опрос граждан о виктимном опыте (опыте жертвы — прим. «Бумаги»). Если мы будем исследовать только обращения в полицию, мы упустим тот пласт преступности, о котором полиции не сообщили (например, то же домашнее насилие или мелкие кражи). Поэтому и надо опрашивать людей. Коллеги недавно провели первый в России репрезентативный виктимизационный опрос.
— Сравнивали ли вы данные с другой статистикой — например, раскрываемости преступлений? Известен ли процент обращений, после которых никаких действий не последовало?
— Система сбора данных обращений работает не идеально, иногда не удавалось проследить судьбу сообщений. Однако стоит понимать, что всегда будут обращения, на которые полиция реагировать не будет. Если вы звоните и говорите, что сосед вас облучает лазером, то ваше обращение с высокой вероятностью спишут в архив. Лидером по доле возбужденных дел (66 %) является семантический кластер сообщений об алиментах, что понятно: ФССП (Федеральная служба судебных приставов — прим. «Бумаги») — одно из самых информационно продвинутых ведомств и аккуратно ведет учет.
Однако сильно удивил процент сообщений из мест заключения, по которым неизвестна реакция правоохранительных органов (почти 60 % сообщений). Как правило, это сообщения с медицинскими описаниями травм, которые понесли заключенные. Если вспомнить про общественную волну после обнародования видео пыток в ярославской колонии, можно предположить, что какая-то часть этих сообщений о травмах является следствием пыток.
— Как ученые в России могут изучать криминальную статистику? Насколько тяжело получить доступ к ней?
— Криминология в России находится в глубоком кризисе. Это произошло потому, что криминология в стране стала околоюридической дисциплиной, хотя на самом деле это наука о причинах совершения преступлений. Исследователей, умеющих работать с количественными данными, в стране остро не хватает. Верх мастерства в дисциплине сейчас — взять динамику преступности в каком-то регионе за 10–15 лет и на основании этих данных строить в диссертации глубокие выводы, не подкрепленные ничем, кроме как устаревшей на полвека теорией. Почти никто не задумывается об экспериментальных или панельных исследованиях. Поэтому основная проблема не в данных, которые сложно получить, а в нехватке людей, способных заставить эти данные говорить.
— В чем был интерес прокуратуры участвовать в вашем исследовании?
— Генеральная прокуратура сейчас наделена полномочиями по сбору криминальной статистики в стране и, конечно, заинтересована в их достоверности. Раньше прокурорам приходилось ездить по отделам полиции и листать бумажные журналы с сообщениями о происшествиях в поисках нарушений. Наш же прототип показывает, как такие нарушения можно искать в полуавтоматическом режиме из кабинета. Генпрокуратура заявила о цифровой трансформации — посмотрим, как эти идеи будет применены на практике.
Источник: Бумага.