Ведущий научный сотрудник ИПП Дмитрий Скугаревский дал развернутый комментарий онлайн-изданию «Наша Версия» общероссийского сайта независимых журналистских расследований «Версия» относительно исследования Института проблем правоприменения при Европейском университете в Санкт-Петербурге (ЕУСПб), в результате которого ученые натренировали нейронную сеть, которая затем смогла разделить 4,4 миллиона сообщений на 40 содержательных категорий и показать действительный уровень преступности в России.
В пять раз меньше преступлений, чем в Германии.
О чем говорят 4 млн обращений в российскую полицию.
Сотрудники Института проблем правоприменения при Европейском университете (ЕУ) в Санкт-Петербурге завершили необычное исследование. Предметом их интереса стали обращения наших сограждан в полицию, поводы и причины, толкающие людей на это. По словам ученых, каждое пятое сообщение — о бытовом конфликте, а каждое 25-е — о чьей-нибудь смерти (естественной или насильственной). При этом зарегистрированных преступлений в России в пять раз меньше, чем в более благополучной Германии! Что может говорить лишь об одном — полиция плохо представляет реальный уровень преступности в стране.
О том, почему так происходит, как это исправить и о других выводах «Версии» рассказал руководитель исследования, ведущий научный сотрудник Института проблем правоприменения ЕУ Дмитрий Скугаревский.
— Дмитрий, как возникла идея такого исследования? Или продолжением чего оно стало?
— Европейский университет в Санкт-Петербурге при поддержке Российского научного фонда уже давно изучает то, как люди мобилизуют право. Этот термин был введен в обиход видным американским социологом Дональдом Блэком. Мобилизуя право, люди сообщают о своей жизненной ситуации или конфликте властям и задействуют разные способы решения споров. Таким образом, всякое ваше взаимодействие с государством и являет собой мобилизацию права.
— Понятно, что и звонки в полицию — одно из проявлений этого «феномена»?
— Совершенно верно. Одними из самых частых, но, в то же время, и редко наблюдаемых случаев мобилизации права являются звонки в полицию. А благодаря уникальным данным, собранным Генпрокуратурой, исследователи сегодня имеют возможность изучать миллионы анонимизированных взаимодействий граждан с полицией и искать в них разного рода закономерности и странности.
— Насколько ваше исследование уникально? Для России? И для остального мира?
— Во всем мире остро строит проблема нерегистрируемой преступности. Так называемая темная материя преступности (dark figure of crime) или преступления, о которых неизвестно полиции, существует в любой стране. А изучение звонков в полицию — это один из действенных способов «подсветить» эту область. До последнего времени криминологи и социологи во всем мире работали методом наблюдения: ездили с патрульными экипажами, мониторили работу полицейских участков. Но данные именно об обращениях людей в полицию позволяют получить гораздо больше информации, поскольку эти материалы собирает сама полиция. Насколько мне известно, наше исследование является беспрецедентным в мире по масштабу. Ведь обработано было более 4,4 млн сообщений.
— Известно, что такое огромное число обращений обрабатывалось не столько живыми исследователями, сколько нейронной сетью. Расскажите об этом подробнее.
— Мы создали особую «архитектуру», которая смогла понять смысл слов из их контекста. К примеру, если слово «труп» в сообщении употреблялось со словом «бвпнс» (без внешних признаков насильственной смерти), это, скорее всего, означает, что сообщение касалось естественной смерти. А нейронная сеть, разработанная исследователями из Facebook, без участия человека выявила миллионы таких закономерностей, а потом сжала их в двухсотмерное пространство смыслов! Далее уже в этом пространстве мы искали группы похожих по смыслу сообщений. Общий объем проанализированной информации превысил 450 таких текстов, как роман Льва Толстого «Война и мир». Человеку, чтобы только прочитать все это, потребовалось бы больше года непрерывной работы.
— Но все же «минимальное участие» живых ученых было? Что было оставлено для homo sapiens?
— Когда машина выделила кластеры в пространстве смыслов, наши эксперты стали читать случайные сообщения из этих кластеров. Машина в целом показала хорошие результаты. Так, сообщение, состоящее лишь из фразы «белая горячка», успешно соседствовало с иными сообщениями о людях, которым требовалась психическая помощь. Однако иногда машина слишком сильно дробила кластеры по смыслу. К примеру, изъятия разных видов оружия и боеприпасов попали в разные кластеры... Поэтому экспертам пришлось объединять похожие темы. В итоге из 178 смысловых групп сообщений, выделенных машиной, удалось составить 40 более общих содержательных кластеров.
— Перечислите основные.
— 22,52% всех сообщений в полицию касаются разного рода бытовых происшествий. На втором месте по популярности потери и кражи — 10,3%. С большим отрывом на третьем — ДТП с 4,41%. Сообщали про смерть в 4,3% случаев. Про экономические преступления — 4,27%. Про шум (чаще всего, от соседей) — 3,32%. Повреждение имущества (как правило, автомобилей) — 2,58%. Пожар — 1,63%. Наркотики — 1,54%. Угрозы — 1,12%. Работа сигнализации — 0,97%. Неправильная парковка — 0,96%. Пьяное вождение — 0,93%. Списания с банковских карт — 0,82%. Происшествия с животными — 0,42%. Угоны — 0,19%. Суициды — 0,12%. И так далее. В том числе, 31% попал в категорию «иное». Как видите, это очень внушительный список, который можно продолжать довольно долго.
— Эта статистика касается всей России или какого-то определенного города, например, Петербурга, где находится Европейский университет? И за какой период?
— Изучаемый массив затрагивает период с 2015 года по первую половину 2017-го. И базируется на пилотной зоне внедрения государственной автоматизированной системы «Правовая статистика», которую администрирует Генпрокуратура России. Сначала в этой работе участвовали лишь несколько регионов нашей страны, но сейчас — уже около 30-ти. Петербурга среди них нет.
— Какой интерес был у прокуратуры давать вам эти материалы?
— Они делились ими для исследовательских целей. Сейчас это ведомство претерпевает серьезную цифровую трансформацию. А эти цели, безусловно, требуют новых подходов и к анализу деятельности правоохранительных органов. Результаты нашей поисковой работы в итоге могут быть использованы как обществом, так и самими правоохранительными органами. Так можно лучше узнать, в том числе, и «темную материю преступности», о которой полиции вроде бы сообщается, но которую она не регистрирует по разным соображениям.
— Наконец, самое интересное — какие же выводы вы сделали, обработав огромный массив сообщений в полицию?
— Начиная исследование, мы уже знали, что количество зарегистрированных преступлений на душу населения в России в пять раз ниже, чем, к примеру, в Германии. В таких условиях крайне важно поднять завесу латентной, то есть скрытой преступности. Всем отечественным специалистам известно, что число убийств в нашей стране занижено. В международных исследованиях под убийством понимается «осознанное причинение физического вреда человеку, повлекшее его смерть», тогда как во многих российских статистических сборниках и отчетах руководства приводятся числа только по «умышленным причинениям смерти другому человеку» (ст. 105 УК РФ). Другие же смерти (умышленное причинение тяжкого вреда, повлекшее по неосторожности смерть, детоубийство, изнасилования и насильственные действия сексуального характера, повлекшие смерть) в эту статистику уже не попадут. Это игры со статистикой.
Но есть и более сложные случаи: что делать, если человек пропал без вести, но тело не обнаружено? Мы не ожидали, что найдем так много (почти 34 тыс.) сообщений о пропавших людях. А, как известно, это один из маркеров убийств. Разумеется, человек может и найтись, а сообщение – оказаться ложным. Но даже с поправкой на такое развитие событий, стоит задуматься о крайне большом числе пропавших без вести.
Еще одна находка, которую стоит упомянуть, — распространенность бытовых конфликтов. Примерно каждое 30-е сообщение было о шумящих соседях или людях на улице. Такими проблемами обычно занимаются участковые. Одно из наших исследований показало, что до половины бюджета и времени участковых может уходить на работу с бумагами. Когда в местном сообществе требуется участие полицейских для урегулирования бытовых конфликтов до их эскалации, разумно освободить участковых от вала отчетности, которая мешает им заниматься настоящей полицейской работой.
Также мы выявили много малых сюжетов. Например, среди киберпреступлений в полицию обращаются, в основном, по поводу публикации порочащих сведений в социальных сетях. А из мест заключения бывает много сообщений о травмах. Каждый из сюжетов, конечно, требует отдельного исследования. А, разделив сообщения в полицию на смысловые кластеры, мы можем сконцентрироваться на этих сюжетах и понять, что стоит изучать в первую очередь.
— В итоге, как бы Вы могли бы описать портрет среднестатистического гражданина, который идет с жалобой в полицию?
— Поскольку данные анонимизированы, мы работаем только с сутью сообщения, то есть с тем, о чем оно, не зная личности заявителя. Иными словами, мы исследуем, не кто обращается в полицию, а почему. Перефразируя Белинского, могу сказать, что сообщения о происшествиях являются энциклопедией русской жизни. Прочитав тысячи таких материалов, у меня и коллег сложилось представление о репертуаре жизненных ситуаций, с которыми сталкивается человек: не открывается дверь в квартиру, шумят соседи, неправильно припаркована машина, с карточки списались деньги, лежит подозрительная сумка… Среди десятков тысяч таких типовых ситуаций, являющихся лишь происшествиями, встречаются и настоящие преступления. Часто их хорошо видно. Это заставляет задуматься о важности сервисной деятельности правоохранительных органов, ведь полиция должна не только расследовать преступления, но и заниматься их профилактикой и помощью людям.
Источник: «Наша версия».