Институт проблем правоприменения выпустил ролик, показывающий первые результаты работы по применению методов машинного обучения для анализа больших массивов правоохранительных данных в текстовой форме. В рамках гранта РНФ «Исследование социального контроля и мобилизации права с использованием больших данных», № 17-18-01618 проведена подготовка массива 4,5 миллиона сообщений граждан в полицию и их классификация с использованием самообучаемой нейросети.
В каждой дежурной части полиции существует книга учета сообщений о происшествиях (КУСП), в которую заносятся обращения людей, рапорты и сообщения из больниц, ФСИН и других государственных учреждений. С 2013 г. Генеральная прокуратура России внедрила государственную автоматизированную систему «Правовая статистика» (ГАС ПС). Однако чтобы только прочитать эти данные (объемом больше, чем 450 копий «Войны и мира») потребовался бы год работы человека без перерыва на еду и сон, не говоря уже о трудозатратах на анализ и классификацию. С помощью машинного обучения стало возможно решить эту задачу с минимальным участием человека. Нейросеть способна обучаться, чтобы распознавать закономерности в данных и обобщать их. В результате работы нейросети сообщения в полицию удалось разделить на 40 содержательных категорий («бытовые происшествия», «потери и кражи», «ДТП», «суициды», «пожары» и т.д.). Благодаря этому исследованию мы теперь знаем структуру проблем, с которыми люди обращаются в полицию и результаты работы полиции по этим обращениям. В дальнейшем это поможет смоделировать реакцию правоохранительных органов на разные типы обращений, обнаружить шаблоны и аномалии в этой реакции и оптимизировать ее.
Видеролик «Искусственный интеллект в помощь полицейскому» доступен по ссылке.