Суперкомпьютер помогает находить в интернете жертв домашнего насилия

ТГУ и ВятГУ в составе Университетского консорциума исследователей больших данных реализуют проект по поиску жертв супружеского насилия через интернет. Исследование онлайн-обращений и комментариев к ним стало дополнительным источником информации о специфике супружеского насилия, его видах и формах, а также масштабах распространения.

Центр прикладного анализа больших данных ТГУ помог коллегам из Кировской области с масштабным сбором данных из различных сегментов интернета, их обработкой и извлечением конкретной информации, которая интересует исследователей. Сбор и обработка данных проекта осуществляется в рамках Центра коллективного пользования платформой PolyAnalyst на базе суперкомпьютера Томского государственного университета Cyberia.

Фото: pixabay.com

Функция извлечения ключевых слов при помощи данной платформы дала возможность ученым не только предложить теоретические механизмы анализа, но и применить открывшиеся возможности на практике. Из всего массива сообщений о насилии были выделены посылы, связанные с просьбами реальных жертв о помощи: «помогите», «спасите», «караул», «поддержите», «прошу совета», «прошу помощи», «больше не могу терпеть».

– Сбор информации шел в соцсетях, в блогах и микроблогах, в интернет-СМИ, на форумах, в YouTube и на тематических порталах на протяжении года. Но надо понимать, что в Сети собирается большое количество информационного «мусора», так что данные нужно фильтровать. Вручную это сделать, по сути, невозможно, поэтому такая работа ведется в автоматическом режиме с использованием программных инструментов наших партнеров. Полученные данные мы передавали в ВятГУ, где велись анализ и описание результатов, – уточняет руководитель направления текстовой аналитики Центра прикладного анализа больших данных ТГУ Евгений Петров.

Согласно полученным данным, основной формой насилия, о которых люди пишут в сообщениях, является физическое насилие (81%), на втором месте – психологическое насилие (15%). Сексуальное и экономическое насилие составляют менее 5% от всех релевантных сообщений. В сознании пользователей насилие ассоциируется, прежде всего, с применением физической силы. При этом женщины чаще являются жертвами насилия (72%), однако мужчины также бывают пострадавшими (28%). Если жертвой выступает мужчина, то чаще речь идет о смешанной форме насилия, когда женщина совершила деяние в ответ на мужское насилие.

Сотрудничество ВятГУ и ТГУ началось в декабре 2019 года во время проведения Томским государственным университетом «Школы прикладного анализа данных» в Москве. После этой школы руководство ВятГУ приняло решение войти в Университетский консорциум исследователей больших данных с проектом, направленным на оценку эффективности деятельности онлайн-сообществ по поддержке жертв супружеского насилия.

– Тематика, связанная с домашним насилием, была определена в самом начале нашего сотрудничества кафедрой социальной работы и молодежной политики ВятГУ. Ученые кафедры понимали, что за время работы накоплен значительный опыт по работе с жертвами супружеского насилия, и применение новых методов, связанных с анализом данных из открытых источников, поможет существенно обогатить применяемые теоретические алгоритмы, – рассказывает руководитель проекта, проректор по развитию на основе анализа данных ВятГУ Екатерина Митягина.

– За год вручную и автоматически при помощи лаборатории интеллектуальных систем ВятГУ было обработано 133 000 сообщений и создан первый русскоязычный корпус о супружеском насилии. При поддержке ТГУ и компании «Мегапьютер Интеллижденс» произведена обработка данных, определены основные формы и виды насилия, типы абьюзеров, – добавляет Екатерина Митягина. Сейчас сайт уже запущен, а умный помощник «Лада» находится в процессе обучения. В планах – автоматический поиск жертв насилия в социальных сетях и предложение им помощи.