«ВКонтакте» протестирует фильтр враждебных высказываний для комментариев в сообществах соцсети. Об этом «Бумаге» сообщил источник, близкий к компании.
В ответ на запрос «Бумаги» во «ВКонтакте» подтвердили, что протестируют нейросеть для распознавания враждебных высказываний на небольшой выборке сообществ, которые сами выразили желание принять участие в эксперименте. Администраторы этих сообществ смогут включать и выключать фильтр в настройках, «он добавится к уже существующим и знакомым пользователям фильтрам нецензурных выражений и по ключевым словам», — сообщили в соцсети.
— Фильтр заточен на угрозы: пожелания смерти и обещания причинить вред здоровью. В настройках сообщества администратор сможет увидеть удаленные фильтрами комментарии, восстановить их или отправить опубликовавшего их пользователя в черный список.
Какие именно сообщества участвуют в тестировании, не уточняется. Решение о доработке и дальнейшем применении фильтра в соцсети примут на основе результатов эксперимента.
В ноябре 2019 года «ВКонтакте» на один день запустила функцию для борьбы с оскорблениями в комментариях. При попытке написать агрессивный комментарий пользователь получал совет отказаться от обидных слов. Есть ли в тексте признаки оскорблений, определяли алгоритмы соцсети. Эксперимент был призван предотвратить травлю по национальному признаку и издевательства над подростками.
В августе «ВКонтакте» также сообщила о тестировании нейросети для борьбы с языком вражды. Нейросеть должна была ускорить время обработки жалоб и помогать быстрее находить материалы с оскорблениями и угрозами, публикации, которые содержат проявления ксенофобии, расизма, гомофобии, сексизм, а также оскорбления на почве религиозной принадлежности, возраста, внешности или наличия заболеваний.