Основне завдання її розробки – навчити ШІ бачити там, де людина не помічає нічого підозрілого.
Вікіпедію часто використовують як джерело даних для тренування великих мовних моделей. Тому в разі потрапляння туди викривленої інформації вона й надалі може просочуватися навіть у чат-боти, створені на основі цих моделей. Такий підхід уже має назву LLM grooming, і російська пропаганда активно використовує цей інструмент проти України.
Система, яку створила Вікторія, не шукає фейки самостійно. Вона працює за іншим принципом: на вхід подається текстова ревізія (revision), тобто конкретна зміна, яку хтось хоче внести до статті у Вікіпедії; модель аналізує цю зміну як фрагмент тексту й видає оціночний бал (score) від 0 до 1 – наскільки ймовірно, що ця правка є деструктивною.
Студентка навчала свою модель на основі великих даних: усіх правках, поданих до української та російської Вікіпедії за 2022–2023 роки. До розгляду бралися як прийняті модераторами правки, так і відхилені зміни, які найчастіше містили маніпуляції. Та оскільки відхилених правок було набагато менше, дослідниця стикнулася з проблемою нерівномірності даних. Як вона її вирішила – читайте в нашому матеріалі: https://texty.org.ua/fragments/115585/
