ИИ научился деанонимизировать пользователей по породе собаки

Иллюстрация сгенерирована нейросетью ChatGPT

Исследователи из ETH Zurich и Anthropic взяли нейросеть и попросили её найти владельцев анонимных аккаунтов с Hacker News и Reddit. ИИ прочитал комментарии пользователей за несколько лет, в которых люди сами рассказали детали: в каком городе живут, кем работают, чем болеют и чем увлекаются. После чего нашёл их аккаунты на LinkedIn.

ИИ анализирует сообщения человека и находит в них факты. Аллергия, порода собаки, специфический вопрос по коду — модель собирает всё это в единый список признаков. Затем этот список прогоняется по базам профилей, и ИИ сопоставляет детали, чтобы найти нужного человека. То же мы видели и в кейсе с умными очками, которые в реальном времени идентифицировали людей на улице. Не запутаться и оптимизировать процесс нейросети помогает заложенный механизм отказа — если фактов для стопроцентного вывода не хватает, она просто останавливает поиск и идёт дальше.

В тесте нейросети показали 338 анонимных профилей с Hacker News. Она точно определила 226 человек, ошиблась 25 раз, а в 86 случаях не смогла ответить. Итоговая точность, по мнению авторов, составила 90%. Для дата-брокеров или корпораций такой сценарий подходит — получить двести подтвержденных профилей и не возиться с остальными.

То же самое вполне мог сделать и человек, подобным как раз и занимаются OSINT аналитики. Правда, на проведение такой работы им понадобится гораздо больше времени и денег, нейросеть же работала в фоне и потратила только 2000 долларов (меньше 4 долларов на профиль). Авторы заявляют, что процесс можно дешёво масштабировать на базу из десятков миллионов пользователей.