
По информации редакции, на этапе тестирования от 68% до 84% сгенерированных скриптов были признаны браком. ИИ не просто ошибался, а выдумывал цитаты, путал факты и приписывал редакции мнения, которых та не высказывала. Реакция внутри редакции — смесь паники и гнева: Semafor цитирует внутренние чаты, где сотрудники называют происходящее безумием. Один из редакторов написал: «Нас бы уволили за такие ошибки, если бы их сделал человек». Журналисты опасаются, что галлюцинирующий бот уничтожит доверие к бренду, которое нарабатывалось десятилетиями.
Однако у менеджмента друой взгляд на вещи. В ответ на запрос Semafor пресс-служба газеты заявила, что продукт находится в стадии «бета-тестирования», и именно так, через пробы и ошибки, создаются инновации. Технический директор Винит Хосла в письме сотрудникам и вовсе назвал запуск «ультимативным пересечением» технологий и клиентского опыта. Позиция руководства в том, что нужно делать итерации и развивать продукт уже в процессе, тестируя на живой (в том числе платящей) аудитории.
Описание ситуации выглядит в целом правдоподобно, такое случается при использовании моделей с малым количеством параметров и плохо настроенной работой с данными. Проверить не получилось — у нас в приложении соответствующая бета-функция отсутствует. Автор расследования связывает спешку с кризисом в компании и тем, что Washington Post теряет подписчиков и деньги, пытаясь угнаться за New York Times. В этой гонке руководство, похоже, решило, что наличие модного ИИ-продукта важнее его качества.
