Ключевые термины из мира ИИ

Коллеги из WSJ подготовили список ключевых терминов, которые стоит знать для погружения в мир искусственного интеллекта. Решили кратко рассказать, какие термины они сочли важными, и дополнить своими.

Context window (Контекстное окно)
Максимальное количество данных или текста, которыми модель может оперировать. Чем оно больше — тем больше информации можно дать модели, например, загрузив на обработку целую книгу или сотни сайтов из Интернета. Пока рекордсменами в размере контекстного окна остаются Google, MiniMax и Alibaba.

Reasoning (Рассуждение)
Способность решать многоступенчатые задачи, требующие логического мышления. Тот самый «процесс мышления», когда модель несколько минут рассматривает с разных сторон вопрос, прежде чем дать ответ. Первая подобная модель появилась у OpenAI, потом DeepSeek из Китая удивили мир своей R1. Сейчас способность модели «рассуждать» стала базовым функционалом и есть у всех крупных игроков рынка. Правда, за улучшенные «когнитивные способности» (по сути просто более длинное контекстное окно и увеличенное на ответ время) приходится платить: такие модели работают медленнее и требуют больше вычислительных ресурсов.

Evals (Оценка безопасности)
Чем более продвинутым становится ИИ, тем важнее убедиться в его безопасности. Именно для этого существуют evals — автоматизированные тесты, проверяющие способности ИИ к потенциально опасным действиям и уязвимости к джейлбрейку.

Jailbreak (Джейлбрейк)
Процесс обхода ограничений в системах искусственного интеллекта. С его помощью пользователи получают доступ к функциям или данным, которые обычно недоступны (например, по изготовлению взрывчатых веществ в домашних условиях и прочим незаконным вещам).

Synthetic Data (Синтетические данные)
Современные модели ИИ уже освоили практически все доступные данные в интернете. Что делать дальше? Создавать новые данные с помощью самого ИИ. Такие данные и называются синтетическими. В процессе одна модель «учитель» генерирует информацию для обучения другой модели. Сейчас это чуть ли не единственный способ получить новые данные для обучения.

Vibes (Интуитивная оценка)
Как ни странно, но в оценке качества ИИ большую роль играет интуиция. Разработчики называют это “vibe check” — проверкой того, насколько «правильно» ощущаются ответы модели, на контрасте с более техническими бенчмарками.

Benchmark (бенчмарк)
Набор тестов для оценки качества ответов модели ИИ и сравнения с конкурентами. Могут специализироваться на отдельных задачах, например, связанных с кодом или математикой. Именно поэтому высокие значения в бенчмарке ещё не говорят о качестве модели — она просто могла быть создана специально под него или для специфичного набора задач.

//Илья Власов