Учёные 20 лет клонировали мышей и достигли предела Учёные 20 лет клонировали мышей и достигли предела Урал переходит на умные светофоры Урал переходит на умные светофоры Да здравствует Клоденомика, экономика токенов Да здравствует Клоденомика, экономика токенов Агентный киберпанк Агентный киберпанк

Ключевые термины из мира ИИ

2 мин
Иллюстрация сгенерирована нейросетью DALL·E 3

Коллеги из WSJ подготовили список ключевых терминов, которые стоит знать для погружения в мир искусственного интеллекта. Решили кратко рассказать, какие термины они сочли важными, и дополнить своими.

Context window (Контекстное окно)
Максимальное количество данных или текста, которыми модель может оперировать. Чем оно больше — тем больше информации можно дать модели, например, загрузив на обработку целую книгу или сотни сайтов из Интернета. Пока рекордсменами в размере контекстного окна остаются Google, MiniMax и Alibaba.

Reasoning (Рассуждение)
Способность решать многоступенчатые задачи, требующие логического мышления. Тот самый «процесс мышления», когда модель несколько минут рассматривает с разных сторон вопрос, прежде чем дать ответ. Первая подобная модель появилась у OpenAI, потом DeepSeek из Китая удивили мир своей R1. Сейчас способность модели «рассуждать» стала базовым функционалом и есть у всех крупных игроков рынка. Правда, за улучшенные «когнитивные способности» (по сути просто более длинное контекстное окно и увеличенное на ответ время) приходится платить: такие модели работают медленнее и требуют больше вычислительных ресурсов.

Evals (Оценка безопасности)
Чем более продвинутым становится ИИ, тем важнее убедиться в его безопасности. Именно для этого существуют evals — автоматизированные тесты, проверяющие способности ИИ к потенциально опасным действиям и уязвимости к джейлбрейку.

Jailbreak (Джейлбрейк)
Процесс обхода ограничений в системах искусственного интеллекта. С его помощью пользователи получают доступ к функциям или данным, которые обычно недоступны (например, по изготовлению взрывчатых веществ в домашних условиях и прочим незаконным вещам).

Synthetic Data (Синтетические данные)
Современные модели ИИ уже освоили практически все доступные данные в интернете. Что делать дальше? Создавать новые данные с помощью самого ИИ. Такие данные и называются синтетическими. В процессе одна модель «учитель» генерирует информацию для обучения другой модели. Сейчас это чуть ли не единственный способ получить новые данные для обучения.

Vibes (Интуитивная оценка)
Как ни странно, но в оценке качества ИИ большую роль играет интуиция. Разработчики называют это “vibe check” — проверкой того, насколько «правильно» ощущаются ответы модели, на контрасте с более техническими бенчмарками.

Benchmark (бенчмарк)
Набор тестов для оценки качества ответов модели ИИ и сравнения с конкурентами. Могут специализироваться на отдельных задачах, например, связанных с кодом или математикой. Именно поэтому высокие значения в бенчмарке ещё не говорят о качестве модели — она просто могла быть создана специально под него или для специфичного набора задач.

// Илья Власов