Что такое LLM и как они работают

Понятное объяснение принципов работы больших языковых моделей без лишней техники.

Представьте молодого юриста, который первые три года карьеры провёл, читая тысячи договоров, судебных решений и правовых заключений. Постепенно он научился угадывать, какая формулировка обычно следует после «сторона вправе», какой абзац типичен для раздела об ответственности, и как звучат аргументы в типичной апелляционной жалобе. Именно так — только в масштабах миллиардов текстов и за считанные недели обучения — работает большая языковая модель (Large Language Model, LLM).

Что такое токены и почему это важно

LLM не читает текст так, как читаете его вы. Она делит его на токены — фрагменты, которые примерно соответствуют частям слов. Слово «договор» — это один токен, «недействительность» может быть разбита на два-три. Средний токен на русском языке — около 3–4 символов.

Почему это важно для юриста? Потому что у каждой модели есть лимит контекстного окна — максимальное количество токенов, которые она «видит» одновременно. У флагманских моделей OpenAI, Anthropic и Google в отдельных режимах доступен контекст примерно до 1 000 000 токенов; у российских моделей и массовых тарифов лимит обычно ниже. Это примерно соответствует сотням страниц текста. Если договорный пакет или материалы дела больше лимита, модель не сможет охватить всё сразу.

Как модель «предсказывает» текст

В основе работы любой LLM лежит один принцип: предсказание следующего токена. Модель не понимает право в юридическом смысле. Она не хранит внутри себя проверенную правовую позицию по конкретной норме и не определяет сама, применима ли эта норма к вашей ситуации. Она знает, что в текстах, похожих на ваш запрос, после определённых слов обычно следуют определённые другие слова.

Это как автодополнение на телефоне, но обученное на всём интернете, научных статьях и книгах. Результат впечатляет — но механизм остаётся статистическим, а не логическим.

Четыре ведущие модели, которые используют юристы

GPT-5.5 (OpenAI) — актуальная флагманская модель OpenAI для профессиональной работы: анализ документов, исследование, генерация текстов, работа с таблицами и многошаговые задачи. В ChatGPT также используются режимы GPT-5.5 Instant, Thinking и Pro.

Claude Opus 4.7 / Claude Sonnet 4.6 (Anthropic) — модели, особенно сильные в юридическом анализе, точности формулировок и работе с длинными документами. Конкретные лимиты зависят от плана, режима и способа доступа, поэтому перед внедрением их нужно проверять в интерфейсе Claude или документации API.

GigaChat (Сбер) — российская модель, хорошо работающая на русском языке и лучше других ориентирующаяся в российских правовых реалиях. Это важное преимущество для локальных задач и конфиденциальных материалов, хотя в сложных аналитических задачах она обычно уступает западным аналогам.

Gemini 3.1 Pro / Gemini 3.5 Flash (Google) — сильная мультимодальная линейка с интеграцией в продукты Google. Особенно удобна там, где юридическая работа встроена в Google Docs, Drive и корпоративные процессы.

Почему LLM не «знает» право

Это принципиально важный момент для каждого юриста, начинающего работать с ИИ. LLM обучена на срезе текстов определённого периода. У неё нет доступа к актуальным базам данных («КонсультантПлюс», «Гарант»), она не знает о поправках, принятых после даты обучения, и не имеет доступа к закрытым судебным решениям.

Кроме того, модели склонны к галлюцинациям — уверенному воспроизведению несуществующих фактов. Она может назвать реквизиты несуществующего постановления Пленума ВС РФ или сослаться на статью, которой нет в кодексе. Причём сделает это уверенно, без оговорок.

Правило профессионала: любую ссылку на нормативный акт, судебное решение или доктрину, полученную от LLM, необходимо проверять в первичном источнике.

Что означает «обучение» модели

LLM проходит два этапа: предобучение (pre-training) на огромных массивах текста и дообучение (fine-tuning) с участием человека — когда модель учат быть полезной, безопасной и следовать инструкциям. Именно поэтому современные модели не просто продолжают текст, а отвечают на вопросы, следуют ролям и форматируют ответы.

Для юриста это означает, что модель можно «настроить» через промпт: назначить ей роль, задать формат ответа, указать применимое право. Об этом — в следующих уроках.

LLM как инструмент профессионала

Аналогия с молодым юристом справедлива и в другом смысле: даже самый начитанный стажёр не замещает партнёра. Он может быстро найти прецеденты, подготовить черновик, структурировать аргументы — но ответственность за правовое заключение всегда остаётся за квалифицированным специалистом.

LLM — мощный инструмент для ускорения рутинной работы, генерации вариантов, первичного анализа. Но профессиональное суждение, понимание контекста конкретного клиента и ответственность перед законом остаются исключительно за юристом.

Ключевые выводы

LLM предсказывает текст на основе статистических паттернов, а не понимает право в юридическом смысле.
Контекстное окно ограничено — для больших документов нужны специальные подходы.
Основные инструменты для российских юристов: GPT-5.5, Claude, GigaChat, Gemini и DeepSeek — каждый со своими сильными сторонами и ограничениями по данным.
Галлюцинации неизбежны: все ссылки на нормы и решения требуют проверки в первичном источнике.
LLM ускоряет работу, но не заменяет профессиональное суждение и юридическую ответственность.