GLM-5.1: новая открытая SOTA LLM от Z.ai — 94,6 % от Claude Opus 4.6

◷ 6 мин чтения 28.03.2026

GLM Cloude Агенты

Следующий шаг

Открой бота или продолжай маршрут внутри раздела.

$ cd раздел/ $ open @mmorecil_bot

Статья -> план в ИИ

Отправь ссылку на эту статью в любой ИИ и получи план внедрения под свой проект.

Как использовать

Скопируй этот промпт и отправь в чат с ИИ.
Прикрепи проект или открой папку репозитория в ИИ-инструменте.
Попроси изменения по файлам, риски и короткий чеклист проверки.

27 марта 2026 года Z.ai (ранее Zhipu AI) выпустила GLM-5.1 — самую свежую итерацию своей флагманской открытой модели. Она уже доступна всем подписчикам GLM Coding Plan и демонстрирует результаты, которые ставят её в один ряд с топовыми closed-source моделями. Полные open-weights под MIT-лицензией обещаны в ближайшие дни (полный релиз запланирован примерно на 6 апреля).

Это не просто «ещё одна версия». GLM-5.1 — логичное продолжение GLM-5 (февраль 2026), которая уже перевернула рынок открытого AI, перейдя от «vibe coding» к настоящему agentic engineering. Ниже — максимально полный и только проверенный разбор на основе официальных источников Z.ai, Hugging Face, бенчмарков и анонсов.

1. Что было до GLM-5.1: GLM-5

Дата релиза: 11–12 февраля 2026
Архитектура: Mixture-of-Experts (MoE)
Параметры: 744 млрд всего / ~40 млрд активных на токен
Обучение: 28,5 трлн токенов (рост с 23 трлн у GLM-4.5)
Контекст: до 200K (в отдельных тестах до 202 752 токена с инструментами)
Лицензия: MIT (полностью открытая)
Модели на HF: zai-org/GLM-5 и zai-org/GLM-5-FP8 (квантованная)
Дополнительно: DeepSeek Sparse Attention (DSA) + новая RL-инфраструктура slime

GLM-5 стала первой моделью, которую Z.ai явно позиционировала как переход «From Vibe Coding to Agentic Engineering». Она обучена полностью на китайских чипах Huawei Ascend и оптимизирована для долгосрочных agentic-задач, а не только для генерации кода.

Ключевые бенчмарки GLM-5 (Thinking-режим)

Бенчмарк	GLM-5	GLM-4.7	DeepSeek-V3.2	Kimi K2.5	Claude Opus 4.5
Humanity’s Last Exam	30.5	24.8	25.1	31.5	28.4
HLE w/ Tools	50.4	42.8	40.8	51.8	43.4
SWE-bench Verified	77.8	73.8	73.1	76.8	80.9
SWE-bench Multilingual	73.3	66.7	70.2	73.0	77.5
Terminal-Bench 2.0 (Claude Code)	56.2 / 61.1	32.8	46.4	—	57.9
Vending Bench 2 (фин. баланс)	$4432	$2377	$1034	$1198	$4967
BrowseComp w/ Context Mgmt	75.9	67.5	67.6	74.9	67.8

GLM-5 уже обгоняла почти все open-source модели и приближалась к Claude Opus 4.5 и GPT-5.2 в реальных agentic-сценариях.

2. GLM-5.1 — что изменилось за полтора месяца

Дата анонса: 27 марта 2026
Доступ: сразу для всех пользователей GLM Coding Plan (Lite / Pro / Max)
Open-source статус: подтверждён. Глобальный глава Z.ai Ли Цзюань (Li Zixuan) 20 марта написал: «Don’t panic. GLM-5.1 will be open source». Полные weights под MIT ожидаются в начале апреля.

Главный результат (независимый тест в Claude Code):

GLM-5.1 — 45.3 балла
Claude Opus 4.6 — 47.9 балла
Разница: всего −2,6 балла (94,6 % от Opus)
Улучшение относительно GLM-5 в том же тесте: +28 % (с 35.4 до 45.3)

В реальных сценариях разница «почти незаметна», особенно с учётом того, что тест проводился в «родной» среде Claude. Модель получила улучшения в:

сложном многошаговом reasoning,
frontend/backend-разработке,
long-horizon agentic-задачах,
стабильности работы с инструментами.

Технические характеристики GLM-5.1 пока публично не раскрыты полностью (Z.ai традиционно даёт полные цифры вместе с open-weights). По оценкам — это эволюция 744B MoE-архитектуры с ещё большим объёмом данных и доработками пост-тренинга.

3. Как пользоваться GLM-5.1 прямо сейчас

Вариант 1. Через GLM Coding Plan (самый простой)
Цены (промо на первый месяц):

Lite — $3 (обычно $10)
Pro — $15 (обычно $30)

Включает:

GLM-5.1 (SOTA coding)
GLM-5, GLM-5-Turbo, GLM-4.7 и старые модели
55+ токенов/сек
Бесплатные MCP-инструменты (Vision, Web Search, Web Reader, Zread)
Совместимость с Claude Code, Cursor, Cline, Kilo Code, OpenCode, Roo Code, Droid и др.

Настройка в Claude Code (пример):

json

{
  "model": "GLM-5.1",
  "apiKey": "ваш_ключ_из_z.ai",
  "baseUrl": "https://api.z.ai/v1"
}

Вариант 2. GLM-5 (уже открытая)
Скачать прямо сейчас:

Hugging Face: https://huggingface.co/zai-org/GLM-5
ModelScope: https://modelscope.cn/models/ZhipuAI/GLM-5

Поддержка vLLM, SGLang, xLLM, KTransformers. Работает на Huawei Ascend, Moore Threads и других китайских чипах.

Пример запуска vLLM (FP8):

bash

vllm serve zai-org/GLM-5-FP8 \
  --tensor-parallel-size 8 \
  --gpu-memory-utilization 0.85 \
  --speculative-config.method mtp

4. Почему это важно

Переход от «красивого кода» к настоящим агентам. GLM-5/5.1 специально заточены под long-horizon задачи: от генерации документации и .docx/.pdf/.xlsx до полноценных multi-tool workflow.
Открытость. MIT-лицензия + поддержка не-NVIDIA-чипов = вы не привязаны к одному вендору.
Цена/качество. Подписка от $3 даёт 94,6 % от Opus в coding — это один из самых выгодных вариантов 2026 года.
Многоязычность и кириллица. Как и вся линейка GLM, модель отлично работает с русским (в отличие от многих западных open-source моделей).

5. Сравнение с главными конкурентами (март 2026)

Модель	Open-source	Coding score (Claude Code)	Контекст	Цена (примерно)	Agentic-сильные стороны
GLM-5.1	Да (скоро)	45.3	~200K	$3–30/мес	Лучший open-source agent
Claude Opus 4.6	Нет	47.9	200K+	$100–200/мес	Эталон, но закрытый
DeepSeek-V3.2	Да	—	200K	Бесплатно/дешево	Сильный reasoning
Kimi K2.5	Да	—	200K+	Дешёво	Хорош в браузинге
GPT-5.2	Нет	—	200K+	Дорого	Универсальный, но закрытый

Итог

GLM-5.1 — это не просто апдейт. Это модель, которая делает открытый AI реально конкурентным closed-source флагманам в самой сложной области — agentic engineering и профессиональной разработке. Через пару недель мы получим полные weights, и тогда любой разработчик сможет запустить её локально или дообучить под свои задачи.

Ссылки для начала:

GLM Coding Plan → https://z.ai/subscribe
GLM-5 (уже открытая) → https://huggingface.co/zai-org/GLM-5
Официальный блог GLM-5 → https://z.ai/blog/glm-5

GLM-5.1: новая открытая SOTA LLM от Z.ai — 94,6 % от Claude Opus 4.6

1. Что было до GLM-5.1: GLM-5

2. GLM-5.1 — что изменилось за полтора месяца

3. Как пользоваться GLM-5.1 прямо сейчас

4. Почему это важно

5. Сравнение с главными конкурентами (март 2026)

Итог

Codex Project Autopilot: плагин, который заставляет Codex думать как настоящая команда

Claude Mythos: утечка раскрыла самую мощную модель ИИ от Anthropic — «step change» с серьёзными рисками для кибербезопасности

GLM-5.1: новая открытая SOTA LLM от Z.ai — 94,6 % от Claude Opus 4.6

## 1. Что было до GLM-5.1: GLM-5

## 2. GLM-5.1 — что изменилось за полтора месяца

## 3. Как пользоваться GLM-5.1 прямо сейчас

## 4. Почему это важно

## 5. Сравнение с главными конкурентами (март 2026)

## Итог

Codex Project Autopilot: плагин, который заставляет Codex думать как настоящая команда

Claude Mythos: утечка раскрыла самую мощную модель ИИ от Anthropic — «step change» с серьёзными рисками для кибербезопасности

1. Что было до GLM-5.1: GLM-5

2. GLM-5.1 — что изменилось за полтора месяца

3. Как пользоваться GLM-5.1 прямо сейчас

4. Почему это важно

5. Сравнение с главными конкурентами (март 2026)

Итог