GLM-5.1: новая открытая SOTA LLM от Z.ai — 94,6 % от Claude Opus 4.6

◷ 6 min read 3/28/2026

GLM Cloude Агенты

Next step

Open the bot or continue inside this section.

$ cd section/ $ open @mmorecil_bot

Article -> plan in AI

Paste this article URL into any AI and get an implementation plan for your project.

How to use

Copy this prompt and send it to your AI chat.
Attach your project or open the repository folder in the AI tool.
Ask for file-level changes, risks, and a quick verification checklist.

English translation is being prepared. Russian version is shown.

27 марта 2026 года Z.ai (ранее Zhipu AI) выпустила GLM-5.1 — самую свежую итерацию своей флагманской открытой модели. Она уже доступна всем подписчикам GLM Coding Plan и демонстрирует результаты, которые ставят её в один ряд с топовыми closed-source моделями. Полные open-weights под MIT-лицензией обещаны в ближайшие дни (полный релиз запланирован примерно на 6 апреля).

Это не просто «ещё одна версия». GLM-5.1 — логичное продолжение GLM-5 (февраль 2026), которая уже перевернула рынок открытого AI, перейдя от «vibe coding» к настоящему agentic engineering. Ниже — максимально полный и только проверенный разбор на основе официальных источников Z.ai, Hugging Face, бенчмарков и анонсов.

1. Что было до GLM-5.1: GLM-5

Дата релиза: 11–12 февраля 2026
Архитектура: Mixture-of-Experts (MoE)
Параметры: 744 млрд всего / ~40 млрд активных на токен
Обучение: 28,5 трлн токенов (рост с 23 трлн у GLM-4.5)
Контекст: до 200K (в отдельных тестах до 202 752 токена с инструментами)
Лицензия: MIT (полностью открытая)
Модели на HF: zai-org/GLM-5 и zai-org/GLM-5-FP8 (квантованная)
Дополнительно: DeepSeek Sparse Attention (DSA) + новая RL-инфраструктура slime

GLM-5 стала первой моделью, которую Z.ai явно позиционировала как переход «From Vibe Coding to Agentic Engineering». Она обучена полностью на китайских чипах Huawei Ascend и оптимизирована для долгосрочных agentic-задач, а не только для генерации кода.

Ключевые бенчмарки GLM-5 (Thinking-режим)

Бенчмарк	GLM-5	GLM-4.7	DeepSeek-V3.2	Kimi K2.5	Claude Opus 4.5
Humanity’s Last Exam	30.5	24.8	25.1	31.5	28.4
HLE w/ Tools	50.4	42.8	40.8	51.8	43.4
SWE-bench Verified	77.8	73.8	73.1	76.8	80.9
SWE-bench Multilingual	73.3	66.7	70.2	73.0	77.5
Terminal-Bench 2.0 (Claude Code)	56.2 / 61.1	32.8	46.4	—	57.9
Vending Bench 2 (фин. баланс)	$4432	$2377	$1034	$1198	$4967
BrowseComp w/ Context Mgmt	75.9	67.5	67.6	74.9	67.8

GLM-5 уже обгоняла почти все open-source модели и приближалась к Claude Opus 4.5 и GPT-5.2 в реальных agentic-сценариях.

2. GLM-5.1 — что изменилось за полтора месяца

Дата анонса: 27 марта 2026
Доступ: сразу для всех пользователей GLM Coding Plan (Lite / Pro / Max)
Open-source статус: подтверждён. Глобальный глава Z.ai Ли Цзюань (Li Zixuan) 20 марта написал: «Don’t panic. GLM-5.1 will be open source». Полные weights под MIT ожидаются в начале апреля.

Главный результат (независимый тест в Claude Code):

GLM-5.1 — 45.3 балла
Claude Opus 4.6 — 47.9 балла
Разница: всего −2,6 балла (94,6 % от Opus)
Улучшение относительно GLM-5 в том же тесте: +28 % (с 35.4 до 45.3)

В реальных сценариях разница «почти незаметна», особенно с учётом того, что тест проводился в «родной» среде Claude. Модель получила улучшения в:

сложном многошаговом reasoning,
frontend/backend-разработке,
long-horizon agentic-задачах,
стабильности работы с инструментами.

Технические характеристики GLM-5.1 пока публично не раскрыты полностью (Z.ai традиционно даёт полные цифры вместе с open-weights). По оценкам — это эволюция 744B MoE-архитектуры с ещё большим объёмом данных и доработками пост-тренинга.

3. Как пользоваться GLM-5.1 прямо сейчас

Вариант 1. Через GLM Coding Plan (самый простой)
Цены (промо на первый месяц):

Lite — $3 (обычно $10)
Pro — $15 (обычно $30)

Включает:

GLM-5.1 (SOTA coding)
GLM-5, GLM-5-Turbo, GLM-4.7 и старые модели
55+ токенов/сек
Бесплатные MCP-инструменты (Vision, Web Search, Web Reader, Zread)
Совместимость с Claude Code, Cursor, Cline, Kilo Code, OpenCode, Roo Code, Droid и др.

Настройка в Claude Code (пример):

json

{
  "model": "GLM-5.1",
  "apiKey": "ваш_ключ_из_z.ai",
  "baseUrl": "https://api.z.ai/v1"
}

Вариант 2. GLM-5 (уже открытая)
Скачать прямо сейчас:

Hugging Face: https://huggingface.co/zai-org/GLM-5
ModelScope: https://modelscope.cn/models/ZhipuAI/GLM-5

Поддержка vLLM, SGLang, xLLM, KTransformers. Работает на Huawei Ascend, Moore Threads и других китайских чипах.

Пример запуска vLLM (FP8):

bash

vllm serve zai-org/GLM-5-FP8 \
  --tensor-parallel-size 8 \
  --gpu-memory-utilization 0.85 \
  --speculative-config.method mtp

4. Почему это важно

Переход от «красивого кода» к настоящим агентам. GLM-5/5.1 специально заточены под long-horizon задачи: от генерации документации и .docx/.pdf/.xlsx до полноценных multi-tool workflow.
Открытость. MIT-лицензия + поддержка не-NVIDIA-чипов = вы не привязаны к одному вендору.
Цена/качество. Подписка от $3 даёт 94,6 % от Opus в coding — это один из самых выгодных вариантов 2026 года.
Многоязычность и кириллица. Как и вся линейка GLM, модель отлично работает с русским (в отличие от многих западных open-source моделей).

5. Сравнение с главными конкурентами (март 2026)

Модель	Open-source	Coding score (Claude Code)	Контекст	Цена (примерно)	Agentic-сильные стороны
GLM-5.1	Да (скоро)	45.3	~200K	$3–30/мес	Лучший open-source agent
Claude Opus 4.6	Нет	47.9	200K+	$100–200/мес	Эталон, но закрытый
DeepSeek-V3.2	Да	—	200K	Бесплатно/дешево	Сильный reasoning
Kimi K2.5	Да	—	200K+	Дешёво	Хорош в браузинге
GPT-5.2	Нет	—	200K+	Дорого	Универсальный, но закрытый

Итог

GLM-5.1 — это не просто апдейт. Это модель, которая делает открытый AI реально конкурентным closed-source флагманам в самой сложной области — agentic engineering и профессиональной разработке. Через пару недель мы получим полные weights, и тогда любой разработчик сможет запустить её локально или дообучить под свои задачи.

Ссылки для начала:

GLM Coding Plan → https://z.ai/subscribe
GLM-5 (уже открытая) → https://huggingface.co/zai-org/GLM-5
Официальный блог GLM-5 → https://z.ai/blog/glm-5

GLM-5.1: новая открытая SOTA LLM от Z.ai — 94,6 % от Claude Opus 4.6

1. Что было до GLM-5.1: GLM-5

2. GLM-5.1 — что изменилось за полтора месяца

3. Как пользоваться GLM-5.1 прямо сейчас

4. Почему это важно

5. Сравнение с главными конкурентами (март 2026)

Итог

Codex Project Autopilot: плагин, который заставляет Codex думать как настоящая команда

Claude Mythos: утечка раскрыла самую мощную модель ИИ от Anthropic — «step change» с серьёзными рисками для кибербезопасности

GLM-5.1: новая открытая SOTA LLM от Z.ai — 94,6 % от Claude Opus 4.6

## 1. Что было до GLM-5.1: GLM-5

## 2. GLM-5.1 — что изменилось за полтора месяца

## 3. Как пользоваться GLM-5.1 прямо сейчас

## 4. Почему это важно

## 5. Сравнение с главными конкурентами (март 2026)

## Итог

Codex Project Autopilot: плагин, который заставляет Codex думать как настоящая команда

Claude Mythos: утечка раскрыла самую мощную модель ИИ от Anthropic — «step change» с серьёзными рисками для кибербезопасности

1. Что было до GLM-5.1: GLM-5

2. GLM-5.1 — что изменилось за полтора месяца

3. Как пользоваться GLM-5.1 прямо сейчас

4. Почему это важно

5. Сравнение с главными конкурентами (март 2026)

Итог