Zhipu (GLM)
TL;DR
ONGRID_ZHIPU_API_KEY=...
ONGRID_ZHIPU_MODEL=glm-4.7 # default
ONGRID_ZHIPU_BASE_URL= # optional; defaults to open.bigmodel.cnProvider id: zhipu. SDK adapter: OpenAI-совместимый Chat Completions против эндпоинта Zhipu bigmodel.cn.
Семейство GLM Zhipu — самый используемый Chinese-region provider для установок Ongrid. Эндпоинт bigmodel.cn — OpenAI-совместимый на wire- уровне, так что тот же eino-openai адаптер его обрабатывает.
Env-переменные
| Var | По умолчанию | Заметки |
|---|---|---|
ONGRID_ZHIPU_API_KEY | — | Пусто = provider выпадает |
ONGRID_ZHIPU_MODEL | glm-4.7 | Дефолтная модель |
ONGRID_ZHIPU_BASE_URL | https://open.bigmodel.cn/api/paas/v4 | Override для self-hosted или VPC-эндпоинтов |
ONGRID_ZHIPU_MODELS | glm-5.1,glm-5,glm-4.7,glm-4.7-flash | Каталог-список |
Дефолтный каталог
Out-of-box picker показывает:
glm-5.1— frontier; используйте для самых трудных проходов RCA.glm-5— общий дефолт для семейства GLM.glm-4.7— каталог-дефолт; сбалансировано cost/quality.glm-4.7-flash— дешёвая; рекомендуется для Pass-2 extraction.
Дефолтная модель glm-4.7 — консервативный выбор — GLM-4.7 battle-tested против персоны investigator; 5.x всё ещё бенчмаркается для tool-use loop.
BaseURL — China-based marker
Zhipu China-based: дефолтный https://open.bigmodel.cn/api/paas/v4 эндпоинт резолвится только из сетей, которые могут дотянуться до материковой CN инфраструктуры. Большинство не-CN облаков нуждаются либо в VPC peering, либо в relay.
Settings UI тегирует поле BaseURL как «China-based», так что админы вне CN знают, что им нужен relay. Тот же тег существует для Kimi (Moonshot) — см. Kimi.
Для self-hosted вариантов GLM (glm-zero open-weights), используйте Custom provider slot вместо этого — slot Zhipu подключён для API-формы bigmodel.cn специфично.
Сделать Zhipu дефолтным
ONGRID_LLM_DEFAULT_PROVIDER=zhipuMemo LLM-resolver-bug: когда default_provider не установлен, но несколько providers сконфигурированы, resolver выбирает первый-сортированный provider id и использует ЕГО дефолтную модель. Тонкий mismatch следует: если вы поставите ONGRID_OPENAI_MODEL=glm-4.7, думая, что модель побеждает, router всё равно маршрутизирует на openai и отправляет glm-4.7 на эндпоинт OpenAI. Фикс: установите default_provider явно.
Особенности
- OpenAI-совместимый на wire — tool calls, streaming, system- сообщения — все используют формы OpenAI. Без специального адаптера.
- Prompt sensitivity — GLM следует user-message ограничениям более строго, чем system-message. 10-tool-call budget персоны investigator — в user-сообщении специфически из-за этого; system-message бюджеты игнорировались в v0.7.51 - v0.7.55.
- Locale — GLM по умолчанию даёт ответы на китайском, если промпт явно не говорит иначе. Директива
LANGUAGE: ..., которую Ongrid аппендит к investigator-промпту, была изначально введена для GLM. См. [feedback_ai_output_locale].
См. также
- Обзор моделей.
- Routing —
WithProvider("zhipu"). - RCA — почему директива budget живёт в user-сообщении и как работает locale-флаг.