Zhipu (GLM)
TL;DR
ONGRID_ZHIPU_API_KEY=...
ONGRID_ZHIPU_MODEL=glm-4.7 # default
ONGRID_ZHIPU_BASE_URL= # optional; defaults to open.bigmodel.cnProvider id: zhipu. Adapter SDK: Chat Completions compatibles con OpenAI contra el endpoint bigmodel.cn de Zhipu.
La familia GLM de Zhipu es el provider de región china más usado para instalaciones de Ongrid. El endpoint bigmodel.cn es compatible con OpenAI a nivel wire, así que el mismo adapter eino-openai lo maneja.
Env vars
| Var | Default | Notas |
|---|---|---|
ONGRID_ZHIPU_API_KEY | — | Vacío = provider descartado |
ONGRID_ZHIPU_MODEL | glm-4.7 | Modelo default |
ONGRID_ZHIPU_BASE_URL | https://open.bigmodel.cn/api/paas/v4 | Override para self-hosted o endpoints VPC |
ONGRID_ZHIPU_MODELS | glm-5.1,glm-5,glm-4.7,glm-4.7-flash | Lista de catálogo |
Catálogo default
El picker de fábrica muestra:
glm-5.1— frontier; úsalo para los pases RCA más difíciles.glm-5— default general para la familia GLM.glm-4.7— el default del catálogo; costo/calidad balanceado.glm-4.7-flash— barato; recomendado para extracción Pass-2.
El modelo default glm-4.7 es la elección conservadora — GLM-4.7 ha sido probado en batalla contra la persona investigator; 5.x todavía está siendo benchmarked para el loop de tool-use.
BaseURL — marker China-based
Zhipu está basado en China: el endpoint default https://open.bigmodel.cn/api/paas/v4 resuelve solo desde redes que pueden alcanzar la infraestructura de CN continental. La mayoría de las nubes no-CN necesitan o un VPC peering o un relay.
La UI de Settings taguea el campo BaseURL como "China-based" para que los admins fuera de CN sepan que necesitan un relay. El mismo tag existe para Kimi (Moonshot) — ver Kimi.
Para variantes self-hosted de GLM (open-weights glm-zero), usa el slot de provider Custom en su lugar — el slot de Zhipu está cableado específicamente para la forma de API de bigmodel.cn.
Haciendo a Zhipu el default
ONGRID_LLM_DEFAULT_PROVIDER=zhipuEl memo del bug del resolver LLM: cuando default_provider no está seteado pero múltiples providers están configurados, el resolver elige el primer provider id ordenado y usa SU modelo default. Sigue un mismatch sutil: si seteas ONGRID_OPENAI_MODEL=glm-4.7 pensando que el modelo gana, el router sigue ruteando a openai y envía glm-4.7 al endpoint de OpenAI. Fix: establece default_provider explícitamente.
Quirks
- Compatible con OpenAI a nivel wire — tool calls, streaming, system messages todos usan las formas de OpenAI. Sin adapter especial.
- Sensibilidad de prompt — GLM sigue las restricciones de user-message más estrictamente que las de system-message. El presupuesto de 10 llamadas de tool de la persona investigator está en el user message específicamente por esto; los presupuestos de system-message se ignoraban en v0.7.51 - v0.7.55.
- Locale — GLM responde por defecto en chino salvo que el prompt diga explícitamente lo contrario. La directiva
LANGUAGE: ...que Ongrid antepone al prompt del investigator fue introducida originalmente para GLM. Ver [feedback_ai_output_locale].
Ver también
- Overview de modelos.
- Routing —
WithProvider("zhipu"). - RCA — por qué la directiva de presupuesto vive en el user message y cómo funciona el flag de locale.