Zhipu (GLM)

TL;DR

bash

ONGRID_ZHIPU_API_KEY=...
ONGRID_ZHIPU_MODEL=glm-4.7                  # default
ONGRID_ZHIPU_BASE_URL=                      # optional; defaults to open.bigmodel.cn

Provider id: zhipu. Adapter SDK: Chat Completions compatibles con OpenAI contra el endpoint bigmodel.cn de Zhipu.

La familia GLM de Zhipu es el provider de región china más usado para instalaciones de Ongrid. El endpoint bigmodel.cn es compatible con OpenAI a nivel wire, así que el mismo adapter eino-openai lo maneja.

Env vars

Var	Default	Notas
`ONGRID_ZHIPU_API_KEY`	—	Vacío = provider descartado
`ONGRID_ZHIPU_MODEL`	`glm-4.7`	Modelo default
`ONGRID_ZHIPU_BASE_URL`	`https://open.bigmodel.cn/api/paas/v4`	Override para self-hosted o endpoints VPC
`ONGRID_ZHIPU_MODELS`	`glm-5.1,glm-5,glm-4.7,glm-4.7-flash`	Lista de catálogo

Catálogo default

El picker de fábrica muestra:

glm-5.1 — frontier; úsalo para los pases RCA más difíciles.
glm-5 — default general para la familia GLM.
glm-4.7 — el default del catálogo; costo/calidad balanceado.
glm-4.7-flash — barato; recomendado para extracción Pass-2.

El modelo default glm-4.7 es la elección conservadora — GLM-4.7 ha sido probado en batalla contra la persona investigator; 5.x todavía está siendo benchmarked para el loop de tool-use.

BaseURL — marker China-based

Zhipu está basado en China: el endpoint default https://open.bigmodel.cn/api/paas/v4 resuelve solo desde redes que pueden alcanzar la infraestructura de CN continental. La mayoría de las nubes no-CN necesitan o un VPC peering o un relay.

La UI de Settings taguea el campo BaseURL como "China-based" para que los admins fuera de CN sepan que necesitan un relay. El mismo tag existe para Kimi (Moonshot) — ver Kimi.

Para variantes self-hosted de GLM (open-weights glm-zero), usa el slot de provider Custom en su lugar — el slot de Zhipu está cableado específicamente para la forma de API de bigmodel.cn.

Haciendo a Zhipu el default

bash

ONGRID_LLM_DEFAULT_PROVIDER=zhipu

El memo del bug del resolver LLM: cuando default_provider no está seteado pero múltiples providers están configurados, el resolver elige el primer provider id ordenado y usa SU modelo default. Sigue un mismatch sutil: si seteas ONGRID_OPENAI_MODEL=glm-4.7 pensando que el modelo gana, el router sigue ruteando a openai y envía glm-4.7 al endpoint de OpenAI. Fix: establece default_provider explícitamente.

Quirks

Compatible con OpenAI a nivel wire — tool calls, streaming, system messages todos usan las formas de OpenAI. Sin adapter especial.
Sensibilidad de prompt — GLM sigue las restricciones de user-message más estrictamente que las de system-message. El presupuesto de 10 llamadas de tool de la persona investigator está en el user message específicamente por esto; los presupuestos de system-message se ignoraban en v0.7.51 - v0.7.55.
Locale — GLM responde por defecto en chino salvo que el prompt diga explícitamente lo contrario. La directiva LANGUAGE: ... que Ongrid antepone al prompt del investigator fue introducida originalmente para GLM. Ver [feedback_ai_output_locale].

Ver también

Overview de modelos.
Routing — WithProvider("zhipu").
RCA — por qué la directiva de presupuesto vive en el user message y cómo funciona el flag de locale.

Zhipu (GLM) ​

Env vars ​

Catálogo default ​

BaseURL — marker China-based ​

Haciendo a Zhipu el default ​

Quirks ​

Ver también ​