Zhipu (GLM)

TL;DR

bash

ONGRID_ZHIPU_API_KEY=...
ONGRID_ZHIPU_MODEL=glm-4.7                  # padrão
ONGRID_ZHIPU_BASE_URL=                      # opcional; padrão open.bigmodel.cn

Provider id: zhipu. Adapter SDK: Chat Completions compatíveis com OpenAI contra o endpoint bigmodel.cn do Zhipu.

A família GLM do Zhipu é o provider de região chinesa mais usado em instalações Ongrid. O endpoint bigmodel.cn é compatível com OpenAI no nível wire, então o mesmo adapter eino-openai lida com ele.

Env vars

Var	Padrão	Notas
`ONGRID_ZHIPU_API_KEY`	—	Vazio = provider removido
`ONGRID_ZHIPU_MODEL`	`glm-4.7`	Modelo padrão
`ONGRID_ZHIPU_BASE_URL`	`https://open.bigmodel.cn/api/paas/v4`	Override para endpoints self-hosted ou VPC
`ONGRID_ZHIPU_MODELS`	`glm-5.1,glm-5,glm-4.7,glm-4.7-flash`	Lista do catálogo

Catálogo padrão

O picker de fábrica mostra:

glm-5.1 — frontier; use para os passes RCA mais difíceis.
glm-5 — default geral da família GLM.
glm-4.7 — o padrão do catálogo; custo/qualidade balanceado.
glm-4.7-flash — barato; recomendado para extração Pass-2.

O modelo padrão glm-4.7 é a escolha conservadora — o GLM-4.7 foi battle-tested contra a persona investigator; 5.x ainda está sendo benchmark-ado para o loop de tool-use.

BaseURL — marcador China-based

Zhipu é China-based: o endpoint padrão https://open.bigmodel.cn/api/paas/v4 resolve apenas de redes que conseguem alcançar infraestrutura da China continental. A maioria das clouds não-CN precisa ou de VPC peering ou um relay.

A UI de Settings marca o campo BaseURL como "China-based" para que admins fora da CN saibam que precisam de um relay. A mesma tag existe para Kimi (Moonshot) — veja Kimi.

Para variantes self-hosted do GLM (open-weights glm-zero), use o slot de provider Custom em vez disso — o slot do Zhipu está conectado para o formato de API do bigmodel.cn especificamente.

Tornando Zhipu o padrão

bash

ONGRID_LLM_DEFAULT_PROVIDER=zhipu

O memo do bug do LLM-resolver: quando default_provider não está setado mas múltiplos providers estão configurados, o resolver escolhe o primeiro provider id ordenado e usa SEU modelo padrão. Um mismatch sutil segue: se você defina ONGRID_OPENAI_MODEL=glm-4.7 pensando que o modelo vence, o router ainda rotea para openai e manda glm-4.7 para o endpoint da OpenAI. Fix: defina default_provider explicitamente.

Pegadinhas

Compatível com OpenAI no wire — tool calls, streaming, system messages todos usam formatos OpenAI. Sem adapter especial.
Sensibilidade a prompt — o GLM segue restrições de user-message mais estritamente que de system-message. O budget de 10 chamadas de tool da persona investigator está na mensagem do usuário especificamente por causa disso; budgets de system-message eram ignorados em v0.7.51 - v0.7.55.
Locale — o GLM tem padrão em respostas em chinês a menos que o prompt diga explicitamente o contrário. A diretiva LANGUAGE: ... que o Ongrid anexa ao prompt do investigator foi originalmente introduzida para o GLM. Veja [feedback_ai_output_locale].

Veja também

Visão geral dos modelos.
Roteamento — WithProvider("zhipu").
RCA — por que a diretiva de budget vive na mensagem do usuário e como a flag de locale funciona.

Zhipu (GLM) ​

Env vars ​

Catálogo padrão ​

BaseURL — marcador China-based ​

Tornando Zhipu o padrão ​

Pegadinhas ​

Veja também ​