Zhipu (GLM)
TL;DR
ONGRID_ZHIPU_API_KEY=...
ONGRID_ZHIPU_MODEL=glm-4.7 # padrão
ONGRID_ZHIPU_BASE_URL= # opcional; padrão open.bigmodel.cnProvider id: zhipu. Adapter SDK: Chat Completions compatíveis com OpenAI contra o endpoint bigmodel.cn do Zhipu.
A família GLM do Zhipu é o provider de região chinesa mais usado em instalações Ongrid. O endpoint bigmodel.cn é compatível com OpenAI no nível wire, então o mesmo adapter eino-openai lida com ele.
Env vars
| Var | Padrão | Notas |
|---|---|---|
ONGRID_ZHIPU_API_KEY | — | Vazio = provider removido |
ONGRID_ZHIPU_MODEL | glm-4.7 | Modelo padrão |
ONGRID_ZHIPU_BASE_URL | https://open.bigmodel.cn/api/paas/v4 | Override para endpoints self-hosted ou VPC |
ONGRID_ZHIPU_MODELS | glm-5.1,glm-5,glm-4.7,glm-4.7-flash | Lista do catálogo |
Catálogo padrão
O picker de fábrica mostra:
glm-5.1— frontier; use para os passes RCA mais difíceis.glm-5— default geral da família GLM.glm-4.7— o padrão do catálogo; custo/qualidade balanceado.glm-4.7-flash— barato; recomendado para extração Pass-2.
O modelo padrão glm-4.7 é a escolha conservadora — o GLM-4.7 foi battle-tested contra a persona investigator; 5.x ainda está sendo benchmark-ado para o loop de tool-use.
BaseURL — marcador China-based
Zhipu é China-based: o endpoint padrão https://open.bigmodel.cn/api/paas/v4 resolve apenas de redes que conseguem alcançar infraestrutura da China continental. A maioria das clouds não-CN precisa ou de VPC peering ou um relay.
A UI de Settings marca o campo BaseURL como "China-based" para que admins fora da CN saibam que precisam de um relay. A mesma tag existe para Kimi (Moonshot) — veja Kimi.
Para variantes self-hosted do GLM (open-weights glm-zero), use o slot de provider Custom em vez disso — o slot do Zhipu está conectado para o formato de API do bigmodel.cn especificamente.
Tornando Zhipu o padrão
ONGRID_LLM_DEFAULT_PROVIDER=zhipuO memo do bug do LLM-resolver: quando default_provider não está setado mas múltiplos providers estão configurados, o resolver escolhe o primeiro provider id ordenado e usa SEU modelo padrão. Um mismatch sutil segue: se você defina ONGRID_OPENAI_MODEL=glm-4.7 pensando que o modelo vence, o router ainda rotea para openai e manda glm-4.7 para o endpoint da OpenAI. Fix: defina default_provider explicitamente.
Pegadinhas
- Compatível com OpenAI no wire — tool calls, streaming, system messages todos usam formatos OpenAI. Sem adapter especial.
- Sensibilidade a prompt — o GLM segue restrições de user-message mais estritamente que de system-message. O budget de 10 chamadas de tool da persona investigator está na mensagem do usuário especificamente por causa disso; budgets de system-message eram ignorados em v0.7.51 - v0.7.55.
- Locale — o GLM tem padrão em respostas em chinês a menos que o prompt diga explicitamente o contrário. A diretiva
LANGUAGE: ...que o Ongrid anexa ao prompt do investigator foi originalmente introduzida para o GLM. Veja [feedback_ai_output_locale].
Veja também
- Visão geral dos modelos.
- Roteamento —
WithProvider("zhipu"). - RCA — por que a diretiva de budget vive na mensagem do usuário e como a flag de locale funciona.