Skip to content

Zhipu (GLM)

TL;DR

bash
ONGRID_ZHIPU_API_KEY=...
ONGRID_ZHIPU_MODEL=glm-4.7                  # padrão
ONGRID_ZHIPU_BASE_URL=                      # opcional; padrão open.bigmodel.cn

Provider id: zhipu. Adapter SDK: Chat Completions compatíveis com OpenAI contra o endpoint bigmodel.cn do Zhipu.

A família GLM do Zhipu é o provider de região chinesa mais usado em instalações Ongrid. O endpoint bigmodel.cn é compatível com OpenAI no nível wire, então o mesmo adapter eino-openai lida com ele.

Env vars

VarPadrãoNotas
ONGRID_ZHIPU_API_KEYVazio = provider removido
ONGRID_ZHIPU_MODELglm-4.7Modelo padrão
ONGRID_ZHIPU_BASE_URLhttps://open.bigmodel.cn/api/paas/v4Override para endpoints self-hosted ou VPC
ONGRID_ZHIPU_MODELSglm-5.1,glm-5,glm-4.7,glm-4.7-flashLista do catálogo

Catálogo padrão

O picker de fábrica mostra:

  • glm-5.1 — frontier; use para os passes RCA mais difíceis.
  • glm-5 — default geral da família GLM.
  • glm-4.7 — o padrão do catálogo; custo/qualidade balanceado.
  • glm-4.7-flash — barato; recomendado para extração Pass-2.

O modelo padrão glm-4.7 é a escolha conservadora — o GLM-4.7 foi battle-tested contra a persona investigator; 5.x ainda está sendo benchmark-ado para o loop de tool-use.

BaseURL — marcador China-based

Zhipu é China-based: o endpoint padrão https://open.bigmodel.cn/api/paas/v4 resolve apenas de redes que conseguem alcançar infraestrutura da China continental. A maioria das clouds não-CN precisa ou de VPC peering ou um relay.

A UI de Settings marca o campo BaseURL como "China-based" para que admins fora da CN saibam que precisam de um relay. A mesma tag existe para Kimi (Moonshot) — veja Kimi.

Para variantes self-hosted do GLM (open-weights glm-zero), use o slot de provider Custom em vez disso — o slot do Zhipu está conectado para o formato de API do bigmodel.cn especificamente.

Tornando Zhipu o padrão

bash
ONGRID_LLM_DEFAULT_PROVIDER=zhipu

O memo do bug do LLM-resolver: quando default_provider não está setado mas múltiplos providers estão configurados, o resolver escolhe o primeiro provider id ordenado e usa SEU modelo padrão. Um mismatch sutil segue: se você defina ONGRID_OPENAI_MODEL=glm-4.7 pensando que o modelo vence, o router ainda rotea para openai e manda glm-4.7 para o endpoint da OpenAI. Fix: defina default_provider explicitamente.

Pegadinhas

  • Compatível com OpenAI no wire — tool calls, streaming, system messages todos usam formatos OpenAI. Sem adapter especial.
  • Sensibilidade a prompt — o GLM segue restrições de user-message mais estritamente que de system-message. O budget de 10 chamadas de tool da persona investigator está na mensagem do usuário especificamente por causa disso; budgets de system-message eram ignorados em v0.7.51 - v0.7.55.
  • Locale — o GLM tem padrão em respostas em chinês a menos que o prompt diga explicitamente o contrário. A diretiva LANGUAGE: ... que o Ongrid anexa ao prompt do investigator foi originalmente introduzida para o GLM. Veja [feedback_ai_output_locale].

Veja também