Skip to content

Zhipu (GLM)

TL;DR

bash
ONGRID_ZHIPU_API_KEY=...
ONGRID_ZHIPU_MODEL=glm-4.7                  # default
ONGRID_ZHIPU_BASE_URL=                      # optional; defaults to open.bigmodel.cn

Provider id : zhipu. Adaptateur SDK : Chat Completions compatible OpenAI contre l'endpoint bigmodel.cn de Zhipu.

La famille GLM de Zhipu est le provider région-chinoise le plus utilisé pour les installs Ongrid. L'endpoint bigmodel.cn est compatible OpenAI au niveau wire, donc le même adaptateur eino-openai le gère.

Variables d'env

VariableDéfautNotes
ONGRID_ZHIPU_API_KEYVide = provider retiré
ONGRID_ZHIPU_MODELglm-4.7Modèle par défaut
ONGRID_ZHIPU_BASE_URLhttps://open.bigmodel.cn/api/paas/v4Override pour endpoints self-hostés ou VPC
ONGRID_ZHIPU_MODELSglm-5.1,glm-5,glm-4.7,glm-4.7-flashListe de catalogue

Catalogue par défaut

Le picker out-of-box affiche :

  • glm-5.1 — frontier ; à utiliser pour les passes RCA les plus dures.
  • glm-5 — défaut général pour la famille GLM.
  • glm-4.7 — le défaut du catalogue ; coût/qualité équilibré.
  • glm-4.7-flash — bon marché ; recommandé pour l'extraction Pass-2.

Le modèle par défaut glm-4.7 est le choix conservateur — GLM-4.7 a été éprouvé contre la persona investigator ; 5.x est encore benchmarké pour la boucle tool-use.

BaseURL — marqueur China-based

Zhipu est China-based : l'endpoint par défaut https://open.bigmodel.cn/api/paas/v4 ne se résout que depuis les réseaux qui peuvent atteindre l'infrastructure CN continentale. La plupart des clouds non-CN ont besoin soit d'un peering VPC soit d'un relais.

L'UI Settings tag le champ BaseURL comme « China-based » pour que les admins hors CN sachent qu'ils ont besoin d'un relais. Le même tag existe pour Kimi (Moonshot) — voir Kimi.

Pour les variantes self-hostées de GLM (glm-zero open-weights), utilisez le slot de provider Custom à la place — le slot de Zhipu est câblé pour la forme d'API de bigmodel.cn spécifiquement.

Faire de Zhipu le défaut

bash
ONGRID_LLM_DEFAULT_PROVIDER=zhipu

Le mémo du bug du résolveur LLM : quand default_provider n'est pas posé mais que plusieurs providers sont configurés, le résolveur choisit le premier id de provider trié et utilise SON modèle par défaut. Un mismatch subtil suit : si vous posez ONGRID_OPENAI_MODEL=glm-4.7 en pensant que le modèle gagne, le router route encore vers openai et envoie glm-4.7 à l'endpoint d'OpenAI. Fix : posez default_provider explicitement.

Particularités

  • Compatible OpenAI au wire — tool calls, streaming, messages système utilisent tous les formes d'OpenAI. Pas d'adaptateur spécial.
  • Sensibilité au prompt — GLM suit les contraintes des messages utilisateur plus strictement que celles des messages système. Le budget de 10 appels d'outils de la persona investigator est dans le message utilisateur spécifiquement à cause de cela ; les budgets en message système étaient ignorés en v0.7.51 - v0.7.55.
  • Locale — GLM retombe par défaut sur des réponses en chinois sauf si le prompt dit explicitement autrement. La directive LANGUAGE: ... qu'Ongrid ajoute au prompt de l'investigator a été originellement introduite pour GLM. Voir [feedback_ai_output_locale].

Voir aussi

  • Aperçu des modèles.
  • RoutingWithProvider("zhipu").
  • RCA — pourquoi la directive de budget vit dans le message utilisateur et comment le flag de locale fonctionne.