Zhipu (GLM)
TL;DR
ONGRID_ZHIPU_API_KEY=...
ONGRID_ZHIPU_MODEL=glm-4.7 # default
ONGRID_ZHIPU_BASE_URL= # optional; defaults to open.bigmodel.cnProvider id : zhipu. Adaptateur SDK : Chat Completions compatible OpenAI contre l'endpoint bigmodel.cn de Zhipu.
La famille GLM de Zhipu est le provider région-chinoise le plus utilisé pour les installs Ongrid. L'endpoint bigmodel.cn est compatible OpenAI au niveau wire, donc le même adaptateur eino-openai le gère.
Variables d'env
| Variable | Défaut | Notes |
|---|---|---|
ONGRID_ZHIPU_API_KEY | — | Vide = provider retiré |
ONGRID_ZHIPU_MODEL | glm-4.7 | Modèle par défaut |
ONGRID_ZHIPU_BASE_URL | https://open.bigmodel.cn/api/paas/v4 | Override pour endpoints self-hostés ou VPC |
ONGRID_ZHIPU_MODELS | glm-5.1,glm-5,glm-4.7,glm-4.7-flash | Liste de catalogue |
Catalogue par défaut
Le picker out-of-box affiche :
glm-5.1— frontier ; à utiliser pour les passes RCA les plus dures.glm-5— défaut général pour la famille GLM.glm-4.7— le défaut du catalogue ; coût/qualité équilibré.glm-4.7-flash— bon marché ; recommandé pour l'extraction Pass-2.
Le modèle par défaut glm-4.7 est le choix conservateur — GLM-4.7 a été éprouvé contre la persona investigator ; 5.x est encore benchmarké pour la boucle tool-use.
BaseURL — marqueur China-based
Zhipu est China-based : l'endpoint par défaut https://open.bigmodel.cn/api/paas/v4 ne se résout que depuis les réseaux qui peuvent atteindre l'infrastructure CN continentale. La plupart des clouds non-CN ont besoin soit d'un peering VPC soit d'un relais.
L'UI Settings tag le champ BaseURL comme « China-based » pour que les admins hors CN sachent qu'ils ont besoin d'un relais. Le même tag existe pour Kimi (Moonshot) — voir Kimi.
Pour les variantes self-hostées de GLM (glm-zero open-weights), utilisez le slot de provider Custom à la place — le slot de Zhipu est câblé pour la forme d'API de bigmodel.cn spécifiquement.
Faire de Zhipu le défaut
ONGRID_LLM_DEFAULT_PROVIDER=zhipuLe mémo du bug du résolveur LLM : quand default_provider n'est pas posé mais que plusieurs providers sont configurés, le résolveur choisit le premier id de provider trié et utilise SON modèle par défaut. Un mismatch subtil suit : si vous posez ONGRID_OPENAI_MODEL=glm-4.7 en pensant que le modèle gagne, le router route encore vers openai et envoie glm-4.7 à l'endpoint d'OpenAI. Fix : posez default_provider explicitement.
Particularités
- Compatible OpenAI au wire — tool calls, streaming, messages système utilisent tous les formes d'OpenAI. Pas d'adaptateur spécial.
- Sensibilité au prompt — GLM suit les contraintes des messages utilisateur plus strictement que celles des messages système. Le budget de 10 appels d'outils de la persona investigator est dans le message utilisateur spécifiquement à cause de cela ; les budgets en message système étaient ignorés en v0.7.51 - v0.7.55.
- Locale — GLM retombe par défaut sur des réponses en chinois sauf si le prompt dit explicitement autrement. La directive
LANGUAGE: ...qu'Ongrid ajoute au prompt de l'investigator a été originellement introduite pour GLM. Voir [feedback_ai_output_locale].
Voir aussi
- Aperçu des modèles.
- Routing —
WithProvider("zhipu"). - RCA — pourquoi la directive de budget vit dans le message utilisateur et comment le flag de locale fonctionne.