Zhipu (GLM)
TL;DR
ONGRID_ZHIPU_API_KEY=...
ONGRID_ZHIPU_MODEL=glm-4.7 # default
ONGRID_ZHIPU_BASE_URL= # optional; defaults to open.bigmodel.cnProvider-ID: zhipu. SDK-Adapter: OpenAI-kompatible Chat Completions gegen Zhipus bigmodel.cn-Endpunkt.
Zhipus GLM-Familie ist der meistgenutzte China-Region-Provider für Ongrid-Installationen. Der bigmodel.cn-Endpunkt ist auf Wire-Level OpenAI-kompatibel, sodass derselbe eino-openai-Adapter ihn handhabt.
Umgebungsvariablen
| Var | Default | Notizen |
|---|---|---|
ONGRID_ZHIPU_API_KEY | — | Leer = Provider gedroppt |
ONGRID_ZHIPU_MODEL | glm-4.7 | Standardmodell |
ONGRID_ZHIPU_BASE_URL | https://open.bigmodel.cn/api/paas/v4 | Override für selbstgehostete oder VPC-Endpunkte |
ONGRID_ZHIPU_MODELS | glm-5.1,glm-5,glm-4.7,glm-4.7-flash | Katalog-Liste |
Standardkatalog
Der Out-of-Box-Picker zeigt:
glm-5.1— Frontier; verwenden für die härtesten RCA-Pässe.glm-5— allgemeiner Default für die GLM-Familie.glm-4.7— der Katalog-Default; ausgewogen Kosten/Qualität.glm-4.7-flash— günstig; empfohlen für Pass-2-Extraktion.
Das Standardmodell glm-4.7 ist die konservative Wahl — GLM-4.7 wurde gegen die Investigator-Persona kampferprobt; 5.x wird noch für die Tool-Use-Loop gebenchmarkt.
BaseURL — China-basierter Marker
Zhipu ist China-basiert: der Default-https://open.bigmodel.cn/api/paas/v4-Endpunkt löst sich nur aus Netzwerken auf, die die Festland-CN-Infrastruktur erreichen können. Die meisten Nicht-CN-Clouds brauchen entweder ein VPC-Peering oder ein Relay.
Die Settings-UI taggt das BaseURL-Feld als „China-based", sodass Admins außerhalb CN wissen, dass sie ein Relay brauchen. Der gleiche Tag existiert für Kimi (Moonshot) — siehe Kimi.
Für selbstgehostete Varianten von GLM (glm-zero Open-Weights) verwenden Sie stattdessen den Custom-Provider-Slot — Zhipus Slot ist speziell für die API-Form von bigmodel.cn verdrahtet.
Zhipu zum Default machen
ONGRID_LLM_DEFAULT_PROVIDER=zhipuDas LLM-Resolver-Bug-Memo: wenn default_provider nicht gesetzt ist, aber mehrere Provider konfiguriert sind, wählt der Resolver die erstsortierte Provider-ID und verwendet IHR Standardmodell. Ein subtiler Mismatch folgt: wenn Sie ONGRID_OPENAI_MODEL=glm-4.7 setzen und denken, das Modell gewinnt, routet der Router weiterhin zu openai und sendet glm-4.7 an OpenAIs Endpunkt. Fix: setzen Sie default_provider explizit.
Eigenheiten
- OpenAI-kompatibel auf Wire — Tool-Calls, Streaming, System-Messages alle verwenden OpenAIs Formen. Kein spezieller Adapter.
- Prompt-Sensitivität — GLM folgt User-Message-Constraints strenger als System-Message-Constraints. Das 10-Tool-Aufruf-Budget der Investigator-Persona ist speziell deswegen in der User-Message; System-Message-Budgets wurden in v0.7.51 - v0.7.55 ignoriert.
- Locale — GLM antwortet standardmäßig auf Chinesisch, es sei denn, das Prompt sagt explizit etwas anderes. Die
LANGUAGE: ...-Direktive, die Ongrid an das Investigator-Prompt anhängt, wurde ursprünglich für GLM eingeführt. Siehe [feedback_ai_output_locale].
Siehe auch
- Modelle-Übersicht.
- Routing —
WithProvider("zhipu"). - RCA — warum die Budget-Direktive in der User-Message lebt und wie das Locale-Flag funktioniert.