Zhipu (GLM)

TL;DR

bash

ONGRID_ZHIPU_API_KEY=...
ONGRID_ZHIPU_MODEL=glm-4.7                  # default
ONGRID_ZHIPU_BASE_URL=                      # optional; defaults to open.bigmodel.cn

Provider-ID: zhipu. SDK-Adapter: OpenAI-kompatible Chat Completions gegen Zhipus bigmodel.cn-Endpunkt.

Zhipus GLM-Familie ist der meistgenutzte China-Region-Provider für Ongrid-Installationen. Der bigmodel.cn-Endpunkt ist auf Wire-Level OpenAI-kompatibel, sodass derselbe eino-openai-Adapter ihn handhabt.

Umgebungsvariablen

Var	Default	Notizen
`ONGRID_ZHIPU_API_KEY`	—	Leer = Provider gedroppt
`ONGRID_ZHIPU_MODEL`	`glm-4.7`	Standardmodell
`ONGRID_ZHIPU_BASE_URL`	`https://open.bigmodel.cn/api/paas/v4`	Override für selbstgehostete oder VPC-Endpunkte
`ONGRID_ZHIPU_MODELS`	`glm-5.1,glm-5,glm-4.7,glm-4.7-flash`	Katalog-Liste

Standardkatalog

Der Out-of-Box-Picker zeigt:

glm-5.1 — Frontier; verwenden für die härtesten RCA-Pässe.
glm-5 — allgemeiner Default für die GLM-Familie.
glm-4.7 — der Katalog-Default; ausgewogen Kosten/Qualität.
glm-4.7-flash — günstig; empfohlen für Pass-2-Extraktion.

Das Standardmodell glm-4.7 ist die konservative Wahl — GLM-4.7 wurde gegen die Investigator-Persona kampferprobt; 5.x wird noch für die Tool-Use-Loop gebenchmarkt.

BaseURL — China-basierter Marker

Zhipu ist China-basiert: der Default-https://open.bigmodel.cn/api/paas/v4-Endpunkt löst sich nur aus Netzwerken auf, die die Festland-CN-Infrastruktur erreichen können. Die meisten Nicht-CN-Clouds brauchen entweder ein VPC-Peering oder ein Relay.

Die Settings-UI taggt das BaseURL-Feld als „China-based", sodass Admins außerhalb CN wissen, dass sie ein Relay brauchen. Der gleiche Tag existiert für Kimi (Moonshot) — siehe Kimi.

Für selbstgehostete Varianten von GLM (glm-zero Open-Weights) verwenden Sie stattdessen den Custom-Provider-Slot — Zhipus Slot ist speziell für die API-Form von bigmodel.cn verdrahtet.

Zhipu zum Default machen

bash

ONGRID_LLM_DEFAULT_PROVIDER=zhipu

Das LLM-Resolver-Bug-Memo: wenn default_provider nicht gesetzt ist, aber mehrere Provider konfiguriert sind, wählt der Resolver die erstsortierte Provider-ID und verwendet IHR Standardmodell. Ein subtiler Mismatch folgt: wenn Sie ONGRID_OPENAI_MODEL=glm-4.7 setzen und denken, das Modell gewinnt, routet der Router weiterhin zu openai und sendet glm-4.7 an OpenAIs Endpunkt. Fix: setzen Sie default_provider explizit.

Eigenheiten

OpenAI-kompatibel auf Wire — Tool-Calls, Streaming, System-Messages alle verwenden OpenAIs Formen. Kein spezieller Adapter.
Prompt-Sensitivität — GLM folgt User-Message-Constraints strenger als System-Message-Constraints. Das 10-Tool-Aufruf-Budget der Investigator-Persona ist speziell deswegen in der User-Message; System-Message-Budgets wurden in v0.7.51 - v0.7.55 ignoriert.
Locale — GLM antwortet standardmäßig auf Chinesisch, es sei denn, das Prompt sagt explizit etwas anderes. Die LANGUAGE: ...-Direktive, die Ongrid an das Investigator-Prompt anhängt, wurde ursprünglich für GLM eingeführt. Siehe [feedback_ai_output_locale].

Siehe auch

Modelle-Übersicht.
Routing — WithProvider("zhipu").
RCA — warum die Budget-Direktive in der User-Message lebt und wie das Locale-Flag funktioniert.

Zhipu (GLM) ​

Umgebungsvariablen ​

Standardkatalog ​

BaseURL — China-basierter Marker ​

Zhipu zum Default machen ​

Eigenheiten ​

Siehe auch ​