Skip to content

Zhipu (GLM)

TL;DR

bash
ONGRID_ZHIPU_API_KEY=...
ONGRID_ZHIPU_MODEL=glm-4.7                  # default
ONGRID_ZHIPU_BASE_URL=                      # optional; defaults to open.bigmodel.cn

Provider-ID: zhipu. SDK-Adapter: OpenAI-kompatible Chat Completions gegen Zhipus bigmodel.cn-Endpunkt.

Zhipus GLM-Familie ist der meistgenutzte China-Region-Provider für Ongrid-Installationen. Der bigmodel.cn-Endpunkt ist auf Wire-Level OpenAI-kompatibel, sodass derselbe eino-openai-Adapter ihn handhabt.

Umgebungsvariablen

VarDefaultNotizen
ONGRID_ZHIPU_API_KEYLeer = Provider gedroppt
ONGRID_ZHIPU_MODELglm-4.7Standardmodell
ONGRID_ZHIPU_BASE_URLhttps://open.bigmodel.cn/api/paas/v4Override für selbstgehostete oder VPC-Endpunkte
ONGRID_ZHIPU_MODELSglm-5.1,glm-5,glm-4.7,glm-4.7-flashKatalog-Liste

Standardkatalog

Der Out-of-Box-Picker zeigt:

  • glm-5.1 — Frontier; verwenden für die härtesten RCA-Pässe.
  • glm-5 — allgemeiner Default für die GLM-Familie.
  • glm-4.7 — der Katalog-Default; ausgewogen Kosten/Qualität.
  • glm-4.7-flash — günstig; empfohlen für Pass-2-Extraktion.

Das Standardmodell glm-4.7 ist die konservative Wahl — GLM-4.7 wurde gegen die Investigator-Persona kampferprobt; 5.x wird noch für die Tool-Use-Loop gebenchmarkt.

BaseURL — China-basierter Marker

Zhipu ist China-basiert: der Default-https://open.bigmodel.cn/api/paas/v4-Endpunkt löst sich nur aus Netzwerken auf, die die Festland-CN-Infrastruktur erreichen können. Die meisten Nicht-CN-Clouds brauchen entweder ein VPC-Peering oder ein Relay.

Die Settings-UI taggt das BaseURL-Feld als „China-based", sodass Admins außerhalb CN wissen, dass sie ein Relay brauchen. Der gleiche Tag existiert für Kimi (Moonshot) — siehe Kimi.

Für selbstgehostete Varianten von GLM (glm-zero Open-Weights) verwenden Sie stattdessen den Custom-Provider-Slot — Zhipus Slot ist speziell für die API-Form von bigmodel.cn verdrahtet.

Zhipu zum Default machen

bash
ONGRID_LLM_DEFAULT_PROVIDER=zhipu

Das LLM-Resolver-Bug-Memo: wenn default_provider nicht gesetzt ist, aber mehrere Provider konfiguriert sind, wählt der Resolver die erstsortierte Provider-ID und verwendet IHR Standardmodell. Ein subtiler Mismatch folgt: wenn Sie ONGRID_OPENAI_MODEL=glm-4.7 setzen und denken, das Modell gewinnt, routet der Router weiterhin zu openai und sendet glm-4.7 an OpenAIs Endpunkt. Fix: setzen Sie default_provider explizit.

Eigenheiten

  • OpenAI-kompatibel auf Wire — Tool-Calls, Streaming, System-Messages alle verwenden OpenAIs Formen. Kein spezieller Adapter.
  • Prompt-Sensitivität — GLM folgt User-Message-Constraints strenger als System-Message-Constraints. Das 10-Tool-Aufruf-Budget der Investigator-Persona ist speziell deswegen in der User-Message; System-Message-Budgets wurden in v0.7.51 - v0.7.55 ignoriert.
  • Locale — GLM antwortet standardmäßig auf Chinesisch, es sei denn, das Prompt sagt explizit etwas anderes. Die LANGUAGE: ...-Direktive, die Ongrid an das Investigator-Prompt anhängt, wurde ursprünglich für GLM eingeführt. Siehe [feedback_ai_output_locale].

Siehe auch

  • Modelle-Übersicht.
  • RoutingWithProvider("zhipu").
  • RCA — warum die Budget-Direktive in der User-Message lebt und wie das Locale-Flag funktioniert.