Skip to content

Zhipu (GLM)

TL;DR

bash
ONGRID_ZHIPU_API_KEY=...
ONGRID_ZHIPU_MODEL=glm-4.7                  # default
ONGRID_ZHIPU_BASE_URL=                      # optional; defaults to open.bigmodel.cn

Provider id: zhipu. SDK adapter: OpenAI-совместимый Chat Completions против эндпоинта Zhipu bigmodel.cn.

Семейство GLM Zhipu — самый используемый Chinese-region provider для установок Ongrid. Эндпоинт bigmodel.cn — OpenAI-совместимый на wire- уровне, так что тот же eino-openai адаптер его обрабатывает.

Env-переменные

VarПо умолчаниюЗаметки
ONGRID_ZHIPU_API_KEYПусто = provider выпадает
ONGRID_ZHIPU_MODELglm-4.7Дефолтная модель
ONGRID_ZHIPU_BASE_URLhttps://open.bigmodel.cn/api/paas/v4Override для self-hosted или VPC-эндпоинтов
ONGRID_ZHIPU_MODELSglm-5.1,glm-5,glm-4.7,glm-4.7-flashКаталог-список

Дефолтный каталог

Out-of-box picker показывает:

  • glm-5.1 — frontier; используйте для самых трудных проходов RCA.
  • glm-5 — общий дефолт для семейства GLM.
  • glm-4.7 — каталог-дефолт; сбалансировано cost/quality.
  • glm-4.7-flash — дешёвая; рекомендуется для Pass-2 extraction.

Дефолтная модель glm-4.7 — консервативный выбор — GLM-4.7 battle-tested против персоны investigator; 5.x всё ещё бенчмаркается для tool-use loop.

BaseURL — China-based marker

Zhipu China-based: дефолтный https://open.bigmodel.cn/api/paas/v4 эндпоинт резолвится только из сетей, которые могут дотянуться до материковой CN инфраструктуры. Большинство не-CN облаков нуждаются либо в VPC peering, либо в relay.

Settings UI тегирует поле BaseURL как «China-based», так что админы вне CN знают, что им нужен relay. Тот же тег существует для Kimi (Moonshot) — см. Kimi.

Для self-hosted вариантов GLM (glm-zero open-weights), используйте Custom provider slot вместо этого — slot Zhipu подключён для API-формы bigmodel.cn специфично.

Сделать Zhipu дефолтным

bash
ONGRID_LLM_DEFAULT_PROVIDER=zhipu

Memo LLM-resolver-bug: когда default_provider не установлен, но несколько providers сконфигурированы, resolver выбирает первый-сортированный provider id и использует ЕГО дефолтную модель. Тонкий mismatch следует: если вы поставите ONGRID_OPENAI_MODEL=glm-4.7, думая, что модель побеждает, router всё равно маршрутизирует на openai и отправляет glm-4.7 на эндпоинт OpenAI. Фикс: установите default_provider явно.

Особенности

  • OpenAI-совместимый на wire — tool calls, streaming, system- сообщения — все используют формы OpenAI. Без специального адаптера.
  • Prompt sensitivity — GLM следует user-message ограничениям более строго, чем system-message. 10-tool-call budget персоны investigator — в user-сообщении специфически из-за этого; system-message бюджеты игнорировались в v0.7.51 - v0.7.55.
  • Locale — GLM по умолчанию даёт ответы на китайском, если промпт явно не говорит иначе. Директива LANGUAGE: ..., которую Ongrid аппендит к investigator-промпту, была изначально введена для GLM. См. [feedback_ai_output_locale].

См. также

  • Обзор моделей.
  • RoutingWithProvider("zhipu").
  • RCA — почему директива budget живёт в user-сообщении и как работает locale-флаг.