Skip to content

Kimi

TL;DR

bash
ONGRID_KIMI_API_KEY=...
ONGRID_KIMI_MODEL=kimi-k2.6                 # default
ONGRID_KIMI_BASE_URL=                       # defaults to api.moonshot.cn/v1

Provider id: kimi. Adapter SDK: compatible con OpenAI.

Env vars

VarDefaultNotas
ONGRID_KIMI_API_KEYVacío = provider descartado
ONGRID_KIMI_MODELkimi-k2.6Modelo default
ONGRID_KIMI_BASE_URLhttps://api.moonshot.cn/v1El endpoint de Moonshot
ONGRID_KIMI_MODELSkimi-k2.6,kimi-k2.5,moonshot-v1-128kLista de catálogo

Catálogo default

  • kimi-k2.6 — el default del catálogo; el frontier actual de Moonshot.
  • kimi-k2.5 — generación previa; todavía competitivo en costo.
  • moonshot-v1-128k — variante long-context. 128k tokens.

China-based

El endpoint api.moonshot.cn de Moonshot está en CN continental. Las redes no-CN necesitan o un VPC peering o un relay; la UI de Settings taguea el campo BaseURL como "China-based" junto a Zhipu.

Tip de long-context

moonshot-v1-128k es el único modelo en el catálogo default con longitud de contexto seria. Úsalo para:

  • El compuesto correlate_incident — blob largo de resultados Prom + Loki + Tempo.
  • Búsquedas de base de conocimiento sobre playbooks largos.

El tope de 10 llamadas de tool de la persona investigator de Ongrid significa que el prompt rara vez se hace lo suficientemente grande para importar para la ruta rutinaria; long-context es para el caso deep-dive donde has jalado manualmente mucha data.

Haciendo a Kimi el default

bash
ONGRID_LLM_DEFAULT_PROVIDER=kimi

Quirks

  • Wire compatible con OpenAI — lo mismo que Zhipu / DeepSeek. Function calling, streaming, system messages todos estándar.
  • Idioma de salida — Kimi es bilingüe pero responde por defecto en chino salvo que la directiva del prompt diga otra cosa. La misma directiva LANGUAGE: ... que maneja GLM funciona aquí.
  • Rate limits — los rate limits por-cuenta de Moonshot son ajustados. Usa el default Config.MaxConcurrent=5 en el worker RCA para evitar matar de hambre al chat manual cuando pega una tormenta de alertas.

Ver también