Kimi
TL;DR
bash
ONGRID_KIMI_API_KEY=...
ONGRID_KIMI_MODEL=kimi-k2.6 # default
ONGRID_KIMI_BASE_URL= # defaults to api.moonshot.cn/v1Provider id: kimi. Adapter SDK: compatible con OpenAI.
Env vars
| Var | Default | Notas |
|---|---|---|
ONGRID_KIMI_API_KEY | — | Vacío = provider descartado |
ONGRID_KIMI_MODEL | kimi-k2.6 | Modelo default |
ONGRID_KIMI_BASE_URL | https://api.moonshot.cn/v1 | El endpoint de Moonshot |
ONGRID_KIMI_MODELS | kimi-k2.6,kimi-k2.5,moonshot-v1-128k | Lista de catálogo |
Catálogo default
kimi-k2.6— el default del catálogo; el frontier actual de Moonshot.kimi-k2.5— generación previa; todavía competitivo en costo.moonshot-v1-128k— variante long-context. 128k tokens.
China-based
El endpoint api.moonshot.cn de Moonshot está en CN continental. Las redes no-CN necesitan o un VPC peering o un relay; la UI de Settings taguea el campo BaseURL como "China-based" junto a Zhipu.
Tip de long-context
moonshot-v1-128k es el único modelo en el catálogo default con longitud de contexto seria. Úsalo para:
- El compuesto
correlate_incident— blob largo de resultados Prom + Loki + Tempo. - Búsquedas de base de conocimiento sobre playbooks largos.
El tope de 10 llamadas de tool de la persona investigator de Ongrid significa que el prompt rara vez se hace lo suficientemente grande para importar para la ruta rutinaria; long-context es para el caso deep-dive donde has jalado manualmente mucha data.
Haciendo a Kimi el default
bash
ONGRID_LLM_DEFAULT_PROVIDER=kimiQuirks
- Wire compatible con OpenAI — lo mismo que Zhipu / DeepSeek. Function calling, streaming, system messages todos estándar.
- Idioma de salida — Kimi es bilingüe pero responde por defecto en chino salvo que la directiva del prompt diga otra cosa. La misma directiva
LANGUAGE: ...que maneja GLM funciona aquí. - Rate limits — los rate limits por-cuenta de Moonshot son ajustados. Usa el default
Config.MaxConcurrent=5en el worker RCA para evitar matar de hambre al chat manual cuando pega una tormenta de alertas.
Ver también
- Zhipu (GLM) — el otro provider China-based.
- Overview de modelos.
- Routing.