Kimi

TL;DR

bash

ONGRID_KIMI_API_KEY=...
ONGRID_KIMI_MODEL=kimi-k2.6                 # padrão
ONGRID_KIMI_BASE_URL=                       # padrão api.moonshot.cn/v1

Provider id: kimi. Adapter SDK: compatível com OpenAI.

Env vars

Var	Padrão	Notas
`ONGRID_KIMI_API_KEY`	—	Vazio = provider removido
`ONGRID_KIMI_MODEL`	`kimi-k2.6`	Modelo padrão
`ONGRID_KIMI_BASE_URL`	`https://api.moonshot.cn/v1`	Endpoint do Moonshot
`ONGRID_KIMI_MODELS`	`kimi-k2.6,kimi-k2.5,moonshot-v1-128k`	Lista do catálogo

Catálogo padrão

kimi-k2.6 — o padrão do catálogo; frontier atual do Moonshot.
kimi-k2.5 — geração anterior; ainda competitiva em custo.
moonshot-v1-128k — variante de long-context. 128k tokens.

China-based

O endpoint api.moonshot.cn do Moonshot está na China continental. Redes não-CN precisam ou de VPC peering ou um relay; a UI de Settings marca o campo de BaseURL como "China-based" junto com Zhipu.

Dica de long-context

moonshot-v1-128k é o único modelo no catálogo padrão com comprimento de contexto sério. Use para:

O composto correlate_incident — blob longo de resultado Prom
- Loki + Tempo.
Buscas na base de conhecimento sobre playbooks longos.

O cap de 10 chamadas de tool da persona investigator do Ongrid significa que o prompt raramente fica grande o bastante para importar no caminho rotineiro; long-context é para o caso de deep-dive onde você puxou muitos dados manualmente.

Tornando o Kimi o padrão

bash

ONGRID_LLM_DEFAULT_PROVIDER=kimi

Pegadinhas

Wire compatível com OpenAI — igual a Zhipu / DeepSeek. Function calling, streaming, system messages todos padrão.
Idioma de saída — Kimi é bilíngue mas tem padrão em respostas em chinês a menos que a diretiva do prompt diga o contrário. A mesma diretiva LANGUAGE: ... que trata o GLM funciona aqui.
Rate limits — os rate limits por-conta do Moonshot são apertados. Use o Config.MaxConcurrent=5 padrão no worker do RCA para evitar matar de fome o chat manual quando uma tempestade de alerta bate.

Veja também

Zhipu (GLM) — o outro provider China-based.
Visão geral dos modelos.
Roteamento.

Kimi ​

Env vars ​

Catálogo padrão ​

China-based ​

Dica de long-context ​

Tornando o Kimi o padrão ​

Pegadinhas ​

Veja também ​