Kimi
TL;DR
bash
ONGRID_KIMI_API_KEY=...
ONGRID_KIMI_MODEL=kimi-k2.6 # padrão
ONGRID_KIMI_BASE_URL= # padrão api.moonshot.cn/v1Provider id: kimi. Adapter SDK: compatível com OpenAI.
Env vars
| Var | Padrão | Notas |
|---|---|---|
ONGRID_KIMI_API_KEY | — | Vazio = provider removido |
ONGRID_KIMI_MODEL | kimi-k2.6 | Modelo padrão |
ONGRID_KIMI_BASE_URL | https://api.moonshot.cn/v1 | Endpoint do Moonshot |
ONGRID_KIMI_MODELS | kimi-k2.6,kimi-k2.5,moonshot-v1-128k | Lista do catálogo |
Catálogo padrão
kimi-k2.6— o padrão do catálogo; frontier atual do Moonshot.kimi-k2.5— geração anterior; ainda competitiva em custo.moonshot-v1-128k— variante de long-context. 128k tokens.
China-based
O endpoint api.moonshot.cn do Moonshot está na China continental. Redes não-CN precisam ou de VPC peering ou um relay; a UI de Settings marca o campo de BaseURL como "China-based" junto com Zhipu.
Dica de long-context
moonshot-v1-128k é o único modelo no catálogo padrão com comprimento de contexto sério. Use para:
- O composto
correlate_incident— blob longo de resultado Prom- Loki + Tempo.
- Buscas na base de conhecimento sobre playbooks longos.
O cap de 10 chamadas de tool da persona investigator do Ongrid significa que o prompt raramente fica grande o bastante para importar no caminho rotineiro; long-context é para o caso de deep-dive onde você puxou muitos dados manualmente.
Tornando o Kimi o padrão
bash
ONGRID_LLM_DEFAULT_PROVIDER=kimiPegadinhas
- Wire compatível com OpenAI — igual a Zhipu / DeepSeek. Function calling, streaming, system messages todos padrão.
- Idioma de saída — Kimi é bilíngue mas tem padrão em respostas em chinês a menos que a diretiva do prompt diga o contrário. A mesma diretiva
LANGUAGE: ...que trata o GLM funciona aqui. - Rate limits — os rate limits por-conta do Moonshot são apertados. Use o
Config.MaxConcurrent=5padrão no worker do RCA para evitar matar de fome o chat manual quando uma tempestade de alerta bate.
Veja também
- Zhipu (GLM) — o outro provider China-based.
- Visão geral dos modelos.
- Roteamento.