Skip to content

Kimi

TL;DR

bash
ONGRID_KIMI_API_KEY=...
ONGRID_KIMI_MODEL=kimi-k2.6                 # padrão
ONGRID_KIMI_BASE_URL=                       # padrão api.moonshot.cn/v1

Provider id: kimi. Adapter SDK: compatível com OpenAI.

Env vars

VarPadrãoNotas
ONGRID_KIMI_API_KEYVazio = provider removido
ONGRID_KIMI_MODELkimi-k2.6Modelo padrão
ONGRID_KIMI_BASE_URLhttps://api.moonshot.cn/v1Endpoint do Moonshot
ONGRID_KIMI_MODELSkimi-k2.6,kimi-k2.5,moonshot-v1-128kLista do catálogo

Catálogo padrão

  • kimi-k2.6 — o padrão do catálogo; frontier atual do Moonshot.
  • kimi-k2.5 — geração anterior; ainda competitiva em custo.
  • moonshot-v1-128k — variante de long-context. 128k tokens.

China-based

O endpoint api.moonshot.cn do Moonshot está na China continental. Redes não-CN precisam ou de VPC peering ou um relay; a UI de Settings marca o campo de BaseURL como "China-based" junto com Zhipu.

Dica de long-context

moonshot-v1-128k é o único modelo no catálogo padrão com comprimento de contexto sério. Use para:

  • O composto correlate_incident — blob longo de resultado Prom
    • Loki + Tempo.
  • Buscas na base de conhecimento sobre playbooks longos.

O cap de 10 chamadas de tool da persona investigator do Ongrid significa que o prompt raramente fica grande o bastante para importar no caminho rotineiro; long-context é para o caso de deep-dive onde você puxou muitos dados manualmente.

Tornando o Kimi o padrão

bash
ONGRID_LLM_DEFAULT_PROVIDER=kimi

Pegadinhas

  • Wire compatível com OpenAI — igual a Zhipu / DeepSeek. Function calling, streaming, system messages todos padrão.
  • Idioma de saída — Kimi é bilíngue mas tem padrão em respostas em chinês a menos que a diretiva do prompt diga o contrário. A mesma diretiva LANGUAGE: ... que trata o GLM funciona aqui.
  • Rate limits — os rate limits por-conta do Moonshot são apertados. Use o Config.MaxConcurrent=5 padrão no worker do RCA para evitar matar de fome o chat manual quando uma tempestade de alerta bate.

Veja também