Kimi
TL;DR
bash
ONGRID_KIMI_API_KEY=...
ONGRID_KIMI_MODEL=kimi-k2.6 # default
ONGRID_KIMI_BASE_URL= # defaults to api.moonshot.cn/v1Provider id : kimi. Adaptateur SDK : compatible OpenAI.
Variables d'env
| Variable | Défaut | Notes |
|---|---|---|
ONGRID_KIMI_API_KEY | — | Vide = provider retiré |
ONGRID_KIMI_MODEL | kimi-k2.6 | Modèle par défaut |
ONGRID_KIMI_BASE_URL | https://api.moonshot.cn/v1 | Endpoint de Moonshot |
ONGRID_KIMI_MODELS | kimi-k2.6,kimi-k2.5,moonshot-v1-128k | Liste de catalogue |
Catalogue par défaut
kimi-k2.6— le défaut du catalogue ; frontier actuel de Moonshot.kimi-k2.5— génération précédente ; encore compétitive sur le coût.moonshot-v1-128k— variante long-contexte. 128k tokens.
China-based
L'endpoint api.moonshot.cn de Moonshot est en Chine continentale. Les réseaux non-CN ont besoin soit d'un peering VPC soit d'un relais ; l'UI Settings tag le champ BaseURL comme « China-based » aux côtés de Zhipu.
Astuce long-contexte
moonshot-v1-128k est le seul modèle du catalogue par défaut avec une longueur de contexte sérieuse. Utilisez-le pour :
- Le composite
correlate_incident— gros blob de résultats Prom + Loki + Tempo. - Recherches base-de-connaissances sur de longs playbooks.
Le plafond à 10 appels d'outils de la persona investigator d'Ongrid signifie que le prompt devient rarement assez gros pour importer sur le chemin de routine ; le long-contexte est pour le cas de plongée profonde où vous avez manuellement tiré beaucoup de données.
Faire de Kimi le défaut
bash
ONGRID_LLM_DEFAULT_PROVIDER=kimiParticularités
- Wire compatible OpenAI — pareil que Zhipu / DeepSeek. Function calling, streaming, messages système tous standard.
- Langue de sortie — Kimi est bilingue mais retombe par défaut sur des réponses en chinois sauf si la directive du prompt dit autrement. La même directive
LANGUAGE: ...qui gère GLM marche ici. - Rate limits — les rate limits par compte de Moonshot sont serrées. Utilisez le défaut
Config.MaxConcurrent=5sur le worker RCA pour éviter d'affamer le chat manuel quand une tempête d'alertes frappe.
Voir aussi
- Zhipu (GLM) — l'autre provider China-based.
- Aperçu des modèles.
- Routing.