Kimi
TL;DR
bash
ONGRID_KIMI_API_KEY=...
ONGRID_KIMI_MODEL=kimi-k2.6 # default
ONGRID_KIMI_BASE_URL= # defaults to api.moonshot.cn/v1Provider-ID: kimi. SDK-Adapter: OpenAI-kompatibel.
Umgebungsvariablen
| Var | Default | Notizen |
|---|---|---|
ONGRID_KIMI_API_KEY | — | Leer = Provider gedroppt |
ONGRID_KIMI_MODEL | kimi-k2.6 | Standardmodell |
ONGRID_KIMI_BASE_URL | https://api.moonshot.cn/v1 | Moonshots Endpunkt |
ONGRID_KIMI_MODELS | kimi-k2.6,kimi-k2.5,moonshot-v1-128k | Katalog-Liste |
Standardkatalog
kimi-k2.6— der Katalog-Default; Moonshots aktuelles Frontier.kimi-k2.5— vorherige Generation; immer noch konkurrenzfähig in Kosten.moonshot-v1-128k— Long-Context-Variante. 128k Tokens.
China-basiert
Moonshots api.moonshot.cn-Endpunkt ist im Festland CN. Nicht-CN-Netzwerke brauchen entweder ein VPC-Peering oder ein Relay; die Settings-UI taggt das BaseURL-Feld als „China-based" neben Zhipu.
Long-Context-Tipp
moonshot-v1-128k ist das einzige Modell im Default-Katalog mit ernsthafter Kontextlänge. Verwenden Sie es für:
- Das
correlate_incident-Composite — langer Prom- + Loki- + Tempo-Result-Blob. - Wissensbasis-Suchen über lange Playbooks.
Der 10-Tool-Aufruf-Cap der Ongrid-Investigator-Persona bedeutet, dass das Prompt selten groß genug wird, um für den Routine-Pfad zu zählen; Long-Context ist für den Deep-Dive-Fall, wo Sie manuell viele Daten gezogen haben.
Kimi zum Default machen
bash
ONGRID_LLM_DEFAULT_PROVIDER=kimiEigenheiten
- OpenAI-kompatible Wire — dasselbe wie Zhipu / DeepSeek. Function-Calling, Streaming, System-Messages alle Standard.
- Output-Sprache — Kimi ist bilingual, antwortet aber standardmäßig auf Chinesisch, es sei denn, die Prompt-Direktive sagt etwas anderes. Dieselbe
LANGUAGE: ...-Direktive, die GLM handhabt, funktioniert hier. - Rate-Limits — Moonshots Per-Account-Rate-Limits sind eng. Verwenden Sie den
Config.MaxConcurrent=5-Default auf dem RCA-Worker, um manuellen Chat nicht zu verhungern, wenn ein Alarmsturm trifft.
Siehe auch
- Zhipu (GLM) — der andere China-basierte Provider.
- Modelle-Übersicht.
- Routing.