Kimi
TL;DR
bash
ONGRID_KIMI_API_KEY=...
ONGRID_KIMI_MODEL=kimi-k2.6 # default
ONGRID_KIMI_BASE_URL= # defaults to api.moonshot.cn/v1Provider id:kimi。SDK 适配器:OpenAI 兼容。
env 变量
| 变量 | 默认 | 备注 |
|---|---|---|
ONGRID_KIMI_API_KEY | — | 空 = provider 掉出 |
ONGRID_KIMI_MODEL | kimi-k2.6 | 默认 model |
ONGRID_KIMI_BASE_URL | https://api.moonshot.cn/v1 | Moonshot 的端点 |
ONGRID_KIMI_MODELS | kimi-k2.6,kimi-k2.5,moonshot-v1-128k | 目录列表 |
默认目录
kimi-k2.6—— 目录默认;Moonshot 当前的前沿。kimi-k2.5—— 上一代;成本上仍有竞争力。moonshot-v1-128k—— 长上下文变体。128k token。
China-based
Moonshot api.moonshot.cn 端点在中国大陆。非 CN 网络需要 VPC peering 或 中继;Settings UI 把 BaseURL 字段连同 Zhipu 一起标 "China-based"。
长上下文建议
moonshot-v1-128k 是默认目录里唯一上下文长度认真的模型。用在:
correlate_incident复合 —— 长 Prom + Loki + Tempo 结果大块。- 在长 playbook 上做知识库搜索。
Ongrid investigator persona 的 10 tool 调用上限让 prompt 在常规路径上很少 大到要紧;长上下文是给你手动拉了一堆数据的深挖场景留的。
把 Kimi 设为默认
bash
ONGRID_LLM_DEFAULT_PROVIDER=kimi怪癖
- OpenAI 兼容 wire —— 跟 Zhipu / DeepSeek 一样。函数调用、流式、system 消息全标准。
- 输出语言 —— Kimi 双语但默认中文响应,除非 prompt 指令说别的。处理 GLM 的同一个
LANGUAGE: ...指令在这也工作。 - 限流 —— Moonshot 按账号限流挺紧。RCA worker 上保持
Config.MaxConcurrent=5默认,免得告警风暴时把手动 chat 饿死。
另见
- Zhipu(GLM) —— 另一个 China-based provider。
- 模型概览。
- 路由。