Skip to content

Kimi

TL;DR

bash
ONGRID_KIMI_API_KEY=...
ONGRID_KIMI_MODEL=kimi-k2.6                 # default
ONGRID_KIMI_BASE_URL=                       # defaults to api.moonshot.cn/v1

Provider id:kimi。SDK 适配器:OpenAI 兼容。

env 变量

变量默认备注
ONGRID_KIMI_API_KEY空 = provider 掉出
ONGRID_KIMI_MODELkimi-k2.6默认 model
ONGRID_KIMI_BASE_URLhttps://api.moonshot.cn/v1Moonshot 的端点
ONGRID_KIMI_MODELSkimi-k2.6,kimi-k2.5,moonshot-v1-128k目录列表

默认目录

  • kimi-k2.6 —— 目录默认;Moonshot 当前的前沿。
  • kimi-k2.5 —— 上一代;成本上仍有竞争力。
  • moonshot-v1-128k —— 长上下文变体。128k token。

China-based

Moonshot api.moonshot.cn 端点在中国大陆。非 CN 网络需要 VPC peering 或 中继;Settings UI 把 BaseURL 字段连同 Zhipu 一起标 "China-based"。

长上下文建议

moonshot-v1-128k 是默认目录里唯一上下文长度认真的模型。用在:

  • correlate_incident 复合 —— 长 Prom + Loki + Tempo 结果大块。
  • 在长 playbook 上做知识库搜索。

Ongrid investigator persona 的 10 tool 调用上限让 prompt 在常规路径上很少 大到要紧;长上下文是给你手动拉了一堆数据的深挖场景留的。

把 Kimi 设为默认

bash
ONGRID_LLM_DEFAULT_PROVIDER=kimi

怪癖

  • OpenAI 兼容 wire —— 跟 Zhipu / DeepSeek 一样。函数调用、流式、system 消息全标准。
  • 输出语言 —— Kimi 双语但默认中文响应,除非 prompt 指令说别的。处理 GLM 的同一个 LANGUAGE: ... 指令在这也工作。
  • 限流 —— Moonshot 按账号限流挺紧。RCA worker 上保持 Config.MaxConcurrent=5 默认,免得告警风暴时把手动 chat 饿死。

另见