Kimi
TL;DR
bash
ONGRID_KIMI_API_KEY=...
ONGRID_KIMI_MODEL=kimi-k2.6 # default
ONGRID_KIMI_BASE_URL= # defaults to api.moonshot.cn/v1Provider id: kimi. SDK 어댑터: OpenAI 호환.
환경 변수
| Var | Default | Notes |
|---|---|---|
ONGRID_KIMI_API_KEY | — | 비어 있음 = provider 제거 |
ONGRID_KIMI_MODEL | kimi-k2.6 | 기본 모델 |
ONGRID_KIMI_BASE_URL | https://api.moonshot.cn/v1 | Moonshot 의 엔드포인트 |
ONGRID_KIMI_MODELS | kimi-k2.6,kimi-k2.5,moonshot-v1-128k | 카탈로그 리스트 |
기본 카탈로그
kimi-k2.6— 카탈로그 기본; Moonshot 의 현재 frontier.kimi-k2.5— 이전 세대; 비용에서 여전히 경쟁력 있음.moonshot-v1-128k— 긴 컨텍스트 변종. 128k 토큰.
중국 기반
Moonshot 의 api.moonshot.cn 엔드포인트는 중국 본토에. 비 CN 네트워크 는 VPC 피어링 또는 relay 필요; Settings UI 는 BaseURL 필드를 Zhipu 와 함께 "중국 기반" 으로 태그.
긴 컨텍스트 팁
moonshot-v1-128k 는 기본 카탈로그에서 진지한 컨텍스트 길이를 가진 유일한 모델. 다음 용도:
correlate_incidentcomposite — 긴 Prom + Loki + Tempo 결과 blob.- 긴 플레이북에 대한 지식 베이스 검색.
Ongrid investigator persona 의 10 도구 호출 상한은 prompt 가 일상 경로 에 영향 줄 만큼 커지는 일이 드묾을 의미; 긴 컨텍스트는 많은 데이터를 수동으로 풀한 심층 분석 케이스 용.
Kimi 를 기본으로 만들기
bash
ONGRID_LLM_DEFAULT_PROVIDER=kimi특이점
- OpenAI 호환 와이어 — Zhipu / DeepSeek 와 동일. function calling, 스트리밍, system 메시지 모두 표준.
- 출력 언어 — Kimi 는 이중 언어이지만 prompt 지시가 말하지 않는 한 중국어 응답 기본. GLM 을 처리하는 같은
LANGUAGE: ...지시가 여기서도 동작. - Rate limit — Moonshot 의 계정별 rate limit 이 빡빡. 알림 폭풍이 칠 때 수동 채팅을 굶주리지 않게 RCA worker 에
Config.MaxConcurrent=5기본 사용.
같이 보기
- Zhipu (GLM) — 다른 중국 기반 provider.
- 모델 개요.
- 라우팅.