Skip to content

Kimi

TL;DR

bash
ONGRID_KIMI_API_KEY=...
ONGRID_KIMI_MODEL=kimi-k2.6                 # default
ONGRID_KIMI_BASE_URL=                       # defaults to api.moonshot.cn/v1

Provider id: kimi. SDK 어댑터: OpenAI 호환.

환경 변수

VarDefaultNotes
ONGRID_KIMI_API_KEY비어 있음 = provider 제거
ONGRID_KIMI_MODELkimi-k2.6기본 모델
ONGRID_KIMI_BASE_URLhttps://api.moonshot.cn/v1Moonshot 의 엔드포인트
ONGRID_KIMI_MODELSkimi-k2.6,kimi-k2.5,moonshot-v1-128k카탈로그 리스트

기본 카탈로그

  • kimi-k2.6 — 카탈로그 기본; Moonshot 의 현재 frontier.
  • kimi-k2.5 — 이전 세대; 비용에서 여전히 경쟁력 있음.
  • moonshot-v1-128k — 긴 컨텍스트 변종. 128k 토큰.

중국 기반

Moonshot 의 api.moonshot.cn 엔드포인트는 중국 본토에. 비 CN 네트워크 는 VPC 피어링 또는 relay 필요; Settings UI 는 BaseURL 필드를 Zhipu 와 함께 "중국 기반" 으로 태그.

긴 컨텍스트 팁

moonshot-v1-128k 는 기본 카탈로그에서 진지한 컨텍스트 길이를 가진 유일한 모델. 다음 용도:

  • correlate_incident composite — 긴 Prom + Loki + Tempo 결과 blob.
  • 긴 플레이북에 대한 지식 베이스 검색.

Ongrid investigator persona 의 10 도구 호출 상한은 prompt 가 일상 경로 에 영향 줄 만큼 커지는 일이 드묾을 의미; 긴 컨텍스트는 많은 데이터를 수동으로 풀한 심층 분석 케이스 용.

Kimi 를 기본으로 만들기

bash
ONGRID_LLM_DEFAULT_PROVIDER=kimi

특이점

  • OpenAI 호환 와이어 — Zhipu / DeepSeek 와 동일. function calling, 스트리밍, system 메시지 모두 표준.
  • 출력 언어 — Kimi 는 이중 언어이지만 prompt 지시가 말하지 않는 한 중국어 응답 기본. GLM 을 처리하는 같은 LANGUAGE: ... 지시가 여기서도 동작.
  • Rate limit — Moonshot 의 계정별 rate limit 이 빡빡. 알림 폭풍이 칠 때 수동 채팅을 굶주리지 않게 RCA worker 에 Config.MaxConcurrent=5 기본 사용.

같이 보기