DeepSeek
TL;DR
bash
ONGRID_DEEPSEEK_API_KEY=sk-...
ONGRID_DEEPSEEK_MODEL=deepseek-v4-flash # default
ONGRID_DEEPSEEK_BASE_URL= # optional; defaults to api.deepseek.com/v1Provider id: deepseek. SDK 어댑터: OpenAI 호환.
DeepSeek 의 V4 패밀리는 저렴하고 빠른 옵션. 엔드포인트는 와이어 레벨에서 OpenAI 호환.
환경 변수
| Var | Default | Notes |
|---|---|---|
ONGRID_DEEPSEEK_API_KEY | — | 비어 있음 = provider 제거 |
ONGRID_DEEPSEEK_MODEL | deepseek-v4-flash | 기본 모델 |
ONGRID_DEEPSEEK_BASE_URL | https://api.deepseek.com/v1 | VPC 엔드포인트용 오버라이드 |
ONGRID_DEEPSEEK_MODELS | deepseek-v4-pro,deepseek-v4-flash,deepseek-reasoner | 카탈로그 리스트 |
기본 카탈로그
deepseek-v4-pro— V4 패밀리의 정상; 비용의 일부로 frontier 품질에 가장 근접.deepseek-v4-flash— 카탈로그 기본; 채팅에 권장.deepseek-reasoner— chain-of-thought 변종. 아래 특이점 참고.
deepseek-reasoner 주의사항
deepseek-reasoner 는 최종 답 전에 <thinking>...</thinking> 블록을 배출. Ongrid LLM 어댑터는 이를 제거하지 않음 — 채팅 대화 로그와 RCA 보고서의 findings_md 에 나타남.
생각 블록이 렌더링되지 않길 원한다면:
- 채팅에 다른 모델 사용 (
deepseek-v4-pro). - 또는 SPA 가 기본적으로 접을 수 있는
<details>로 래핑하므로details[open] > summary:contains("thinking")를 숨기는 CSS 규칙으로 대화 로그 후처리.
Reasoner 의 응답은 v4-flash 보다 느림 (chain-of-thought 가 실제 컴퓨팅). Pass-2 구조화 추출기에 사용하지 마세요 — 타임아웃이 칠 것.
DeepSeek 를 기본으로 만들기
bash
ONGRID_LLM_DEFAULT_PROVIDER=deepseek에이전트 런타임이 investigator persona 의 호출에 대해 default-resolver 가 제공한 모델을 자동 선택; 이는 기본을 DeepSeek 로 뒤집으면 모든 자동 RCA 가 즉시 거기로 라우팅됨을 의미 — 파이프라인의 구조화 추출 절반에 대한 유사 품질에서 Claude / GPT 보다 훨씬 낮은 비용으로.
BaseURL
api.deepseek.com/v1 엔드포인트는 전역 도달 가능. SPA 에 중국 기반 태그 없음. BaseURL 오버라이드는 relay 에만 사용.
특이점
- OpenAI 호환 와이어 — flat
tool_calls, OpenAI 스트리밍 포맷. 어댑터는 Custom / Zhipu / Kimi / Gemini-OAI 모드와 동일. - 긴 컨텍스트 — V4 는 64k 토큰 지원; Ongrid 예산 추정기가 보수적
len(text)/4사용하므로 모델 한계에 실제로 닿기 전에 예산 거부가 보일 것.