DeepSeek

TL;DR

bash

ONGRID_DEEPSEEK_API_KEY=sk-...
ONGRID_DEEPSEEK_MODEL=deepseek-v4-flash     # default
ONGRID_DEEPSEEK_BASE_URL=                   # optional; defaults to api.deepseek.com/v1

Provider id: deepseek. SDK 어댑터: OpenAI 호환.

DeepSeek 의 V4 패밀리는 저렴하고 빠른 옵션. 엔드포인트는 와이어 레벨에서 OpenAI 호환.

환경 변수

Var	Default	Notes
`ONGRID_DEEPSEEK_API_KEY`	—	비어 있음 = provider 제거
`ONGRID_DEEPSEEK_MODEL`	`deepseek-v4-flash`	기본 모델
`ONGRID_DEEPSEEK_BASE_URL`	`https://api.deepseek.com/v1`	VPC 엔드포인트용 오버라이드
`ONGRID_DEEPSEEK_MODELS`	`deepseek-v4-pro,deepseek-v4-flash,deepseek-reasoner`	카탈로그 리스트

기본 카탈로그

deepseek-v4-pro — V4 패밀리의 정상; 비용의 일부로 frontier 품질에 가장 근접.
deepseek-v4-flash — 카탈로그 기본; 채팅에 권장.
deepseek-reasoner — chain-of-thought 변종. 아래 특이점 참고.

`deepseek-reasoner` 주의사항

deepseek-reasoner 는 최종 답 전에 <thinking>...</thinking> 블록을 배출. Ongrid LLM 어댑터는 이를 제거하지 않음 — 채팅 대화 로그와 RCA 보고서의 findings_md 에 나타남.

생각 블록이 렌더링되지 않길 원한다면:

채팅에 다른 모델 사용 (deepseek-v4-pro).
또는 SPA 가 기본적으로 접을 수 있는 <details> 로 래핑하므로 details[open] > summary:contains("thinking") 를 숨기는 CSS 규칙으로 대화 로그 후처리.

Reasoner 의 응답은 v4-flash 보다 느림 (chain-of-thought 가 실제 컴퓨팅). Pass-2 구조화 추출기에 사용하지 마세요 — 타임아웃이 칠 것.

DeepSeek 를 기본으로 만들기

bash

ONGRID_LLM_DEFAULT_PROVIDER=deepseek

에이전트 런타임이 investigator persona 의 호출에 대해 default-resolver 가 제공한 모델을 자동 선택; 이는 기본을 DeepSeek 로 뒤집으면 모든 자동 RCA 가 즉시 거기로 라우팅됨을 의미 — 파이프라인의 구조화 추출 절반에 대한 유사 품질에서 Claude / GPT 보다 훨씬 낮은 비용으로.

BaseURL

api.deepseek.com/v1 엔드포인트는 전역 도달 가능. SPA 에 중국 기반 태그 없음. BaseURL 오버라이드는 relay 에만 사용.

특이점

OpenAI 호환 와이어 — flat tool_calls, OpenAI 스트리밍 포맷. 어댑터는 Custom / Zhipu / Kimi / Gemini-OAI 모드와 동일.
긴 컨텍스트 — V4 는 64k 토큰 지원; Ongrid 예산 추정기가 보수적 len(text)/4 사용하므로 모델 한계에 실제로 닿기 전에 예산 거부가 보일 것.

같이 보기

모델 개요.
라우팅.
예산 — provider 전반의 총 비용을 제한하는 일일 토큰 상한.

DeepSeek ​

환경 변수 ​

기본 카탈로그 ​

deepseek-reasoner 주의사항 ​

DeepSeek 를 기본으로 만들기 ​

BaseURL ​

특이점 ​

같이 보기 ​