DeepSeek

TL;DR

bash

ONGRID_DEEPSEEK_API_KEY=sk-...
ONGRID_DEEPSEEK_MODEL=deepseek-v4-flash     # default
ONGRID_DEEPSEEK_BASE_URL=                   # optional; defaults to api.deepseek.com/v1

Provider id：deepseek。SDK 适配器：OpenAI 兼容。

DeepSeek 的 V4 系列是又便宜又快那个。endpoint 在 wire 层 OpenAI 兼容。

env 变量

变量	默认	备注
`ONGRID_DEEPSEEK_API_KEY`	—	空 = provider 掉出
`ONGRID_DEEPSEEK_MODEL`	`deepseek-v4-flash`	默认 model
`ONGRID_DEEPSEEK_BASE_URL`	`https://api.deepseek.com/v1`	VPC 端点覆盖
`ONGRID_DEEPSEEK_MODELS`	`deepseek-v4-pro,deepseek-v4-flash,deepseek-reasoner`	目录列表

默认目录

deepseek-v4-pro —— V4 系列顶配；以一小部分成本接近前沿质量。
deepseek-v4-flash —— 目录默认；推荐给 chat 用。
deepseek-reasoner —— chain-of-thought 变体。怪癖见下。

`deepseek-reasoner` 注意

deepseek-reasoner 在最终答案前吐一段 <thinking>...</thinking>。Ongrid LLM 适配器不剥掉它们 —— 它们会出现在 chat 记录和 RCA 报告的 findings_md 里。

不想渲染 thinking 块的话：

用别的模型做 chat（deepseek-v4-pro）。
或者用 CSS 规则后处理记录，隐藏 details[open] > summary:contains("thinking") —— SPA 默认把它们包到可折叠的 <details> 里。

reasoner 的响应比 v4-flash 慢（chain-of-thought 是真算力）。别用它做 Pass-2 结构化抽取器 —— 会超时。

把 DeepSeek 设为默认

bash

ONGRID_LLM_DEFAULT_PROVIDER=deepseek

agent 运行时自动给 investigator persona 的调用用 default-resolver 提供的模型；这意味着翻成 DeepSeek 就立即把所有自动 RCA 路由过去 —— 在管线结构化抽取那一半上以远低于 Claude / GPT 的成本拿到差不多的质量。

BaseURL

api.deepseek.com/v1 端点全球可达。SPA 里没有 China-based 标签。BaseURL 覆盖只用于中继。

怪癖

OpenAI 兼容 wire —— 扁平 tool_calls、OpenAI 流格式。适配器跟 Custom / Zhipu / Kimi / Gemini-OAI-mode 是同一个。
长上下文 —— V4 支持 64k token；Ongrid 预算估算器用保守的 len(text)/4，所以你会在实际撞模型上限之前看到预算拒绝。

另见

模型概览。
路由。
预算 —— 跨 provider 约束总成本的每日 token 上限。

DeepSeek ​

env 变量 ​

默认目录 ​

deepseek-reasoner 注意 ​

把 DeepSeek 设为默认 ​

BaseURL ​

怪癖 ​

另见 ​