Skip to content

DeepSeek

TL;DR

bash
ONGRID_DEEPSEEK_API_KEY=sk-...
ONGRID_DEEPSEEK_MODEL=deepseek-v4-flash     # default
ONGRID_DEEPSEEK_BASE_URL=                   # optional; defaults to api.deepseek.com/v1

Provider id:deepseek。SDK 适配器:OpenAI 兼容。

DeepSeek 的 V4 系列是又便宜又快那个。endpoint 在 wire 层 OpenAI 兼容。

env 变量

变量默认备注
ONGRID_DEEPSEEK_API_KEY空 = provider 掉出
ONGRID_DEEPSEEK_MODELdeepseek-v4-flash默认 model
ONGRID_DEEPSEEK_BASE_URLhttps://api.deepseek.com/v1VPC 端点覆盖
ONGRID_DEEPSEEK_MODELSdeepseek-v4-pro,deepseek-v4-flash,deepseek-reasoner目录列表

默认目录

  • deepseek-v4-pro —— V4 系列顶配;以一小部分成本接近前沿质量。
  • deepseek-v4-flash —— 目录默认;推荐给 chat 用。
  • deepseek-reasoner —— chain-of-thought 变体。怪癖见下。

deepseek-reasoner 注意

deepseek-reasoner 在最终答案前吐一段 <thinking>...</thinking>。Ongrid LLM 适配器剥掉它们 —— 它们会出现在 chat 记录和 RCA 报告的 findings_md 里。

不想渲染 thinking 块的话:

  1. 用别的模型做 chat(deepseek-v4-pro)。
  2. 或者用 CSS 规则后处理记录,隐藏 details[open] > summary:contains("thinking") —— SPA 默认把它们包到可折叠的 <details> 里。

reasoner 的响应比 v4-flash 慢(chain-of-thought 是真算力)。别用它做 Pass-2 结构化抽取器 —— 会超时。

把 DeepSeek 设为默认

bash
ONGRID_LLM_DEFAULT_PROVIDER=deepseek

agent 运行时自动给 investigator persona 的调用用 default-resolver 提供的 模型;这意味着翻成 DeepSeek 就立即把所有自动 RCA 路由过去 —— 在管线结构化 抽取那一半上以远低于 Claude / GPT 的成本拿到差不多的质量。

BaseURL

api.deepseek.com/v1 端点全球可达。SPA 里没有 China-based 标签。BaseURL 覆盖只用于中继。

怪癖

  • OpenAI 兼容 wire —— 扁平 tool_calls、OpenAI 流格式。适配器跟 Custom / Zhipu / Kimi / Gemini-OAI-mode 是同一个。
  • 长上下文 —— V4 支持 64k token;Ongrid 预算估算器用保守的 len(text)/4,所以你会在实际撞模型上限之前看到预算拒绝。

另见