DeepSeek
TL;DR
bash
ONGRID_DEEPSEEK_API_KEY=sk-...
ONGRID_DEEPSEEK_MODEL=deepseek-v4-flash # default
ONGRID_DEEPSEEK_BASE_URL= # optional; defaults to api.deepseek.com/v1Provider id:deepseek。SDK 适配器:OpenAI 兼容。
DeepSeek 的 V4 系列是又便宜又快那个。endpoint 在 wire 层 OpenAI 兼容。
env 变量
| 变量 | 默认 | 备注 |
|---|---|---|
ONGRID_DEEPSEEK_API_KEY | — | 空 = provider 掉出 |
ONGRID_DEEPSEEK_MODEL | deepseek-v4-flash | 默认 model |
ONGRID_DEEPSEEK_BASE_URL | https://api.deepseek.com/v1 | VPC 端点覆盖 |
ONGRID_DEEPSEEK_MODELS | deepseek-v4-pro,deepseek-v4-flash,deepseek-reasoner | 目录列表 |
默认目录
deepseek-v4-pro—— V4 系列顶配;以一小部分成本接近前沿质量。deepseek-v4-flash—— 目录默认;推荐给 chat 用。deepseek-reasoner—— chain-of-thought 变体。怪癖见下。
deepseek-reasoner 注意
deepseek-reasoner 在最终答案前吐一段 <thinking>...</thinking>。Ongrid LLM 适配器不剥掉它们 —— 它们会出现在 chat 记录和 RCA 报告的 findings_md 里。
不想渲染 thinking 块的话:
- 用别的模型做 chat(
deepseek-v4-pro)。 - 或者用 CSS 规则后处理记录,隐藏
details[open] > summary:contains("thinking")—— SPA 默认把它们包到可折叠的<details>里。
reasoner 的响应比 v4-flash 慢(chain-of-thought 是真算力)。别用它做 Pass-2 结构化抽取器 —— 会超时。
把 DeepSeek 设为默认
bash
ONGRID_LLM_DEFAULT_PROVIDER=deepseekagent 运行时自动给 investigator persona 的调用用 default-resolver 提供的 模型;这意味着翻成 DeepSeek 就立即把所有自动 RCA 路由过去 —— 在管线结构化 抽取那一半上以远低于 Claude / GPT 的成本拿到差不多的质量。
BaseURL
api.deepseek.com/v1 端点全球可达。SPA 里没有 China-based 标签。BaseURL 覆盖只用于中继。
怪癖
- OpenAI 兼容 wire —— 扁平
tool_calls、OpenAI 流格式。适配器跟 Custom / Zhipu / Kimi / Gemini-OAI-mode 是同一个。 - 长上下文 —— V4 支持 64k token;Ongrid 预算估算器用保守的
len(text)/4,所以你会在实际撞模型上限之前看到预算拒绝。