Skip to content

DeepSeek

TL;DR

bash
ONGRID_DEEPSEEK_API_KEY=sk-...
ONGRID_DEEPSEEK_MODEL=deepseek-v4-flash     # default
ONGRID_DEEPSEEK_BASE_URL=                   # optional; defaults to api.deepseek.com/v1

Provider-ID: deepseek. SDK-Adapter: OpenAI-kompatibel.

DeepSeeks V4-Familie ist die günstig-und-schnell-Option. Der Endpunkt ist auf Wire-Level OpenAI-kompatibel.

Umgebungsvariablen

VarDefaultNotizen
ONGRID_DEEPSEEK_API_KEYLeer = Provider gedroppt
ONGRID_DEEPSEEK_MODELdeepseek-v4-flashStandardmodell
ONGRID_DEEPSEEK_BASE_URLhttps://api.deepseek.com/v1Override für VPC-Endpunkte
ONGRID_DEEPSEEK_MODELSdeepseek-v4-pro,deepseek-v4-flash,deepseek-reasonerKatalog-Liste

Standardkatalog

  • deepseek-v4-pro — Top der V4-Familie; am nächsten an Frontier-Qualität bei einem Bruchteil der Kosten.
  • deepseek-v4-flash — der Katalog-Default; empfohlen für Chat.
  • deepseek-reasoner — Chain-of-Thought-Variante. Siehe Eigenheiten unten.

deepseek-reasoner-Vorbehalte

deepseek-reasoner emittiert einen <thinking>...</thinking>-Block vor seiner finalen Antwort. Der Ongrid-LLM-Adapter strippt diese NICHT — sie erscheinen im Chat-Transkript und im findings_md des RCA-Reports.

Wenn Sie die Thinking-Blöcke nicht gerendert haben möchten:

  1. Verwenden Sie ein anderes Modell für Chat (deepseek-v4-pro).
  2. Oder post-prozessieren Sie das Transkript mit einer CSS-Regel, die details[open] > summary:contains("thinking") versteckt — die SPA wickelt sie standardmäßig in kollabierbare <details> ein.

Die Antwort des Reasoners ist langsamer als v4-flash (die Chain-of-Thought ist echtes Computing). Verwenden Sie ihn nicht für den Pass-2-strukturierten-Extraktor — der Timeout trifft.

DeepSeek zum Default machen

bash
ONGRID_LLM_DEFAULT_PROVIDER=deepseek

Die Agent-Runtime wählt das vom Default-Resolver gelieferte Modell für die Aufrufe der Investigator-Persona automatisch; das heißt, den Default auf DeepSeek umzuschalten routet sofort alle Auto-RCAs dorthin — zu viel niedrigeren Kosten als Claude / GPT bei ähnlicher Qualität auf der strukturierten-Extraktion-Hälfte der Pipeline.

BaseURL

Der api.deepseek.com/v1-Endpunkt ist global erreichbar. Kein China-basierter Tag in der SPA. Verwenden Sie BaseURL-Override nur für Relays.

Eigenheiten

  • OpenAI-kompatible Wire — Flat-tool_calls, OpenAI-Streaming-Format. Der Adapter ist derselbe wie für Custom / Zhipu / Kimi / Gemini-OAI-Mode.
  • Langer Kontext — V4 unterstützt 64k Tokens; der Ongrid-Budget-Schätzer verwendet ein konservatives len(text)/4, sodass Sie das Budget ablehnen sehen, bevor Sie tatsächlich das Modell-Limit treffen.

Siehe auch