DeepSeek

TL;DR

bash

ONGRID_DEEPSEEK_API_KEY=sk-...
ONGRID_DEEPSEEK_MODEL=deepseek-v4-flash     # default
ONGRID_DEEPSEEK_BASE_URL=                   # optional; defaults to api.deepseek.com/v1

Provider id : deepseek. Adaptateur SDK : compatible OpenAI.

La famille V4 de DeepSeek est l'option bon-marché-et-rapide. L'endpoint est compatible OpenAI au niveau wire.

Variables d'env

Variable	Défaut	Notes
`ONGRID_DEEPSEEK_API_KEY`	—	Vide = provider retiré
`ONGRID_DEEPSEEK_MODEL`	`deepseek-v4-flash`	Modèle par défaut
`ONGRID_DEEPSEEK_BASE_URL`	`https://api.deepseek.com/v1`	Override pour endpoints VPC
`ONGRID_DEEPSEEK_MODELS`	`deepseek-v4-pro,deepseek-v4-flash,deepseek-reasoner`	Liste de catalogue

Catalogue par défaut

deepseek-v4-pro — top de la famille V4 ; le plus proche de la qualité frontière à une fraction du coût.
deepseek-v4-flash — le défaut du catalogue ; recommandé pour le chat.
deepseek-reasoner — variante chain-of-thought. Voir particularités ci-dessous.

Particularités de `deepseek-reasoner`

deepseek-reasoner émet un bloc <thinking>...</thinking> avant sa réponse finale. L'adaptateur LLM d'Ongrid ne les retire PAS — ils apparaissent dans la transcription de chat et dans le findings_md du rapport RCA.

Si vous ne voulez pas que les blocs thinking soient rendus :

Utilisez un modèle différent pour le chat (deepseek-v4-pro).
Ou post-traitez la transcription avec une règle CSS qui cache details[open] > summary:contains("thinking") — la SPA les enveloppe dans des <details> pliables par défaut.

La réponse du reasoner est plus lente que v4-flash (le chain-of-thought est du vrai compute). Ne l'utilisez pas pour l'extracteur structuré Pass-2 — le timeout va frapper.

Faire de DeepSeek le défaut

bash

ONGRID_LLM_DEFAULT_PROVIDER=deepseek

Le runtime de l'agent auto-choisit le modèle fourni par le default-resolver pour les appels de la persona investigator ; ça veut dire que basculer le défaut vers DeepSeek route immédiatement tous les auto-RCAs là — à un coût bien moindre que Claude / GPT pour une qualité similaire sur la moitié extraction structurée du pipeline.

BaseURL

L'endpoint api.deepseek.com/v1 est globalement joignable. Pas de tag China-based dans la SPA. Utilisez l'override BaseURL seulement pour les relais.

Particularités

Wire compatible OpenAI — tool_calls plat, format de streaming OpenAI. L'adaptateur est le même que pour Custom / Zhipu / Kimi / Gemini-OAI-mode.
Long contexte — V4 supporte 64k tokens ; l'estimateur de budget d'Ongrid utilise un len(text)/4 conservateur donc vous verrez le budget rejeter avant de toucher réellement la limite du modèle.

Voir aussi

Aperçu des modèles.
Routing.
Budget — le plafond de tokens par jour qui borne le coût total à travers les providers.

DeepSeek ​

Variables d'env ​

Catalogue par défaut ​

Particularités de deepseek-reasoner ​

Faire de DeepSeek le défaut ​

BaseURL ​

Particularités ​

Voir aussi ​