DeepSeek

TL;DR

bash

ONGRID_DEEPSEEK_API_KEY=sk-...
ONGRID_DEEPSEEK_MODEL=deepseek-v4-flash     # default
ONGRID_DEEPSEEK_BASE_URL=                   # optional; defaults to api.deepseek.com/v1

Provider id：deepseek。SDK アダプタ：OpenAI 互換。

DeepSeek の V4 ファミリーは安価で速い選択肢です。エンドポイントはワイヤーレベルで OpenAI 互換です。

環境変数

Var	デフォルト	注記
`ONGRID_DEEPSEEK_API_KEY`	—	空 = プロバイダー除外
`ONGRID_DEEPSEEK_MODEL`	`deepseek-v4-flash`	デフォルトモデル
`ONGRID_DEEPSEEK_BASE_URL`	`https://api.deepseek.com/v1`	VPC エンドポイント用オーバーライド
`ONGRID_DEEPSEEK_MODELS`	`deepseek-v4-pro,deepseek-v4-flash,deepseek-reasoner`	カタログリスト

デフォルトカタログ

deepseek-v4-pro —— V4 ファミリーの最上位、コストのほんの一部でフロンティア品質に最も近い。
deepseek-v4-flash —— カタログデフォルト、チャットに推奨。
deepseek-reasoner —— chain-of-thought 版。下のクセを参照。

`deepseek-reasoner` の注意点

deepseek-reasoner は最終回答の前に <thinking>...</thinking> ブロックを emit します。Ongrid LLM アダプタはこれらを剥がしません —— チャットトランスクリプトと RCA レポートの findings_md に現れます。

thinking ブロックを描画したくない場合：

チャットには別のモデル（deepseek-v4-pro）を使う。
または details[open] > summary:contains("thinking") を隠す CSS ルールでトランスクリプトを後処理する —— SPA はデフォルトでこれらを折りたたみ可能な <details> でラップします。

reasoner のレスポンスは v4-flash より遅いです（chain-of-thought は本物の計算）。Pass-2 構造化抽出器には使わないでください —— タイムアウトにヒットします。

DeepSeek をデフォルトにする

bash

ONGRID_LLM_DEFAULT_PROVIDER=deepseek

エージェントランタイムは investigator ペルソナの呼び出しに対し default-resolver が提供するモデルを自動選択します。つまりデフォルトを DeepSeek にひっくり返すと、すべての自動 RCA がそこにすぐルーティングされます —— パイプラインの構造化抽出半分に対して同等の品質で Claude / GPT より遥かに低コスト。

BaseURL

api.deepseek.com/v1 エンドポイントはグローバルに到達可能。SPA に China-based タグなし。BaseURL オーバーライドはリレー用にのみ使用。

クセ

OpenAI 互換ワイヤー —— フラット tool_calls、OpenAI ストリーミングフォーマット。アダプタは Custom / Zhipu / Kimi / Gemini-OAI-mode と同じ。
長コンテキスト —— V4 は 64k トークンをサポート。Ongrid バジェット見積もりは保守的な len(text)/4 を使うので、実際にモデル制限をヒットする前にバジェット拒否を見るでしょう。

DeepSeek ​

環境変数 ​

デフォルトカタログ ​

deepseek-reasoner の注意点 ​

DeepSeek をデフォルトにする ​

BaseURL ​

クセ ​

関連 ​