Skip to content

DeepSeek

TL;DR

bash
ONGRID_DEEPSEEK_API_KEY=sk-...
ONGRID_DEEPSEEK_MODEL=deepseek-v4-flash     # default
ONGRID_DEEPSEEK_BASE_URL=                   # optional; defaults to api.deepseek.com/v1

Provider id:deepseek。SDK アダプタ:OpenAI 互換。

DeepSeek の V4 ファミリーは安価で速い選択肢です。エンドポイントはワイヤー レベルで OpenAI 互換です。

環境変数

Varデフォルト注記
ONGRID_DEEPSEEK_API_KEY空 = プロバイダー除外
ONGRID_DEEPSEEK_MODELdeepseek-v4-flashデフォルトモデル
ONGRID_DEEPSEEK_BASE_URLhttps://api.deepseek.com/v1VPC エンドポイント用オーバーライド
ONGRID_DEEPSEEK_MODELSdeepseek-v4-pro,deepseek-v4-flash,deepseek-reasonerカタログリスト

デフォルトカタログ

  • deepseek-v4-pro —— V4 ファミリーの最上位、コストのほんの一部で フロンティア品質に最も近い。
  • deepseek-v4-flash —— カタログデフォルト、チャットに推奨。
  • deepseek-reasoner —— chain-of-thought 版。下のクセを参照。

deepseek-reasoner の注意点

deepseek-reasoner は最終回答の前に <thinking>...</thinking> ブロックを emit します。Ongrid LLM アダプタはこれらを剥がしません —— チャット トランスクリプトと RCA レポートの findings_md に現れます。

thinking ブロックを描画したくない場合:

  1. チャットには別のモデル(deepseek-v4-pro)を使う。
  2. または details[open] > summary:contains("thinking") を隠す CSS ルールでトランスクリプトを後処理する —— SPA はデフォルトでこれらを 折りたたみ可能な <details> でラップします。

reasoner のレスポンスは v4-flash より遅いです(chain-of-thought は 本物の計算)。Pass-2 構造化抽出器には使わないでください —— タイム アウトにヒットします。

DeepSeek をデフォルトにする

bash
ONGRID_LLM_DEFAULT_PROVIDER=deepseek

エージェントランタイムは investigator ペルソナの呼び出しに対し default-resolver が提供するモデルを自動選択します。つまりデフォルトを DeepSeek にひっくり返すと、すべての自動 RCA がそこにすぐルーティング されます —— パイプラインの構造化抽出半分に対して同等の品質で Claude / GPT より遥かに低コスト。

BaseURL

api.deepseek.com/v1 エンドポイントはグローバルに到達可能。SPA に China-based タグなし。BaseURL オーバーライドはリレー用にのみ使用。

クセ

  • OpenAI 互換ワイヤー —— フラット tool_calls、OpenAI ストリーミング フォーマット。アダプタは Custom / Zhipu / Kimi / Gemini-OAI-mode と 同じ。
  • 長コンテキスト —— V4 は 64k トークンをサポート。Ongrid バジェット 見積もりは保守的な len(text)/4 を使うので、実際にモデル制限を ヒットする前にバジェット拒否を見るでしょう。

関連