DeepSeek
TL;DR
bash
ONGRID_DEEPSEEK_API_KEY=sk-...
ONGRID_DEEPSEEK_MODEL=deepseek-v4-flash # default
ONGRID_DEEPSEEK_BASE_URL= # optional; defaults to api.deepseek.com/v1Provider id:deepseek。SDK アダプタ:OpenAI 互換。
DeepSeek の V4 ファミリーは安価で速い選択肢です。エンドポイントはワイヤー レベルで OpenAI 互換です。
環境変数
| Var | デフォルト | 注記 |
|---|---|---|
ONGRID_DEEPSEEK_API_KEY | — | 空 = プロバイダー除外 |
ONGRID_DEEPSEEK_MODEL | deepseek-v4-flash | デフォルトモデル |
ONGRID_DEEPSEEK_BASE_URL | https://api.deepseek.com/v1 | VPC エンドポイント用オーバーライド |
ONGRID_DEEPSEEK_MODELS | deepseek-v4-pro,deepseek-v4-flash,deepseek-reasoner | カタログリスト |
デフォルトカタログ
deepseek-v4-pro—— V4 ファミリーの最上位、コストのほんの一部で フロンティア品質に最も近い。deepseek-v4-flash—— カタログデフォルト、チャットに推奨。deepseek-reasoner—— chain-of-thought 版。下のクセを参照。
deepseek-reasoner の注意点
deepseek-reasoner は最終回答の前に <thinking>...</thinking> ブロックを emit します。Ongrid LLM アダプタはこれらを剥がしません —— チャット トランスクリプトと RCA レポートの findings_md に現れます。
thinking ブロックを描画したくない場合:
- チャットには別のモデル(
deepseek-v4-pro)を使う。 - または
details[open] > summary:contains("thinking")を隠す CSS ルールでトランスクリプトを後処理する —— SPA はデフォルトでこれらを 折りたたみ可能な<details>でラップします。
reasoner のレスポンスは v4-flash より遅いです(chain-of-thought は 本物の計算)。Pass-2 構造化抽出器には使わないでください —— タイム アウトにヒットします。
DeepSeek をデフォルトにする
bash
ONGRID_LLM_DEFAULT_PROVIDER=deepseekエージェントランタイムは investigator ペルソナの呼び出しに対し default-resolver が提供するモデルを自動選択します。つまりデフォルトを DeepSeek にひっくり返すと、すべての自動 RCA がそこにすぐルーティング されます —— パイプラインの構造化抽出半分に対して同等の品質で Claude / GPT より遥かに低コスト。
BaseURL
api.deepseek.com/v1 エンドポイントはグローバルに到達可能。SPA に China-based タグなし。BaseURL オーバーライドはリレー用にのみ使用。
クセ
- OpenAI 互換ワイヤー —— フラット
tool_calls、OpenAI ストリーミング フォーマット。アダプタは Custom / Zhipu / Kimi / Gemini-OAI-mode と 同じ。 - 長コンテキスト —— V4 は 64k トークンをサポート。Ongrid バジェット 見積もりは保守的な
len(text)/4を使うので、実際にモデル制限を ヒットする前にバジェット拒否を見るでしょう。