Skip to content

Gemini

TL;DR

bash
ONGRID_GEMINI_API_KEY=...
ONGRID_GEMINI_MODEL=gemini-2.5-pro          # default
ONGRID_GEMINI_BASE_URL=                     # defaults to generativelanguage.googleapis.com OAI mode

Provider-ID: gemini. SDK-Adapter: OpenAI-Kompatibilitätsmodus auf Googles generativelanguage-API.

Umgebungsvariablen

VarDefaultNotizen
ONGRID_GEMINI_API_KEYLeer = Provider gedroppt
ONGRID_GEMINI_MODELgemini-2.5-proStandardmodell
ONGRID_GEMINI_BASE_URLhttps://generativelanguage.googleapis.com/v1beta/openaiOpenAI-Kompat-Endpunkt
ONGRID_GEMINI_MODELSgemini-3.5-flash,gemini-2.5-pro,gemini-2.5-flashKatalog-Liste

Standardkatalog

  • gemini-3.5-flash — Frontier; schnell und überraschend günstig.
  • gemini-2.5-pro — der Katalog-Default; ausgewogen.
  • gemini-2.5-flash — das günstige.

Warum der OAI-Kompat-Endpunkt

Gemini hat zwei API-Oberflächen:

  1. Googles natives generativelanguage.googleapis.com/v1beta/generateContent-Form, abweichend von OpenAI.
  2. Eine OpenAI-Kompatibilitätsschicht unter .../v1beta/openai/ — akzeptiert OpenAI-style chat/completions-Anfragen, gibt OpenAI-geformte Antworten zurück.

Ongrid verwendet #2. Die Kompatibilitätsschicht bedeutet, dass der eino-openai-Adapter unverändert funktioniert, und Tool-Calls / System-Messages / Streaming verhalten sich alle wie der Slot jedes anderen Providers. Keine spezielle Behandlung.

Wenn Sie ein Gemini-only-Feature brauchen, das die OAI-Kompat-Oberfläche nicht exponiert (z. B. Medien-Inputs, die die OAI-Form nicht darstellen kann), legen Sie einen Custom-Adapter ein — das ist außerhalb der unterstützten Konfiguration.

Gemini zum Default machen

bash
ONGRID_LLM_DEFAULT_PROVIDER=gemini

BaseURL

Der Default routet durch generativelanguage.googleapis.com. Verwenden Sie den BaseURL-Override für:

  • Vertex-AI-Proxy-Endpunkte (typischerweise us-central1-aiplatform...).
  • Corporate Google Cloud Relays.

Der in der Settings-UI für dieses Feld angezeigte Hint ist „Google generativelanguage.googleapis.com (OpenAI compatibility mode)".

Eigenheiten

  • Regionsbeschränkungen — einige Gemini-Modelle sind nicht in jeder Region verfügbar. Ein 403 vom Upstream landet im Chat-Transkript als regulärer API-Fehler; prüfen Sie die Regionsmatrix des Providers, wenn Sie das bekommen.
  • Safety-Filter — Googles Content-Filter können eine leere Message mit einem finishReason: SAFETY zurückgeben. Der Ongrid-Adapter rendert dies als explizite „blocked by safety filter"-Nachricht im Chat statt einer leeren Antwort.
  • Vision — Bild-Inputs funktionieren über die OAI-Kompat-Schicht mit dem Standard-image_url-Content-Block; die BaseTool-Oberfläche exponiert noch keine Image-Params.

Siehe auch