Gemini
TL;DR
ONGRID_GEMINI_API_KEY=...
ONGRID_GEMINI_MODEL=gemini-2.5-pro # default
ONGRID_GEMINI_BASE_URL= # defaults to generativelanguage.googleapis.com OAI modeProvider-ID: gemini. SDK-Adapter: OpenAI-Kompatibilitätsmodus auf Googles generativelanguage-API.
Umgebungsvariablen
| Var | Default | Notizen |
|---|---|---|
ONGRID_GEMINI_API_KEY | — | Leer = Provider gedroppt |
ONGRID_GEMINI_MODEL | gemini-2.5-pro | Standardmodell |
ONGRID_GEMINI_BASE_URL | https://generativelanguage.googleapis.com/v1beta/openai | OpenAI-Kompat-Endpunkt |
ONGRID_GEMINI_MODELS | gemini-3.5-flash,gemini-2.5-pro,gemini-2.5-flash | Katalog-Liste |
Standardkatalog
gemini-3.5-flash— Frontier; schnell und überraschend günstig.gemini-2.5-pro— der Katalog-Default; ausgewogen.gemini-2.5-flash— das günstige.
Warum der OAI-Kompat-Endpunkt
Gemini hat zwei API-Oberflächen:
- Googles natives
generativelanguage.googleapis.com/v1beta/—generateContent-Form, abweichend von OpenAI. - Eine OpenAI-Kompatibilitätsschicht unter
.../v1beta/openai/— akzeptiert OpenAI-stylechat/completions-Anfragen, gibt OpenAI-geformte Antworten zurück.
Ongrid verwendet #2. Die Kompatibilitätsschicht bedeutet, dass der eino-openai-Adapter unverändert funktioniert, und Tool-Calls / System-Messages / Streaming verhalten sich alle wie der Slot jedes anderen Providers. Keine spezielle Behandlung.
Wenn Sie ein Gemini-only-Feature brauchen, das die OAI-Kompat-Oberfläche nicht exponiert (z. B. Medien-Inputs, die die OAI-Form nicht darstellen kann), legen Sie einen Custom-Adapter ein — das ist außerhalb der unterstützten Konfiguration.
Gemini zum Default machen
ONGRID_LLM_DEFAULT_PROVIDER=geminiBaseURL
Der Default routet durch generativelanguage.googleapis.com. Verwenden Sie den BaseURL-Override für:
- Vertex-AI-Proxy-Endpunkte (typischerweise
us-central1-aiplatform...). - Corporate Google Cloud Relays.
Der in der Settings-UI für dieses Feld angezeigte Hint ist „Google generativelanguage.googleapis.com (OpenAI compatibility mode)".
Eigenheiten
- Regionsbeschränkungen — einige Gemini-Modelle sind nicht in jeder Region verfügbar. Ein 403 vom Upstream landet im Chat-Transkript als regulärer API-Fehler; prüfen Sie die Regionsmatrix des Providers, wenn Sie das bekommen.
- Safety-Filter — Googles Content-Filter können eine leere Message mit einem
finishReason: SAFETYzurückgeben. Der Ongrid-Adapter rendert dies als explizite „blocked by safety filter"-Nachricht im Chat statt einer leeren Antwort. - Vision — Bild-Inputs funktionieren über die OAI-Kompat-Schicht mit dem Standard-
image_url-Content-Block; die BaseTool-Oberfläche exponiert noch keine Image-Params.