Gemini
TL;DR
ONGRID_GEMINI_API_KEY=...
ONGRID_GEMINI_MODEL=gemini-2.5-pro # default
ONGRID_GEMINI_BASE_URL= # defaults to generativelanguage.googleapis.com OAI modeProvider id : gemini. Adaptateur SDK : mode compatibilité OpenAI sur l'API generativelanguage de Google.
Variables d'env
| Variable | Défaut | Notes |
|---|---|---|
ONGRID_GEMINI_API_KEY | — | Vide = provider retiré |
ONGRID_GEMINI_MODEL | gemini-2.5-pro | Modèle par défaut |
ONGRID_GEMINI_BASE_URL | https://generativelanguage.googleapis.com/v1beta/openai | Endpoint compat OpenAI |
ONGRID_GEMINI_MODELS | gemini-3.5-flash,gemini-2.5-pro,gemini-2.5-flash | Liste de catalogue |
Catalogue par défaut
gemini-3.5-flash— frontier ; rapide et étonnamment bon marché.gemini-2.5-pro— le défaut du catalogue ; équilibré.gemini-2.5-flash— le bon marché.
Pourquoi l'endpoint compat-OAI
Gemini a deux surfaces d'API :
- Le
generativelanguage.googleapis.com/v1beta/natif de Google — formegenerateContent, distincte de celle d'OpenAI. - Une couche de compatibilité OpenAI à
.../v1beta/openai/— accepte les requêteschat/completionsstyle OpenAI, renvoie des réponses au format OpenAI.
Ongrid utilise #2. La couche de compatibilité signifie que l'adaptateur eino-openai fonctionne sans changement, et les tool calls / messages système / streaming se comportent tous comme dans chaque autre slot de provider. Pas de gestion spéciale.
Si vous avez besoin d'une feature spécifique à Gemini que la surface compat-OAI n'expose pas (par ex. des inputs media que la forme OAI ne peut pas représenter), déposez un adaptateur personnalisé — c'est hors de la configuration supportée.
Faire de Gemini le défaut
ONGRID_LLM_DEFAULT_PROVIDER=geminiBaseURL
Le défaut route via generativelanguage.googleapis.com. Utilisez l'override BaseURL pour :
- Endpoints proxy Vertex AI (typiquement
us-central1-aiplatform...). - Relais Google Cloud corporate.
L'indice affiché dans l'UI Settings pour ce champ est « Google generativelanguage.googleapis.com (OpenAI compatibility mode) ».
Particularités
- Restrictions régionales — certains modèles Gemini ne sont pas disponibles dans chaque région. Un 403 de l'upstream atterrit dans la transcription de chat comme erreur API régulière ; vérifiez la matrice de région du provider si vous obtenez cela.
- Filtres de sécurité — les filtres de contenu de Google peuvent renvoyer un message vide avec
finishReason: SAFETY. L'adaptateur Ongrid rend cela comme un message « blocked by safety filter » explicite dans le chat plutôt qu'une réponse vide. - Vision — les inputs image fonctionnent sur la couche compat-OAI en utilisant le bloc de contenu standard
image_url; la surface BaseTool n'expose pas encore les params image.