Skip to content

Gemini

TL;DR

bash
ONGRID_GEMINI_API_KEY=...
ONGRID_GEMINI_MODEL=gemini-2.5-pro          # default
ONGRID_GEMINI_BASE_URL=                     # defaults to generativelanguage.googleapis.com OAI mode

Provider id : gemini. Adaptateur SDK : mode compatibilité OpenAI sur l'API generativelanguage de Google.

Variables d'env

VariableDéfautNotes
ONGRID_GEMINI_API_KEYVide = provider retiré
ONGRID_GEMINI_MODELgemini-2.5-proModèle par défaut
ONGRID_GEMINI_BASE_URLhttps://generativelanguage.googleapis.com/v1beta/openaiEndpoint compat OpenAI
ONGRID_GEMINI_MODELSgemini-3.5-flash,gemini-2.5-pro,gemini-2.5-flashListe de catalogue

Catalogue par défaut

  • gemini-3.5-flash — frontier ; rapide et étonnamment bon marché.
  • gemini-2.5-pro — le défaut du catalogue ; équilibré.
  • gemini-2.5-flash — le bon marché.

Pourquoi l'endpoint compat-OAI

Gemini a deux surfaces d'API :

  1. Le generativelanguage.googleapis.com/v1beta/ natif de Google — forme generateContent, distincte de celle d'OpenAI.
  2. Une couche de compatibilité OpenAI à .../v1beta/openai/ — accepte les requêtes chat/completions style OpenAI, renvoie des réponses au format OpenAI.

Ongrid utilise #2. La couche de compatibilité signifie que l'adaptateur eino-openai fonctionne sans changement, et les tool calls / messages système / streaming se comportent tous comme dans chaque autre slot de provider. Pas de gestion spéciale.

Si vous avez besoin d'une feature spécifique à Gemini que la surface compat-OAI n'expose pas (par ex. des inputs media que la forme OAI ne peut pas représenter), déposez un adaptateur personnalisé — c'est hors de la configuration supportée.

Faire de Gemini le défaut

bash
ONGRID_LLM_DEFAULT_PROVIDER=gemini

BaseURL

Le défaut route via generativelanguage.googleapis.com. Utilisez l'override BaseURL pour :

  • Endpoints proxy Vertex AI (typiquement us-central1-aiplatform...).
  • Relais Google Cloud corporate.

L'indice affiché dans l'UI Settings pour ce champ est « Google generativelanguage.googleapis.com (OpenAI compatibility mode) ».

Particularités

  • Restrictions régionales — certains modèles Gemini ne sont pas disponibles dans chaque région. Un 403 de l'upstream atterrit dans la transcription de chat comme erreur API régulière ; vérifiez la matrice de région du provider si vous obtenez cela.
  • Filtres de sécurité — les filtres de contenu de Google peuvent renvoyer un message vide avec finishReason: SAFETY. L'adaptateur Ongrid rend cela comme un message « blocked by safety filter » explicite dans le chat plutôt qu'une réponse vide.
  • Vision — les inputs image fonctionnent sur la couche compat-OAI en utilisant le bloc de contenu standard image_url ; la surface BaseTool n'expose pas encore les params image.

Voir aussi