Google lance Gemini 3.1 Flash-Lite, un modèle d’IA plus rapide et plus abordable

Google lance Gemini 3.1 Flash-Lite, un modèle d’IA plus rapide et plus abordable
Bron: Google

Selon Google, 3.1 Flash a été conçu avec la rapidité comme priorité.

Google a annoncé Gemini 3.1 Flash-Lite, une nouvelle variante de modèle d’IA multimodal axée sur la rapidité et les coûts réduits pour les applications à grande échelle.

Plus abordable que les autres modèles Gemini

Selon un article de blog de Google, Gemini 3.1 Flash-Lite est nettement moins cher que les autres modèles de la gamme Gemini. Le modèle coûte 0,25 dollar par million de tokens d’entrée et 1,50 dollar par million de tokens de sortie. À titre de comparaison, Gemini 3.1 Pro, le modèle le plus puissant de Google, commence à 2 dollars par million de tokens d’entrée et 18 dollars par million de tokens de sortie.

Le modèle est également plus rapide. Lors de tests internes, Flash-Lite a généré des réponses 45 % plus rapidement que Gemini 2.5 Flash, tandis que le délai avant le premier token de sortie serait 2,5 fois plus court.

Ciblé sur les tâches à grande échelle

Gemini 3.1 Flash-Lite peut traiter des requêtes multimodales allant jusqu’à 1 million de tokens et générer des réponses textuelles jusqu’à 64 000 tokens. Le modèle peut également générer du code, par exemple pour construire des tableaux de bord ou d’autres applications visuelles.

Google s’attend à ce que les développeurs utilisent principalement le modèle pour des tâches à volumes élevés mais nécessitant un raisonnement limité. Les exemples incluent la traduction de catalogues de produits ou la modération automatique de contenu sur les plateformes d’e-commerce.

Résultats des benchmarks

Dans onze tests de référence, Flash-Lite a obtenu le meilleur score dans six tests, battant notamment GPT-5 mini et Claude 4.5 Haiku.

Le modèle a obtenu un bon score au GPAQ Diamond, un benchmark comportant des questions de niveau doctoral. Sur le benchmark exigeant HLA, il a obtenu un score de 16 %, contre 44,4 % pour Gemini 3.1 Pro.

Gemini 3.1 Flash-Lite est actuellement disponible en version préliminaire via Vertex AI et via Google AI Studio.