Mistral lance Large 2 avec une meilleure connaissance du codage

Mistal annonce son plus grand LLM à ce jour. Mistral Large 2 a perfectionné ses connaissances en matière de codage et maîtrise jusqu’à 80 langages de programmation.

La compétition entre les modèles d’IA reprend de plus belle. Hier, c’était Meta, aujourd’hui, c’est au tour de Mistral de présenter son dernier vaisseau amiral. Avec ses 123 milliards de paramètres, Mistral Large 2 est le plus grand LLM sorti des rangs de l’entreprise française jusqu’à présent.

Le nombre de paramètres est encore bien inférieur à celui des autres LLM connus. LLama 3.1, proposé par Meta hier, a une version de 405 milliards de paramètres, par exemple. Mistral Large 2 fonctionne à la perfection sur une Nvidia H100, selon un post sur X.

Grand, mais pas le plus grand

Même si le nombre de paramètres d’un modèle est révélateur de ses compétences, il y a toujours plus à découvrir. Mistral essaie de le démontrer à l’aide de tests comparatifs : elle le compare à Llama 3.1, GPT-4o et Claude Sonnet 3.5 (Google Gemini est exclu). Mistral Large 2 peut traiter autant de jetons que le modèle de Meta, jusqu’à 128 000 en une seule fois.

Mistral Large 2 a fait de grands progrès en matière de codage, explique l’entreprise dans un blog. Le premier modèle Mistral Large n’était pas un génie, mais la deuxième version maîtrise jusqu’à quatre-vingts langages, même si certains sont évidemment mieux maîtrisés que d’autres. Selon Mistral, son modèle est expert en Java.

mistral large 2 coderen
Repères de codage de Mistral Large 2. Source : Mistral

Mistral souligne également le talent linguistique de Large 2. Le modèle parle l’anglais, le français, l’allemand, l’espagnol, le portugais, l’italien, l’arabe et le coréen, entre autres. Le néerlandais n’est pas mentionné. En revanche, Mistral Large 2 manque de capacités multimodales pour traiter simultanément des images et du texte. Il semble que ce soit la spécialité d’OpenAI.

Ouvert pour les chercheurs

Tout comme Llama 3.1, Mistral Large 2 est en principe un logiciel libre, mais tout le monde ne peut pas le télécharger gratuitement. Les chercheurs peuvent demander une licence gratuite à l’entreprise, mais pour utiliser le modèle dans le cadre d’une activité commerciale, il faut payer une contribution. Le modèle est disponible via Google Vertex, AWS BedRock, Azure AI Studio, IBM watson.x et pour le grand public via l’application de chat Le Chat.

Mistral joue un rôle marginal dans le monde de l’IA. Originaire d’Europe, l’entreprise aime exploiter ce caractère européen pour se démarquer dans un secteur dominé par les superpuissances américaines. Et Mistral est convoitée par tous. La Commission européenne a empêché Microsoft de racheter Mistral.

newsletter

Abonnez-vous gratuitement à ITdaily !

Category(Required)
This field is for validation purposes and should be left unchanged.
retour à la maison