Google lance Gemini 3 : Le modèle bat tous les records de performance, avec des capacités d’agent pour planifier votre vie

Steeve Fortin
Par
Steeve Fortin - Éditeur
5 minutes de lecture

Google frappe fort avec Gemini 3 : Le nouveau modèle d'IA bat tous les records de performance, promettant des capacités d'Agent si puissantes qu'elles pourraient bientôt planifier vos vacances et coder vos applications. Oubliez la simple génération de texte; l'ère de l'Intelligence Générale Artificielle active est-elle enfin arrivée?

Aujourd’hui, Google a franchi une nouvelle étape importante sur la voie de l’Intelligence Générale Artificielle (IGA) avec le lancement de Gemini 3. L’entreprise le présente comme son modèle le plus intelligent, conçu pour vous aider à donner vie à toutes vos idées en combinant l’ensemble des fonctionnalités de Gemini.

Cette nouvelle version serait le meilleur modèle au monde pour la compréhension multimodale. Elle repousse aussi les limites du raisonnement pour saisir la profondeur et les nuances, qu’il s’agisse d’analyser une idée créative ou de démêler un problème complexe.

Une bête de performance qui domine la concurrence

Si nous avions des bancs d’essai pour les modèles d’IA comme pour les téléphones Android, Gemini 3 remporterait la mise haut la main. Le modèle Pro surpasse nettement son prédécesseur, Gemini 2.5 Pro, sur tous les principaux tests de performance en IA.

Voici quelques-uns des records qu’il établit:

  • Il domine le classement LMArena avec 1501 points, surpassant l’ancien détenteur du record (Gemini 2.5 Pro) de 50 ELO.
  • Il fait preuve d’un raisonnement de niveau doctorat, avec des scores de pointe à l’examen Humanity’s Last Exam (37,5 % sans l’utilisation d’outils) et au GPQA Diamond (91,9 %).
  • Il atteint un nouveau sommet pour les modèles de pointe en mathématiques avec 23,4 % sur MathArena Apex.

Google a également introduit le mode Gemini 3 Deep Think, un mode de raisonnement amélioré qui, sur papier, pousse encore plus loin les performances du modèle.

Multimodalité et l’ère de l’Agent

Gemini 3 redéfinit le raisonnement multimodal, capable de synthétiser des informations sur n’importe quel sujet à travers de multiples modalités, notamment le texte, les images, la vidéo, l’audio et le code. C’est une grande avancée, car il y a seulement deux ans, l’IA se limitait à la lecture de textes et d’images.

Grâce à cette capacité, Gemini 3 peut être utilisé pour des tâches étonnantes:

  • Il peut déchiffrer et traduire des recettes manuscrites dans différentes langues pour créer un livre de cuisine familial.
  • Il peut analyser des vidéos de votre match de pickleball, identifier les points à améliorer et générer un plan d’entraînement pour améliorer votre jeu.
  • Il peut analyser de longs articles universitaires ou des tutoriels vidéo pour générer du code pour des flashcards interactives ou des visualisations.

Surtout, Gemini 3 excelle dans la planification à long terme, en se classant en tête du classement Vending-Bench 2. Ce succès dans la gestion d’une entreprise de distributeurs automatiques simulée prouve sa capacité à prendre des décisions uniformes sur une longue période.

C’est là que le Gemini Agent entre en jeu. Le modèle peut désormais agir en votre nom en gérant des flux de travail complexes et à plusieurs étapes, comme le tri de votre boîte de réception Gmail ou la planification d’un itinéraire de voyage, le tout sous votre contrôle et vos instructions.

Gemini Agent peut vous aider à organiser votre boîte de réception Gmail. Essayez-le dès maintenant dans l’ application Gemini pour les abonnés de Google AI Ultra.

L’écosystème : du consommateur au développeur

Pour le grand public, l’IA est désormais plus présente dans la Recherche Google. Le mode IA dans la recherche utilise maintenant Gemini 3 pour permettre de nouvelles expériences d’interface utilisateur génératives (Gen UI), comme des mises en page visuelles immersives et des outils interactifs générés à la volée.

Certaines fonctionnalités sont d’abord offertes aux clients premium. L’accès au Gemini Agent est pour l’instant réservé aux abonnés Google AI Ultra aux États-Unis.

Pour les développeurs, Google lance Google Antigravity, une nouvelle plateforme de développement d’agents. Cette plateforme fonctionne avec Gemini 3 pour gérer des flux de travail automatisés pour des applications logicielles complexes, allant jusqu’à planifier et coder une application de suivi de vols de manière autonome, puis valider son exécution via un navigateur web.

Google Antigravity utilise Gemini 3 pour gérer un flux de travail automatisé de bout en bout pour une application de suivi de vols. L’agent planifie et code l’application de manière autonome, puis valide son exécution via un navigateur web sur ordinateur.

Disponibilité au Canada dès aujourd’hui:

  • Grand public : dans l’application Gemini.
  • Développeurs : dans l’API Gemini via AI Studio, la plateforme Google Antigravity et Gemini CLI.
  • Entreprises : dans Vertex AI et Gemini Enterprise.
Partagez cet article