Google entre dans l’ère agentique
Le PDG de Google, Sundar Pichai, a ouvert la conférence I/O 2026 de l'entreprise en proclamant l'aube de l'ère agentique. Google traite 3,2 quadrillions de tokens par mois, soit une multiplication par sept par rapport à l'année dernière. Plus de 8,5 millions de développeurs construisent chaque mois avec les modèles Google, et les API de modèles de Google traitent environ 19 milliards de tokens par minute.
La pièce maîtresse de l'événement était Gemini 3.5 Flash, un modèle qui surpasse son prédécesseur Gemini 3.1 Pro sur des indicateurs clés tout en étant quatre fois plus rapide que les autres modèles de pointe. Il coûte moins de la moitié du prix des modèles comparables. Google a déclaré que si les grandes entreprises transféraient 80 % de leurs charges de travail vers Flash, elles pourraient économiser plus d'un milliard de dollars par an.
Antigravity 2.0 alimente les agents autonomes
Google a lancé Antigravity 2.0, une application de bureau autonome pour gérer des cohortes d'agents d'IA autonomes. Elle exécute une version de Flash optimisée pour être 12 fois plus rapide que les autres modèles de pointe. La plateforme est disponible dès aujourd'hui.
Gemini Spark est un agent d'IA personnel qui fonctionne 24h/24 et 7j/7 sur les machines virtuelles Google Cloud. Il exécute des tâches de fond à long horizon, se connecte via le Model Context Protocol et s'intègre à l'application Gemini. Une version bêta américaine commence la semaine prochaine pour les abonnés Google AI Ultra. L'agent sera étendu aux e-mails, aux discussions et à Chrome plus tard cet été.
Nouvelles fonctionnalités dans les produits Google
Google a également annoncé de nouvelles fonctionnalités d'IA dans sa gamme de produits. Ask YouTube réinvente la découverte de vidéos en faisant remonter des segments vidéo pertinents en fonction d'intérêts nuancés. Voice-Powered Docs permet aux utilisateurs de créer et d'éditer des documents entièrement par commande vocale.
Les puces TPU de 8e génération ont été dévoilées, notamment la TPU 8t pour le pré-entraînement à grande échelle avec trois fois la puissance de calcul brute de son prédécesseur, et la TPU 8i pour l'inférence à haute vitesse. Les deux offrent jusqu'à deux fois meilleure performance par watt. Les dépenses d'investissement de Google sont passées de 31 milliards de dollars en 2022 à environ