Thursday, June 25, 2026

Intérêt de Studio de Mistral. Mi juin 2026 Mistral et l'arrivée de Brian Hall comme CMO de Mistral (directeur marketing). Pourquoi? Pas le course à la création du modèle le plus gigantesque et le plus polyvalent?

 

Biran Hall, un cadre de longue date chez Microsoft a dirigé le marketing produit chez Google Cloud.

Sur linkedin: https://www.linkedin.com/feed/update/urn:li:activity:7472694983636971520/

Hello from Paris! I have personal news to share, that I am now CMO of Mistral. I think this could be the most interesting marketing job in the world. 

The next five years will be the most interesting ever in tech. We’ve seen AI become more mainstream and clearly impact how we code, compute, and organize. There’s tons more to come for roles, industries, sciences, and education. 

So I now get to be somewhere that’s 

- at the bleeding (learning) edge of AI tech, 

- taking a different approach from the other major players (OpenAI, Anthropic, Google, Meta, Microsoft, Amazon, Chinese open source et al) by prioritizing AI for mission critical environments that need the confidence and self-control to bet for the long term (with open weights and real sovereign capabilities), 

- and do it while taking a part-time adventure in Paris while learning from the non-US-first perspective.  ooh la la!

I particularly love that the open weights philosophy and approach lets me learn and discover with the research, science, and developer communities.

I do have to thank Anthropic and the US government for laying out why Mistral is in such an interesting position too! You can see a little bit about how Mistral is approaching this for customers differently here on twitter/X: https://lnkd.in/g-3zZnuV

Thanks to everyone who has given me great ideas and opportunities as I’ve figured out what was next. Thanks to Arthur Mensch, Guillaume Lample, Timothee Lacroix, and the team at Mistral for the opportunity. I am very excited about this one! (well, other than learning how to use a mac for the first time since college, but we’ll see if I have more info on that one later. For now I have my personal Surface as wingman.)

---------

Son arrivée a suscité de la curiosité, car Mistral ne domine pas les discussions des développeurs aux États-Unis et ne dispose pas des mêmes budgets informatiques apparemment illimités qu’Anthropic ou OpenAI. Si le marché de l’IA n’était qu’une course à la création du modèle le plus gigantesque et le plus polyvalent, Mistral ne serait pas l’entreprise sur laquelle parier. 

La question la plus intéressante est de savoir quand le marché de l’IA d’entreprise reviendra à la normale et exigera que l’IA offre la même sécurité, la même prévisibilité et le même contrôle que ceux auxquels nous sommes habitués avec d’autres investissements informatiques. C’est là que Mistral a un véritable atout. Comme le note Brian Hall, l’approche de Mistral consiste à « donner la priorité à l’IA pour les environnements critiques qui ont besoin de la confiance et de l’autonomie nécessaires pour s’engager sur le long terme (avec des modèles ouverts et de véritables capacités souveraines) »

Mistral présente Studio pour la création et l’exécution d’applications d’IA, Forge pour l’entraînement et l’alignement de modèles personnalisés, Vibe pour le travail agentique, Vibe for Code pour les workflows de codage, et Compute pour l’infrastructure d’entraînement et d’inférence. L’entreprise évoque l’observabilité, les évaluations, les garde-fous, la portabilité des déploiements et l’exécution de l’IA en production « de l'edge au cloud ». En d’autres termes, elle ressemble moins à une entreprise spécialisée dans les chatbots qu’à une entreprise d’infrastructure. 

Ce positionnement devient plus clair lorsque l'on examine de plus près les noms des produits. Mistral AI Studio comprend un registre IA qui sert de système d’enregistrement pour les agents, les modèles, les ensembles de données, les évaluateurs, les outils et les workflows. Il assure le suivi de la traçabilité, de la propriété et des versions. Il applique des contrôles d’accès et des étapes de validation avant le déploiement.

 Il s’agit là d’une infrastructure de gouvernance « ennuyeuse » (et « ennuyeuse » est un terme positif dans l’informatique d’entreprise, comme je l’ai déjà écrit). 

Forge est peut-être encore plus important. Mistral le décrit comme un moyen pour les entreprises d’entraîner des modèles de pointe sur leurs propres données propriétaires. Plutôt que de s’entraîner sur des informations protégées par des droits d’auteur appartenant à des tiers et éparpillées sur le Web ou sur une montagne de publications Reddit, Forge va bien au-delà de la génération augmentée par la recherche (RAG) : il ne se contente pas de « lire » des documents, informations, etc. propriétaires, mais offre en quelque sorte à l’entreprise son propre OpenAI privé. 

Référence

https://www.lemondeinformatique.fr/actualites/lire-l-architecture-it-maillon-faible-du-deploiement-d-agents-ia-100534.html

données structurées JSONL dans du HTML pour être moissonner proprement par AI

 

Les données structurées ont des balises généralement au format JSON-LD ajoutées au code HTML d’une page web pour aider les moteurs de recherche et agents AI à comprendre et interpréter le contenu de manière explicite. Elles s’appuient sur un vocabulaire standardisé, principalement Schema.org, et permettent à Google (ou Bing) d’afficher des résultats enrichis (rich snippets) dans les pages de résultats : étoiles d’avis, prix de produits, FAQ, infos recettes, événements, etc.

La réalité des données structurées et des LLM

Il est important de préciser que les données structurées ne sont pas un Pass pour entrer dans les LLM (modèles de langage). À ce stade, rien ne prouve qu’un modèle conversationnel « lit » directement ce code JSON-LD comme un signal décisif de compréhension. De plus, ajouter quelques blocs de balisage de données structurées ne suffira pas à améliorer mécaniquement la visibilité dans ces nouvelles interfaces génératives. La vraie question à poser est : comment une marque réduit-elle l’ambiguïté dans les systèmes qui filtrent, relient, interprètent et fiabilisent l’information avant qu’une réponse soit générée ?

Un LLM ne « lit » pas votre site comme un consultant qui inspecterait une page avec un crawler. Le mécanisme est différent. Du côté de Google et Gemini, l’impact est direct et documenté. Google lit les données structurées, les exploite pour construire les Rich Snippets, alimenter les Knowledge Panels, enrichir Google Shopping, identifier les entités et rattacher les auteurs. Gemini s’appuie sur cette même infrastructure.

En revanche, pour des concurrents comme ChatGPT et Perplexity, l’impact est indirect. Ces modèles font souvent abstraction du JSON-LD présent dans le code source. Ils ingèrent principalement du texte brut ou du markdown, et privilégient le texte brut en purgeant le corpus de tout « bruit » technique.

Vous ne structurez donc pas pour ChatGPT, mais pour Google, et ChatGPT en bénéficie en aval. L’impact des données structurées sur la visibilité générative n’est pas uniforme : il est direct et mesurable chez Google, indirect mais réel chez les LLM tiers. Réduire ce sujet à « les LLM lisent-ils le JSON-LD ? » revient à poser la mauvaise question.

Le marché se trompe souvent en considérant les données structurées comme des éléments de conformité technique. On ajoute du JSON-LD, on valide dans un outil, et si tout est vert, on considère le sujet plié. Ce principe est dépassé.

Google et Bing ne raisonnent plus seulement en clusters de contenus, mais en entités, en relations, en graphes de connaissances. Ce qui compte n’est plus uniquement votre capacité à approfondir un sujet, mais aussi votre capacité à exister clairement dans un réseau de compréhension plus vaste.

La lisibilité par les machines

Un encodage utile ne sert pas seulement à rendre une page « parseable ». Il sert à déclarer des relations dans ce réseau. On ne se contente plus de structurer des données, on construit la représentation de votre marque dans les systèmes qui décident si elle est une information ou une réalité établie. Le sujet n’est plus d’être conforme, mais d’être intelligible.

Référence

Le 3juin 2026, 30 médias, les groupes français CMA Media et Sipa Ouest-France, ont annoncé leur intégration dans une coalition internationale, initialement pour défendre la propriété intellectuelle et structurer les relations avec les entreprises d'IA.

 « Les éditeurs du monde ont choisi l'action plutôt que la résignation » : une coalition internationale de médias veut peser face aux géants de l'IA

Ils rejoignent la coalition SPUR (Standards for publisher usage rights), initialement portée par des Anglo-Saxons : CMA Media (« La Tribune », « La Provence », BFMTV, RMC, etc.) et le groupe Sipa Ouest-France, propriétaire du premier quotidien de l'Hexagone.


Référence

https://www.lesechos.fr/tech-medias/medias/les-editeurs-du-monde-ont-choisi-laction-plutot-que-la-resignation-une-coalition-internationale-de-medias-veut-peser-face-aux-geants-de-lia-2234793

Wednesday, June 24, 2026

GLM-5.2 est un LLM de 744 milliards de paramètres et contexte d’un million de tokens de la société chinoise Z.ai Zhipu, sorti le 13 juin 2026, open.

 


Sur FrontierSWE, un test conçu pour mesurer si une IA peut mener à bout un projet technique de plusieurs heures, GLM-5.2 atteint 74,4 %. Il passe devant GPT-5.5 (72,6 %) et finit à un cheveu de Claude Opus 4.8 (75,1 %). Même logique sur SWE-bench Pro, un autre test de génie logiciel : 62,1 pour GLM-5.2, contre 58,6 pour GPT-5.5.

Le coup de force de GLM-5.2, ce n’est pas que la performance. C’est le modèle économique. Via l’API de Z.ai, le modèle coûte 1,40 dollar (environ 1,30 €) par million de tokens en entrée et 4,40 dollars (environ 4 €) en sortie. À titre de comparaison, GPT-5.5 demande 5 dollars en entrée et 30 dollars en sortie, soit près de six fois plus cher côté sortie.

GLM-5.2 est conçu pour exécuter de longues tâches de plusieurs heures voire plusieurs jours de programmation, et des flux de travail autonomes (agentique). 

Au-delà des scores, c’est l’exploit industriel derrière GLM-5.2 qui force le respect. Le modèle s’appuie sur une architecture Mixture-of-Experts (MoE) de 744 milliards de paramètres au total, dont seuls 40 milliards sont actifs par inférence. Fait remarquable : les gains massifs par rapport à la version 5.1 ne découlent pas d’une augmentation de la taille du modèle, mais uniquement d’optimisations logicielles au cours de l’entraînement.

Inscrite sur la liste noire des entités américaines et privée de tout accès aux puces de dernière génération de la Silicon Valley, Z.AI (qui a réussi son introduction en bourse à Hong Kong en janvier 2026) a développé ce monstre technologique sur du matériel informatique alternatif, sans aucun composant Nvidia.

Le modèle est distribué sous la très permissive licence MIT, avec des poids téléchargeables librement depuis Hugging Face. Sa fenêtre de contexte passe de 200 000 à 1 million de tokens, offrant une stabilité de traitement des contextes longs saluée par les ingénieurs.

huggingface

Serve GLM-5.2 Locally: https://huggingface.co/zai-org/GLM-5.2

GLM-5.2 supports deployment with the following frameworks. Feel free to try them out:

SGLang (v0.5.13.post1+) — see cookbook

vLLM (v0.23.0+) — see recipes

Transformers (v0.5.12+) — see transformers docs

KTransformers (v0.5.12+) — see tutorial

Unsloth (v0.1.47-beta+) — see guide

For deployment on the Ascend NPU platform, inference frameworks such as vLLM-Ascend, xLLM and SGLang are supported — see here.

ArXiv

We present GLM-5, a next-generation foundation model designed to transition the paradigm of vibe coding to agentic engineering. Building upon the agentic, reasoning, and coding (ARC) capabilities of its predecessor, GLM-5 adopts DSA to significantly reduce training and inference costs while maintaining long-context fidelity. To advance model alignment and autonomy, we implement a new asynchronous reinforcement learning infrastructure that drastically improves post-training efficiency by decoupling generation from training. Furthermore, we propose novel asynchronous agent RL algorithms that further improve RL quality, enabling the model to learn from complex, long-horizon interactions more effectively. Through these innovations, GLM-5 achieves state-of-the-art performance on major open benchmarks. Most critically, GLM-5 demonstrates unprecedented capability in real-world coding tasks, surpassing previous baselines in handling end-to-end software engineering challenges. 

https://arxiv.org/abs/2602.15763


Référence

https://www.frandroid.com/culture-tech/intelligence-artificielle/3143733_voici-glm-5-2-lia-chinoise-gratuite-qui-bat-gpt-5-5-et-talonne-claude-opus-4-8-pour-six-fois-moins-cher

https://legrandcontinent.eu/fr/2026/06/23/avec-glm-5-2-la-chine-a-t-elle-ouvert-un-nouveau-moment-deepseek/

https://goodtech.info/des-pdg-de-la-tech-saluent-glm-52-chinois-meilleur-modele-ia-open-weights/

Monday, June 22, 2026

Comment faire confiance à une réponse de LLM qu'on ne peut pas vérifier et comment l'obliger à citer ses sources de manière adaptée et rigoureuse??

 A titre d'exemple, voici un billet dans Reddit sur le problème des LLM pour citer efficacement ses sources que j'ai structuré pour le publier sur mon blog.



J'ai passé  mon temps de développement à empêcher un LLM de citer les sources incorrectement. Voici les 6 modes d'échec que j'ai trouvés

BUT  construit un assistant de recherche en IA pour une entreprise de conformité

J'ai construit un assistant de recherche en IA pour une entreprise de conformité allemande et le pipeline de récupération a pris peut-être 30 % du temps de développement total. Les 70 % restants ont été consacrés à lutter contre le LLM pour qu'il cite correctement les sources.

Les avocats ont un standard très spécifique pour la citation. Vous ne dites pas "conformément aux directives légales." Vous dites "conformément à l'article 32(1)(a) DSGVO tel qu'interprété par la EuGH dans C-300/21." Si le système ne peut pas faire ça, il est inutile car aucun avocat ne va faire confiance à une réponse qu'il ne peut pas vérifier.

Voici chaque mode d'échec de citation que j'ai rencontré et comment j'ai traité chacun.

Échec 1 Citations de catégories vagues

Citations de catégories vagues. Le LLM écrivait des choses comme "laut professioneller Fachliteratur" (selon la littérature professionnelle) au lieu de nommer le document spécifique. Il citait essentiellement l'étiquette de métadonnées plutôt que la source. Fixe : instruction explicite dans l'invite disant "NE JAMAIS paraphraser le nom de la catégorie comme référence de source" avec des exemples spécifiques de ce qu'il ne faut pas faire.

Échec 2 aucun sens 

Étiquettes de catégories internes fuyant dans la sortie. Le LLM écrivait "(Kategorie: Hauptgerichtsentscheidung)" comme une citation en ligne. Cela n'a aucun sens pour l'utilisateur final. Fixe : instruction dans l'invite disant "NE JAMAIS utiliser (Kategorie: ...) comme citation en ligne" et exigeant le titre du document réel ou le nom de la cour à la place.

Échec 3 Attribution d'autorité incorrecte.

 Attribution d'autorité incorrecte. Une constatation d'un document de haute cour serait attribuée à une cour inférieure, ou vice versa. Cela est dangereux dans le travail légal car le niveau d'autorité de la cour compte énormément. Fixe : instruction dans l'invite exigeant que le LLM vérifie dans quelle section de catégorie le document apparaît avant de l'attribuer, avec un exemple spécifique montrant la logique d'attribution correcte.

Échec 4 mélange de citations

 Applatissement des positions divergentes. Lorsque une cour supérieure et une cour inférieure ne sont pas d'accord sur la même question juridique, le LLM les synthétisait en une seule position, favorisant généralement celle qui avait un langage plus clair plutôt que le niveau d'autorité supérieur. Fixe : instruction explicite exigeant que les deux positions soient présentées séparément avec leur source et leur niveau d'autorité notés.

Échec 5 hallucinations

 Revendications d'absence fausses. Le LLM affirmait avec assurance "les documents ne contiennent aucune information sur X" alors que l'information était en réalité présente dans le contexte mais enfouie sous un langage juridique dense. Fixe : instruction disant "NE PAS prétendre que l'information est absente à moins que vous n'ayez vérifié minutieusement" et suggérant au LLM de dire "les extraits disponibles peuvent ne pas contenir tous les détails" à la place.

Échec 6 Langage trop emphatique

Langage trop emphatique. Le LLM ajoutait des phrases de renforcement comme "ohne jeden Zweifel" (sans aucun doute) ou "ganz klar" (très clairement) aux conclusions juridiques. Les avocats trouvent cela peu professionnel car l'analyse juridique est rarement sans doute. Fixe : instruction de ton exigeant un langage factuel et mesuré, laissant les sources parler d'elles-mêmes.

Référence

https://www.reddit.com/r/LangChain/comments/1stgvno/i_spent_40_of_my_development_time_preventing_an/?tl=fr

Sunday, January 25, 2026

LateX, Compilation du document le plus simple «Hello, World!» avec TeXShop et MacTeX sur macOS, formation université de Laval Canada

 Courte introduction à la création d'un document de type «Hello, World!» avec LaTeX sur macOS (version 2019). Vidéo accompagnant la formation LaTeX de l'Université Laval disponible sur CTAN: https://ctan.org/pkg/formation-latex-ul



VERBATIM DE LA VIDÉO (2min 30)



Le processus de création d'un document avec LaTeX diffère passablement de celui à l'aide d'un logiciel de traitement de texte.

Cette vidéo explique comment créer et visualiser un document très simple avec LaTeX.

--------

La production d'un document à l'aide d'un ordinateur requiert toujours d'entrer le texte dans l'ordinateur, de le mettre en forme et de produire le document final.

Cependant, là où un traitement de texte de type What You See Is What You Get combine les trois étapes de manière transparente, LaTeX requiert d'utiliser trois outils bien différents, un pour chaque étape de production.

* *

Premièrement, on rédige le texte du document ainsi que diverses instructions et commandes LaTeX à l'aide d'un éditeur de texte.

Le fichier ainsi obtenu est ensuite passé à un programme, le moteur TeX. Celui-ci se chargera d'interpréter les instructions et les commandes afin de produire le texte exactement tel qu'il sera imprimé,aujourd'hui principalement sous forme d'un fichier PDF.

La troisième étape consiste à visionner le texte mis en forme avec une visionneuse comme Aperçu, Skim ou Acrobat Reader.

* *

Les deux premières étapes, la rédaction et ce que l'on appelle la compilation du texte sont rendues beaucoup plus simples par l'utilisation d'un logiciel intégré de rédaction LaTeX. Il en existeune multitude.

Nous ferons la démonstration à l'aide de l'éditeur TeXShop livré avec MacTeX.

Au démarrage, TeXShop nous présente un document vierge. Nous allons taper au long les instructions et le texte d'un très court document dans lequel nous saluons le monde, en anglais. C'est un grandclassique dans l'apprentissage d'un nouveau langage de programmation qui a même sa page Wikipedia!

Lorsque le document est complet, on passe à la phase de compilation, ou de composition, en appuyant sur le bouton correspondant dans la barre d'outil.

La première fois, il faudra d'abord sauvegarder le document. Nous vous recommendons fortement d'utiliser le type d'encodage Unicode UTF-8.

Si la compilation se déroule sans erreur, TeXShop vous présentera le fichier PDF produit dans sa visionneuse intégrée.

Vous pouvez faire de l'encodage UTF-8 le type par défaut dans les Préférences de TeXShop.

* *

Voilà, vous avez créé votre premier document LaTeX! C'est la base pour pouvoir attaquer la production de documents plus complexes, comme une thèse ou un mémoire. 

Saturday, January 17, 2026

Après les moteur de recherche par indexation en 1993, l’apprentissage profond 2012, puis les chatbots ChatGPT Gemini, 2022, la troisième AI intègre le monde réel. Des chercheurs suggèrent que Gemini est en train de détrôner tous ses concurrents

 

Pour souhaiter un "Pace e salute" en ce début d'année 2026,
voici un post sur mon vieux blog.

Geoffrey Hinton reçoit avec Yoshua Bengio et Yann Le Cun le prix Turing 2018 pour leurs travaux sur l'apprentissage profond. Ils sont appelés les « pères fondateurs » de l'intelligence artificielle.

Yann Lecun, Yoshua Bengio, Geoffrey Hinton. Deep learning. Nature, 2015, 521 (7553), pp.436-444.
  • Geoffrey Hinton, né le 6 décembre 1947 à Wimbledon (Royaume-Uni), est un chercheur britanno-canadien. Il est co-auteur d'un article publié en 1986, qui a popularisé l'algorithme de rétropropagation pour l'entraînement des réseaux de neurones-perceptrons multicouches: Learning representations by back-propagating errors https://www.nature.com/articles/323533a0
  • Yoshua Bengio, né le 5 mars 1964 à Paris en France, est un chercheur québécois-canadien d'origine franco-marocaine. Il est le seul scientifique vivant à avoir dépassé le million de citations sur Google Scholar. Il rejoint ainsi Michel Foucault, philosophe, historien des idées et militant politique français, cité plus d’un million de fois par ses pairs.
  • Yann Le Cun, né le 8 juillet 1960 à Soisy-sous-Montmorency en France. -Il estime que les LLM (de l'anglais Large Language Model) actuels sont limités car ne « comprenant » pas réellement le monde ; il juge les architectures JEPA plus prometteuses, car capables de construire des représentations internes du monde et de prédire ses évolutions.
On constate combien l'esprit révolutionnaire français est présent dans les fondements et développements de l'AI. 

Un petit clin d'oeil historique

Marseille est l’un des berceaux de l’intelligence artificielle en France avec la création du langage Prolog au début des années 1970. L’objet de cet article est de donner quelques repères historiques et de rendre hommage à Alain Colmerauer ainsi qu’aux membres de son équipe, aux chercheurs et enseignants-chercheurs qui ont contribué au développement de la recherche, de la formation et du transfert technologique en intelligence artificielle à partir de Marseille.

Geoffrey Hinton: Trois ans après avoir été pris au dépourvu par ChatGPT, Gemini est-il en train de gagner ?

Alors que la compétition autour de l’intelligence artificielle générative est souvent racontée comme une succession de coups médiatiques, de démonstrations spectaculaires et d’annonces parfois précipitées, Google avance à un rythme plus feutré. Avec Gemini, son modèle d’IA unifié, le groupe semble aujourd’hui récolter les fruits d’une stratégie plus structurelle que narrative. Sans déclarer officiellement la victoire, Google apparaît de plus en plus comme un acteur central, voire dominant, dans la phase actuelle de la course à l’IA. C'est en tout cas l'avis de certains spécialistes comme Geoffrey Hinton, le « parrain de l'IA ».

Depuis la fin de l’année 2022, la course à l’IA générative a été largement perçue comme un duel entre nouveaux entrants spectaculaires et géants historiques pris de court. L’irruption de OpenAI a imposé un nouveau tempo, rapidement suivi par l’intégration agressive de modèles génératifs dans les produits de Microsoft. Dans ce contexte, Google a souvent été décrit comme hésitant, voire en retard, malgré des années de recherche fondamentale en apprentissage automatique et en réseaux neuronaux.

Pendant une grande partie de l’année 2023, Google a souffert d’une image de poursuivant. L’arrivée rapide de modèles conversationnels très populaires a donné l’impression que le géant de Mountain View avait perdu l’initiative, malgré son rôle historique dans la recherche en apprentissage profond. Cette lecture, largement façonnée par le calendrier médiatique, a progressivement perdu de sa pertinence à mesure que la stratégie de Google s’est clarifiée.

Google a connu quelques lancements de produits difficiles par le passé. En 2024, Google a dû arrêter son générateur d'images IA parce que les gens disaient qu'il créait des images historiquement incorrectes de personnes de couleur et qualifiaient les résultats de « trop politiquement corrects ». Google a rapidement présenté ses excuses pour ce qu’il décrit comme des « inexactitudes dans certaines représentations historiques générées par l’image » avec son outil Gemini, en disant que ses tentatives de créer une « large gamme » de résultats ont manqué la cible. Gemini est un outil d’intelligence artificielle lancé par Google qui peut créer des images en réponse à des requêtes écrites. 

« Nous sommes conscients que Gemini propose des inexactitudes dans certaines représentations de génération d'images historiques », regrette Google dans sa déclaration publiée sur X/Twitter. « Nous travaillons à l'amélioration immédiate de ce type de représentations. La génération d'images par l'IA de Gemini génère un large éventail de personnes. Et c'est généralement une bonne chose, car des gens du monde entier l'utilisent. Mais dans le cas présent, il n'y a pas d'adéquation ». Après avoir mis l'outil en pause, le temps de retravailler dessus, il a été relancé.

Les versions précédentes de son outil de recherche IA donnaient également des conseils étranges, comme dire aux utilisateurs de mettre de la colle sur leur pizza pour empêcher le fromage de glisser.

Auparavant, le PDG de l'entreprise, Sundar Pichai, avait même déclaré que l'entreprise avait attendu pour lancer son chatbot parce qu'il n'était pas prêt. « Nous n'avions pas encore atteint un niveau où nous pouvions le commercialiser et où les gens auraient accepté que Google lance ce produit. Il présentait encore beaucoup de problèmes à l'époque », a déclaré Pichai.

Le lancement et l’évolution de Gemini ont marqué un changement de rythme. Là où les premières réponses de Google semblaient défensives, la firme a progressivement déployé un modèle plus cohérent, mieux intégré et techniquement plus ambitieux. Ce basculement n’a pas été immédiat, mais il s’est opéré de manière continue, presque imperceptible pour le grand public.

Gemini 3, le LLM qui change la donne ?

En novembre 2025, Google a annoncé Gemini 3, un modèle d'intelligence artificielle amélioré, près de huit mois après le lancement de Gemini 2.5. La société a déclaré que sa dernière suite de modèles d'IA exigera des utilisateurs qu'ils fournissent « moins d'indications » pour obtenir les résultats souhaités. Google a également annoncé une nouvelle plateforme d'agents appelée « Google Antigravity », qui permet aux développeurs de coder « à un niveau supérieur, axé sur les tâches ».

À la suite de cette annonce, Geoffrey Hinton, le « parrain de l'IA », a récemment estimé que Google est en train de rattraper OpenAI dans la course à l'intelligence artificielle (IA) [voir ci-dessous].Hinton, professeur émérite à l'université de Toronto et ancien expert de Google Brain, s'est également dit surpris que Google ait mis autant de temps à dépasser ses concurrents. Dans une interview accordée à Business Insider, lorsqu'il a été question de la position de Google par rapport à OpenAI, Hinton a déclaré : « Je pense qu'il est en fait plus surprenant que Google ait mis autant de temps à dépasser OpenAI. Je pense qu'à l'heure actuelle, ils commencent à le dépasser ».

Cette déclaration fait suite au lancement très apprécié de Gemini 3 de Google, une mise à jour qui, selon de nombreux acteurs du monde technologique, a permis à l'entreprise de dépasser le GPT-5 d'OpenAI. Le modèle d'image Nano Banana Pro AI de Google a également connu un grand succès. Ce changement intervient trois ans après que Google aurait déclaré « code rouge » à la suite de la sortie initiale de ChatGPT, des rapports récents suggérant désormais que c'est OpenAI qui pourrait tirer la sonnette d'alarme.

Geoffrey Hinton affirme que Google dispose d'un avantage en matière de puces IA. Outre le lancement réussi de son tout dernier modèle d'IA, le cours de l'action Google a augmenté après que des rapports ont suggéré que l'entreprise pourrait conclure un accord d'un milliard de dollars pour fournir à Meta, la société mère de Facebook, ses propres puces IA. La création de ses propres puces est un « avantage considérable » pour Google, a fait remarquer Hinton. Il a déclaré : « Google dispose de nombreux chercheurs très compétents et, bien sûr, d'une grande quantité de données et de nombreux centres de données. Je pense que Google va gagner. »

Gemini, un modèle pensé comme une plateforme

Avec Gemini, Google n’a pas cherché à empiler un énième modèle conversationnel, mais à concevoir une architecture unifiée capable de traiter nativement texte, image, audio, vidéo et code. Contrairement à des modèles conçus initialement pour le texte puis étendus par couches successives, Gemini a été pensé dès l’origine comme multimodal [il a été entraine en meme temps sur tous les types de données et non sur langage puis img puis video avec ajout de plug-in].

Ce choix technique a des implications concrètes. Il permet une meilleure cohérence entre les différents types de données, une réduction des pertes d’information entre modules et une plus grande efficacité lors de tâches complexes combinant raisonnement, compréhension visuelle et génération de contenu. Dans les benchmarks académiques comme dans de nombreux tests internes, certaines versions de Gemini ont commencé à dépasser ou à égaler leurs concurrents directs sur des tâches de raisonnement avancé.

Une intégration silencieuse mais massive dans l’écosystème Google

L’un des atouts majeurs de Google réside dans son écosystème existant. Gemini n’est pas seulement un produit autonome : il est progressivement injecté dans la recherche, les outils bureautiques, le développement logiciel, la gestion des données et les services cloud. Cette diffusion progressive, souvent peu spectaculaire, contraste avec des lancements plus bruyants mais confère à Google un avantage structurel.

Là où certains acteurs doivent convaincre les utilisateurs d’adopter de nouveaux outils, Google intègre Gemini dans des usages quotidiens déjà installés. Cette approche limite les frictions, permet une collecte de retours à grande échelle et accélère l’itération des modèles dans des conditions réelles.

Des moyens industriels difficiles à égaler

Sur le plan purement industriel, Google dispose d’un avantage rarement mis en avant dans les débats publics : sa maîtrise de l’infrastructure. Entre ses centres de données, ses accélérateurs maison et son expérience dans l’optimisation à grande échelle, le groupe peut entraîner, déployer et ajuster des modèles de très grande taille sans dépendre entièrement de fournisseurs externes.

Cette autonomie réduit les coûts marginaux, sécurise les chaînes d’approvisionnement en calcul et offre une flexibilité stratégique importante à long terme. Dans une course où l’accès à la puissance de calcul devient un facteur déterminant, cet élément pèse lourdement.

Un facteur important pour Gemini 3 était la manière dont il a été entraîné : à l'aide des TPU de Google, une puce hautement spécialisée que l'entreprise développe depuis des années précisément dans ce but. Google est certes sensible à certains problèmes de fabrication et à la hausse des prix de la RAM, comme tout le monde, mais contrairement à la quasi-totalité de ses concurrents, il ne dépend pas de la chaîne d'approvisionnement de Nvidia. Google est en mesure d'optimiser l'ensemble de son système pour le rendre meilleur, plus rapide et moins cher. Personne d'autre ne dispose d'un tel contrôle complet sur son destin en matière d'IA.

Gemini va équiper la prochaine version de Siri, permettant à Apple de transformer son assistant IA

Que faire lorsque l'on dispose de la technologie nécessaire ? La présenter au public et la mettre en œuvre. Lundi, Google et Apple ont annoncé que Gemini équiperait la prochaine génération de Siri, qui sortira plus tard cette année. C'est une grande victoire pour Apple, qui dépenserait 1 milliard de dollars par an dans l'espoir de transformer Siri en un assistant IA réellement utile, pour une fois.

Pour Google, c'est tout aussi important. Le fait qu'Apple affirme qu'il s'agit de « la meilleure technologie disponible » est évidemment un signal fort pour le marché, mais plus encore, Siri devient immédiatement l'un des moyens les plus populaires d'interagir avec Gemini.

[B]Sortie de « Personnal Intelligence..

----------

Geoffrey Hinton, le « parrain de l'IA », affirme que Google « commence à dépasser » OpenAI.

En novembre 2025, Google a annoncé Gemini 3, un modèle d'intelligence artificielle amélioré, près de huit mois après le lancement de Gemini 2.5. À la suite de cette annonce, Geoffrey Hinton, le « parrain de l'IA », a récemment estimé que Google est en train de rattraper OpenAI dans la course à l'intelligence artificielle (IA). Hinton, professeur émérite à l'université de Toronto et ancien expert de Google Brain, s'est également dit surpris que Google ait mis autant de temps à dépasser ses concurrents. Dans une interview accordée à Business Insider, lorsqu'il a été question de la position de Google par rapport à OpenAI, Hinton a déclaré : « Je pense qu'il est en fait plus surprenant que Google ait mis autant de temps à dépasser OpenAI. Je pense qu'à l'heure actuelle, ils commencent à le dépasser ».

Hinton, qui a contribué au développement des premières recherches en IA lorsqu'il travaillait chez Google Brain, a déclaré que la société de recherche était autrefois leader dans le domaine de l'IA, mais qu'elle avait choisi de se retenir. « Google a longtemps été en tête, n'est-ce pas ? Google a inventé les transformateurs. Google disposait de chatbots performants avant tout le monde », a souligné Hinton.

Cependant, Google s'est montré prudent après l'échec en 2016 du lancement par Microsoft de son chatbot IA « Tay », qui a connu une existence éphémère, la société ayant décidé de le fermer après qu'il ait publié des tweets extrêmement racistes, a expliqué Hinton. « Google, qui jouissait évidemment d'une très bonne réputation, craignait de la voir ternie de cette manière », a ajouté Hinton.

Google a connu quelques lancements de produits difficiles par le passé. L'année dernière, il a dû arrêter son générateur d'images IA parce que les gens disaient qu'il créait des images historiquement incorrectes de personnes de couleur et qualifiaient les résultats de « trop politiquement corrects ». Les versions précédentes de son outil de recherche IA donnaient également des conseils étranges, comme dire aux utilisateurs de mettre de la colle sur leur pizza pour empêcher le fromage de glisser.

Google fait également un don de 10 millions de dollars canadiens pour aider à financer la chaire Hinton en intelligence artificielle à l'université de Toronto, et l'université versera une somme équivalente. Hinton, qui a quitté Google en 2023 en raison de ses inquiétudes concernant les risques liés à l'IA, s'est depuis exprimé publiquement sur les dangers tels que la perte d'emplois et le fait que l'IA pourrait dépasser l'intelligence humaine. En 2024, il a même reçu le prix Nobel de physique.

Dans un communiqué, l'entreprise a déclaré : « Les travaux de Geoff sur les réseaux neuronaux, menés pendant ses années universitaires et sa décennie chez Google, ont jeté les bases de l'IA moderne. Cette chaire rend hommage à son héritage et aidera l'université à recruter des chercheurs visionnaires qui se consacreront au même type de recherche fondamentale motivée par la curiosité que Geoff a défendue. »

Les déclarations de Hinton interviennent alors qu'un rapport a récemment révélé qu'OpenAI aurait besoin de lever au moins 207 milliards de dollars d’ici 2030 pour poursuivre sa trajectoire actuelle, selon des projections de l'équipe américaine de HSBC chargée des logiciels et des services, relayées dans la presse économique. À l’échelle du secteur technologique, ce chiffre frôle l’irréel. Pourtant, il reflète une réalité devenue incontournable : l’intelligence artificielle moderne coûte une fortune monumentale, et chaque nouveau palier technologique transforme cette facture en précipice.

Geoffrey Hinton, parrain de l'IA, affirme que les géants de la technologie ne peuvent tirer profit de leurs investissements astronomiques que si la main-d'œuvre humaine est remplacée

 Les actions Nvidia chutent de 4 % après l'annonce que Meta utilisera les unités de traitement de tenseur (TPU) de Google, une puce spécialisée hautement efficace pour l'IA, dans ses centres de données en 2027

 L'avance d'OpenAI sur les autres entreprises d'IA a largement disparu après la sortie de Claude d'Anthropic, Gemini de Google, Grok de X, ainsi que Llama de Meta, selon un rapport sur l'état de l'IA

Source : Interview de Geoffrey Hinton accordée à Business Insider

Entrevue avec Yoshua Bengio par Les Sceptiques du Québec

On y explore les promesses et les pièges de la révolution en cours. Ce dimanche, le chercheur montréalais Yoshua Bengio parle avec notre chroniqueur de ses regrets, mais aussi de son espoir de rendre un jour les systèmes d’IA plus sûrs.
On va devoir bientôt développer la psychorobotique telle qu'imaginée par Asimov. Et, peut-être, s'inspirer de ses lois de la robotique:
"Alors que les prochaines décennies vont voir les avancées de l’IA et de la robotique, quelles barrières ou mesures juridiques mettre en place pour s’assurer que ces entités ne fassent pas de mal aux humains ? En 1942, l’écrivain américain d’origine russe Isaac Asimov (1920-1992) a présenté ses célèbres Trois lois de la robotique dans une nouvelle intitulée Cercle vicieux (Runaround) – ou Cycle fermé – qui met en scène les interactions d’un robot intelligent avec les humains. Les Trois lois sont les suivantes : (1) un robot ne peut porter atteinte à un être humain, ni, en restant passif, permettre qu’un être humain soit exposé au danger ; (2) un robot doit obéir aux ordres qui lui sont donnés par un être humain, sauf si de tels ordres entrent en conflit avec la première loi ; (3) un robot doit protéger son existence tant que cette protection n’entre pas en conflit avec la première ou la deuxième loi. Par la suite, Asimov a écrit beaucoup d’histoires montrant les conséquences inattendues que pouvaient avoir ces trois lois simples.
Plus tard, il ajouta une autre loi : « un robot ne peut pas faire de mal à l’humanité, ni, par son inaction, permettre que l’humanité soit blessée. » Ces lois ont influencé non seulement les auteurs de science-fiction, mais aussi les experts en intelligence artificielle. Après avoir découvert les lois d’Asimov, le chercheur en IA Marvin Minsky (1927-2016) indiqua qu’il « ne cessa jamais de s’interroger sur la manière dont pouvaient fonctionner les esprits…" 

Yann Le Cun, le 15 janvier 2026 : « Pourquoi je quitte Meta pour créer ma start-up d’IA »

Avec journalistes "le monde"

L’ex-directeur de la recherche fondamentale en intelligence artificielle de Meta justifie le lancement de sa start-up, spécialisée dans le monde physique, par ses divergences avec le groupe américain, et prédit une « troisième révolution de l’IA ».
A 65 ans, Yann Le Cun, le ponte de l’intelligence artificielle (IA) aux yeux clairs pétillants derrière ses éternelles lunettes Ray-Ban Wayfarer, veut ouvrir un nouveau chapitre de sa vie. Après avoir posé, comme chercheur, les bases de l’IA moderne – ce qui lui a valu de recevoir le prestigieux prix Turing 2018, avec deux confrères, Yoshua Bengio et Geoffrey Hinton –, puis dirigé pendant plus de douze ans la recherche fondamentale en IA chez Meta, le Français lance sa start-up, baptisée « AMI », pour Advanced Machine Intelligence, qu’il rêve en « entreprise mondiale ».

Il réserve les détails de sa levée de fonds (estimée à 500 millions d’euros) et le casting de son équipe à des annonces courant février. On sait seulement que son siège sera à Paris et qu’il a déjà enrôlé l’ex-directeur de Meta France Laurent Solly, ainsi qu’Alex LeBrun, fondateur de la start-up d’IA spécialisée dans la santé Nabla. L’entrepreneur, installé en partie à New York, ambitionne qu’AMI contribue à ouvrir une nouvelle phase de l’IA : « Après l’apprentissage profond il y a douze ans, puis l’avènement des chatbots comme ChatGPT ou Gemini, il y a trois ans, il va y avoir une troisième révolution : celle des IA qui comprennent le monde réel, le monde physique », a-t-il assuré, jeudi 15 janvier, lors d’une rencontre à Paris avec quelques journalistes, promettant des applications dans l’industrie ou la robotique. Le chercheur ne cache pas que son départ de Meta est lié à des désaccords stratégiques.

Autre entrevue le 13 janvier 2026

C’est au restaurant étoilé Pavyllon, à deux pas du Grand Palais parisien, que Yann LeCun s’est confié au Financial Times dans le cadre de sa série « Lunch with the FT ».

Attablé pour un déjeuner de trois heures et demie, le chercheur français de 64 ans a expliqué sans détour pourquoi il a décidé de quitter Meta après onze ans de bons et loyaux services. « Rester est devenu politiquement difficile », confie-t-il. Une litote pour décrire une rupture qui révèle les tensions croissantes au sein du groupe californien sur la direction à prendre en matière d’IA.

LLM : un modèle en fin de course

Au cœur du conflit : une divergence fondamentale sur l’avenir technologique de l’intelligence artificielle. LeCun, prix Turing et figure tutélaire du deep learning, ne croit pas aux grands modèles de langage comme voie vers la super-intelligence. Pour lui, les LLM sont utiles mais limités, contraints par le langage seul. Une conviction qui détonne dans une Silicon Valley obsédée par cette approche.

Lire aussi : IA générative : Wikipedia fait enfin passer les chatbots à la caisse
Le problème ? Meta vient justement de miser massivement sur cette technologie. Après le lancement de ChatGPT fin 2022, l’entreprise a réorganisé ses équipes autour de Llama, son propre modèle de langage.

Le tournant s’opère véritablement en 2025. Mark Zuckerberg, déçu par les performances de Llama 4, décide de frapper fort. Il investit 15 milliards $ dans Scale AI et embauche son patron, Alexandr Wang, 28 ans, pour diriger le nouveau laboratoire de recherche TBD Lab. Une décision qui place ce jeune entrepreneur à la tête de l’unité de recherche en IA de Meta. Ses nouvelles recrues, attirées à coups de primes pouvant atteindre 100 millions $, sont selon LeCun « complètement convaincues par les LLM ».  LeCun se retrouve ainsi managé par quelqu’un qu’il qualifie de « jeune » et « inexpérimenté ». S’il reconnaît que Alexandr Wang apprend vite, il souligne son manque d’expérience en matière de recherche fondamentale. « On ne dit pas à un chercheur ce qu’il doit faire. On ne dit certainement pas à un chercheur comme moi ce qu’il doit faire », lance-t-il.
La communication se dégrade également avec l'unité IA générative. LeCun regrette que ses équipes proposent des innovations ambitieuses quand la direction ne retient que des projets éprouvés et sans risque. Une prudence qui, selon lui, conduit l'entreprise à prendre du retard.

Une organisation bouleversée

Plus profondément, LeCun refuse de renier ses convictions scientifiques. Certains chez Meta aimeraient qu'il cesse de proclamer publiquement que les LLM constituent une impasse pour atteindre la super-intelligence. Mais le chercheur ne transige pas : « Je ne vais pas changer d'avis parce qu'un type pense que j'ai tort. Je n'ai pas tort. Mon intégrité de scientifique ne me le permet pas. »

Cette inflexibilité s'explique aussi par sa vision alternative : les modèles du monde, ou world models, qu'il développe depuis des années. Cette architecture baptisée V-JEPA vise à donner aux machines une compréhension du monde physique en apprenant à partir de vidéos, et non uniquement du langage. Une approche qui intéresse davantage l'industrie lourde et l'aéronautique que les réseaux sociaux.

Cap vers AMI Labs

LeCun prépare désormais son prochain chapitre : Advanced Machine Intelligence Labs, une start-up qui incarnera sa vision de l'intelligence artificielle avancée. Il y occupera le poste de président exécutif, laissant la direction opérationnelle à Alex LeBrun, cofondateur de la startup française Nabla. Une structure qui lui permettra de conserver la liberté de recherche qu'il chérissait chez Meta. Pourquoi ne doit pas prendre le rôle de CEO ?  « Je suis à la fois trop désorganisé et trop vieux ! » confie Yann LeCun.

Lire aussi : On en sait (un peu) plus sur la future startup de Yann LeCun
Le chercheur promet des premières versions de sa technologie dans les douze mois. Pas encore la super-intelligence, mais un chemin vers celle-ci. Emmanuel Macron lui-même aurait manifesté sa satisfaction de voir cette nouvelle entreprise mondiale maintenir des liens étroits avec la France.

Après des décennies passées à façonner l'IA moderne, Yann LeCun entame donc un nouveau cycle. Son ambition ? Augmenter la quantité d'intelligence dans le monde. « L'intelligence, c'est vraiment ce dont nous devrions avoir davantage », affirme-t-il.

 Références

https://intelligence-artificielle.developpez.com/actu/379290/Trois-ans-apres-avoir-ete-pris-au-depourvu-par-ChatGPT-Gemini-est-il-en-train-de-gagner-Des-benchmarsks-et-des-chercheurs-suggerent-que-Gemini-a-ce-qu-il-faut-pour-detroner-OpenAI-et-tous-ses-concurrents/

https://intelligence-artificielle.developpez.com/actu/378248/Geoffrey-Hinton-le-parrain-de-l-IA-affirme-que-Google-commence-a-depasser-OpenAI-Je-pense-que-Google-va-gagner/

https://www.lemonde.fr/economie/article/2026/01/16/yann-le-cun-pourquoi-je-quitte-meta-pour-creer-ma-start-up-d-ia_6662500_3234.html

https://www.silicon.fr/business-1367/yann-lecun-quitte-meta-les-coulisses-dune-rupture-225126