Wednesday, June 24, 2026

GLM-5.2 est un LLM de 744 milliards de paramètres et contexte d’un million de tokens de la société chinoise Z.ai Zhipu, sorti le 13 juin 2026, open.

 


Sur FrontierSWE, un test conçu pour mesurer si une IA peut mener à bout un projet technique de plusieurs heures, GLM-5.2 atteint 74,4 %. Il passe devant GPT-5.5 (72,6 %) et finit à un cheveu de Claude Opus 4.8 (75,1 %). Même logique sur SWE-bench Pro, un autre test de génie logiciel : 62,1 pour GLM-5.2, contre 58,6 pour GPT-5.5.

Le coup de force de GLM-5.2, ce n’est pas que la performance. C’est le modèle économique. Via l’API de Z.ai, le modèle coûte 1,40 dollar (environ 1,30 €) par million de tokens en entrée et 4,40 dollars (environ 4 €) en sortie. À titre de comparaison, GPT-5.5 demande 5 dollars en entrée et 30 dollars en sortie, soit près de six fois plus cher côté sortie.

GLM-5.2 est conçu pour exécuter de longues tâches de plusieurs heures voire plusieurs jours de programmation, et des flux de travail autonomes (agentique). 

Au-delà des scores, c’est l’exploit industriel derrière GLM-5.2 qui force le respect. Le modèle s’appuie sur une architecture Mixture-of-Experts (MoE) de 744 milliards de paramètres au total, dont seuls 40 milliards sont actifs par inférence. Fait remarquable : les gains massifs par rapport à la version 5.1 ne découlent pas d’une augmentation de la taille du modèle, mais uniquement d’optimisations logicielles au cours de l’entraînement.

Inscrite sur la liste noire des entités américaines et privée de tout accès aux puces de dernière génération de la Silicon Valley, Z.AI (qui a réussi son introduction en bourse à Hong Kong en janvier 2026) a développé ce monstre technologique sur du matériel informatique alternatif, sans aucun composant Nvidia.

Le modèle est distribué sous la très permissive licence MIT, avec des poids téléchargeables librement depuis Hugging Face. Sa fenêtre de contexte passe de 200 000 à 1 million de tokens, offrant une stabilité de traitement des contextes longs saluée par les ingénieurs.

huggingface

Serve GLM-5.2 Locally: https://huggingface.co/zai-org/GLM-5.2

GLM-5.2 supports deployment with the following frameworks. Feel free to try them out:

SGLang (v0.5.13.post1+) — see cookbook

vLLM (v0.23.0+) — see recipes

Transformers (v0.5.12+) — see transformers docs

KTransformers (v0.5.12+) — see tutorial

Unsloth (v0.1.47-beta+) — see guide

For deployment on the Ascend NPU platform, inference frameworks such as vLLM-Ascend, xLLM and SGLang are supported — see here.

ArXiv

We present GLM-5, a next-generation foundation model designed to transition the paradigm of vibe coding to agentic engineering. Building upon the agentic, reasoning, and coding (ARC) capabilities of its predecessor, GLM-5 adopts DSA to significantly reduce training and inference costs while maintaining long-context fidelity. To advance model alignment and autonomy, we implement a new asynchronous reinforcement learning infrastructure that drastically improves post-training efficiency by decoupling generation from training. Furthermore, we propose novel asynchronous agent RL algorithms that further improve RL quality, enabling the model to learn from complex, long-horizon interactions more effectively. Through these innovations, GLM-5 achieves state-of-the-art performance on major open benchmarks. Most critically, GLM-5 demonstrates unprecedented capability in real-world coding tasks, surpassing previous baselines in handling end-to-end software engineering challenges. 

https://arxiv.org/abs/2602.15763


Référence

https://www.frandroid.com/culture-tech/intelligence-artificielle/3143733_voici-glm-5-2-lia-chinoise-gratuite-qui-bat-gpt-5-5-et-talonne-claude-opus-4-8-pour-six-fois-moins-cher

https://legrandcontinent.eu/fr/2026/06/23/avec-glm-5-2-la-chine-a-t-elle-ouvert-un-nouveau-moment-deepseek/

https://goodtech.info/des-pdg-de-la-tech-saluent-glm-52-chinois-meilleur-modele-ia-open-weights/

No comments:

Post a Comment