Le coup de force de GLM-5.2, ce n’est pas que la performance. C’est le modèle économique. Via l’API de Z.ai, le modèle coûte 1,40 dollar (environ 1,30 €) par million de tokens en entrée et 4,40 dollars (environ 4 €) en sortie. À titre de comparaison, GPT-5.5 demande 5 dollars en entrée et 30 dollars en sortie, soit près de six fois plus cher côté sortie.
GLM-5.2 est conçu pour exécuter de longues tâches de plusieurs heures voire plusieurs jours de programmation, et des flux de travail autonomes (agentique).
Au-delà des scores, c’est l’exploit industriel derrière GLM-5.2 qui force le respect. Le modèle s’appuie sur une architecture Mixture-of-Experts (MoE) de 744 milliards de paramètres au total, dont seuls 40 milliards sont actifs par inférence. Fait remarquable : les gains massifs par rapport à la version 5.1 ne découlent pas d’une augmentation de la taille du modèle, mais uniquement d’optimisations logicielles au cours de l’entraînement.
Inscrite sur la liste noire des entités américaines et privée de tout accès aux puces de dernière génération de la Silicon Valley, Z.AI (qui a réussi son introduction en bourse à Hong Kong en janvier 2026) a développé ce monstre technologique sur du matériel informatique alternatif, sans aucun composant Nvidia.
Le modèle est distribué sous la très permissive licence MIT, avec des poids téléchargeables librement depuis Hugging Face. Sa fenêtre de contexte passe de 200 000 à 1 million de tokens, offrant une stabilité de traitement des contextes longs saluée par les ingénieurs.
huggingface
Serve GLM-5.2 Locally: https://huggingface.co/zai-org/GLM-5.2
GLM-5.2 supports deployment with the following frameworks. Feel free to try them out:
SGLang (v0.5.13.post1+) — see cookbook
vLLM (v0.23.0+) — see recipes
Transformers (v0.5.12+) — see transformers docs
KTransformers (v0.5.12+) — see tutorial
Unsloth (v0.1.47-beta+) — see guide
For deployment on the Ascend NPU platform, inference frameworks such as vLLM-Ascend, xLLM and SGLang are supported — see here.
ArXiv
https://arxiv.org/abs/2602.15763
Référence
https://goodtech.info/des-pdg-de-la-tech-saluent-glm-52-chinois-meilleur-modele-ia-open-weights/

No comments:
Post a Comment