Компания Z.ai из Китая анонсировала GLM-5.1 — обновление своей флагманской модели, которое заняло первое место в бенчмарке SWE-Bench Pro, получив 58,4 балла. Это значительно выше результатов GPT-5.4 (57,7), Claude Opus 4.6 (57,3) и Gemini 3.1 Pro (54,2). Модель доступна на HuggingFace под лицензией MIT.

Главное преимущество GLM-5.1 заключается не только в высоких цифрах, но и в концепции. Создатели отметили, что предыдущие модели быстро исчерпывали свои возможности. В отличие от них, GLM-5.1 спроектирована для продолжительного использования: она разбивает задачи на части, проводит эксперименты и адаптирует стратегию на основе анализа результатов.

В ходе тестирования модель продемонстрировала свои возможности в трех сценариях. В первом сценарии GLM-5.1 создала полноценное веб-приложение, имитирующее десктоп Linux, за восемь часов. Во втором случае, работая с VectorDBBench, модель увеличила скорость поиска соседей до 21,5 тысячи запросов в секунду — это почти в шесть раз больше предыдущего рекорда. Третий сценарий, связанный с оптимизацией GPU-ядер, показал ускорение в 3,6 раза, однако Claude Opus 4.6 остаётся лидером с 4,2×.

GLM-5.1 доступна подписчикам GLM Coding Plan и совместима с несколькими платформами. Однако разработчики признают, что модели всё ещё сложно поддерживать связность на длинных трассах запросов, и работа над оптимизацией продолжается.