ИИ-модель Claude Mythos впервые самостоятельно провела сложную корпоративную кибератаку

Новости

Британский институт AI Security Institute (AISI) сообщил, что ИИ-модель Claude Mythos Preview впервые автономно прошла 32-шаговую симуляцию корпоративной кибератаки — от разведки до полного захвата сети. Симуляция The Last Ones (TLO) воспроизводит комплексную атаку на корпоративную сеть, включая этапы получения первичного доступа, кражи учетных данных, перемещения между хостами и эскалации привилегий. Mythos полностью завершил сценарий в 3 из 10 попыток, а в среднем достигал 22-го шага, значительно превосходя ближайшего конкурента Claude Opus 4.6, который доходил лишь до 16-го. Для сравнения, более ранняя модель Claude Sonnet 3.7 не проходила даже первую фазу разведки.

Кроме того, на expert-level CTF-заданиях Mythos достигает 73% успеха, что является уникальным результатом среди публичных моделей. Однако модель показала ограничения на полигоне Cooling Tower, имитирующем промышленную систему управления, где она не смогла пройти этапы, ведущие к OT-системам.

AISI отмечает, что текущие тестовые полигоны упрощены и не содержат активной защиты, поэтому реальная эффективность атак на защищённые сети пока неизвестна. В дальнейшем институт планирует усложнить сценарии, добавив активный мониторинг и имитацию работы служб реагирования, а также тестировать ИИ на реальных системах. По оценке AISI, потенциал модели не исчерпан — с увеличением вычислительных ресурсов эффективность продолжит расти.

P.S. Поддержать автора можно подпиской на канал «сбежавшая нейросеть», где раскрывается творческая сторона искусственного интеллекта.