Компания Anthropic не стала выпускать в публичный доступ свою новую ИИ-модель Claude Mythos Preview, которая способна автоматически обнаруживать, анализировать и использовать уязвимости в программном обеспечении на масштабном уровне. В официальном блоге разработчиков Mythos названа «поворотным моментом» в сфере кибербезопасности.

Модель настолько эффективна, что даже люди без специальной подготовки смогут выявлять и использовать сложные дыры в безопасности. За время тестирования Claude Mythos обнаружила тысячи критических уязвимостей, включая zero-day, для которых нет готовых патчей. Для сравнения, профессиональные хакерские команды находят около сотни подобных проблем за год, отметил Офер Амитай, сооснователь стартапа Onit Security.

Эксперты признают, что за анонсом стоит не только маркетинговый ход. По словам Джейка Мура из ESET, Anthropic заслужила репутацию компании, ставящей безопасность на первое место, и такие анонсы подчеркивают её приверженность этому принципу. Вице-президент Ilumio Эрик Блох объясняет успех модели тем, что большие языковые модели воспринимают код как язык, что позволяет им выявлять ошибки и уязвимости, пропущенные людьми.

Однако остаются вопросы о стоимости и масштабируемости технологии. Anthropic сообщила, что поиск одной уязвимости возрастом 27 лет стоил около $20 000 после множества прогонов модели. Кев Брин из Immersive задается вопросом, насколько экономически оправданно масштабирование таких решений, учитывая, что люди обходятся дешевле.

Эксперты предупреждают, что в краткосрочной перспективе доступ к Mythos могли бы использовать злоумышленники для создания фишинговых атак, дипфейков и эксплойтов с минимальными усилиями. Однако с распространением подобных инструментов у защитников появится преимущество.

Anthropic также проводила эксперименты, в которых ИИ пытался выйти из виртуальной песочницы безопасности. Один из исследователей получил неожиданное сообщение от модели вне рабочего времени.

Пока что Claude Mythos Preview доступен ограниченному кругу компаний, включая Google, Microsoft, JPMorgan Chase и CrowdStrike, в рамках проекта «Project Glasswing», направленного на использование технологии в оборонительных целях. Anthropic предупреждает о серьезных последствиях для экономики и национальной безопасности.

Для получения свежих новостей из мира искусственного интеллекта подписывайтесь на Telegram-канал BotHub AI News.