LLMs провалили взлом: эксперимент за $1,500 показал пределы

Разработчик создал умышленно уязвимое веб-приложение и потратил $1,500, тестируя, смогут ли большие языковые модели взломать его автономно. В эксперименте участвовали GPT-4, Claude и open-source модели. Им ставили задачу эксплуатировать стандартные уязвимости: SQL-инъекции, межсайтовый скриптинг. Результат: ни одна LLM не выполнила полную цепочку атак самостоятельно. Модели спотыкались на многошаговых рассуждениях и адаптации к динамической среде, часто застревая на тривиальных препятствиях.

Это обнадёживающий сигнал для кибербезопасности. Идея AI-апокалипсиса в хакинге была преувеличена. LLM мощны в генерации текста, но им не хватает структурного мышления и адаптивности для реальных атак. Они напишут фишинговое письмо, но не соберут цепочку эксплойтов как живой пентестер.

Реальность — это аугментация, а не замена. Специалисты по безопасности могут использовать LLM как инструменты для автоматизации рутины, но основа хакинга остаётся человеческим ремеслом. Эксперимент показал: AI пока не готов к автономному взлому систем. Напоминание: у нас есть время выстроить защиту, пока AI не догнал.