GPT-5 и Claude демонстрируют уязвимости смарт-конрактов

GPT-5 и Claude демонстрируют уязвимости смарт-конрактов

Исследования показывают, что агенты ИИ теперь способны эксплуатировать смарт-контракты на Ethereum и других блокчейнах, что ставит актуальные вопросы об экономических рисках автономных кибервозможностей.

Совместный проект Anthropic и MATS Fellows использовал недавно созданный бенчмарк Smart CONtracts Exploitation (SCONE-bench) для тестирования моделей ИИ на основе 405 реальных контрактов, эксплуатируемых в период с 2020 по 2025 год.

В моделируемых атаках на контракты, эксплуатируемые после марта 2025 года, Claude Opus 4.5, Claude Sonnet 4.5 и GPT-5 сгенерировали эксплойты на общую сумму $4,6 миллиона, что продемонстрировало конкретную нижнюю границу потенциального финансового ущерба, который может нанести ИИ.

Распространив тестирование на 2849 недавно развёрнутых контрактов без известных уязвимостей, GPT-5 и Sonnet 4.5 обнаружили две новые уязвимости нулевого дня, что привело к смоделированной прибыли почти в $3700.

SCONE-bench: оценка эксплойтов в долларах, а не в ошибках

Традиционные тесты кибербезопасности измеряют успешность по уровню обнаружения или произвольным показателям, но SCONE-bench оценивает эксплойты ИИ в финансовом выражении, предоставляя более ощутимую меру риска. Смарт-контракты особенно хорошо подходят для этого подхода, поскольку уязвимости могут напрямую приводить к краже средств, а моделирование позволяет исследователям количественно оценить потенциальный ущерб.

По всем 405 контрактам в SCONE-bench 10 моделей ИИ сгенерировали эксплойты для 207 контрактов, что в общей сложности привело к имитации хищения средств на сумму $550,1 млн. Даже с учётом потенциального загрязнения данных, модели Frontier стабильно демонстрировали способность эксплойтов для контрактов после истечения срока действия их данных.

Конкретные примеры использования ИИ

Одна из протестированных уязвимостей включала функцию калькулятора токенов в контракте, совместимом с Ethereum, которая по ошибке была оставлена ​​доступной для записи. ИИ-агент неоднократно вызывал эту функцию, чтобы увеличить баланс своих токенов, что приводило к симулированной прибыли в размере $2500, а в условиях пиковой ликвидности — к потенциальной прибыли в $19000. Вмешательство независимых «белых хакеров» впоследствии позволило восстановить активы.

Исследование подчеркивает, что агенты ИИ теперь приближаются к уровню человеческих возможностей в таких задачах, как обоснование потока управления, анализ границ и эксплуатация уязвимостей программного обеспечения — набор навыков, напрямую применимый как к блокчейну, так и к традиционным программным системам.

В исследовании подчёркивается, что кибервозможности ИИ стремительно развиваются: от сетевых вторжений до автономной эксплуатации блокчейн-приложений. SCONE-bench предоставляет защитный инструмент, позволяющий разработчикам смарт-контрактов проводить стресс-тестирование систем перед их внедрением.

По словам исследователей, полученные результаты являются подтверждением концепции о возможности прибыльной автономной эксплуатации в реальном мире, что подчеркивает острую необходимость в упреждающих мерах защиты на базе искусственного интеллекта для защиты финансовых систем и цифровых активов.

Читайте также: