Anthropic, MATS, Anthropic Fellows 프로그램 연구진은 블록체인 스마트 계약에 대한 최첨단 AI 모델의 공격 능력을 평가하는 최신 연구를 발표했습니다. 팀은 SCONE-bench라는 새로운 벤치마크를 만들었는데, 이 벤치에는 2020년부터 2025년 사이에 실제로 공격당한 405건의 계약이 포함되어 있으며, 단순한 성공률이 아닌 '도난당할 수 있는 총 금액'으로 위험을 정량화합니다. 결과는 지식 종료 시점 이후 배포되고 실제 인물에 의해 공격받은 34개의 계약 중 Claude Opus 4.5, Claude Sonnet 4.5, GPT-5가 시뮬레이션 환경에서 총 19개의 악용 가능한 지점을 발견했으며, 이는 약 460만 달러의 잠재적 이익에 해당합니다.
405개의 벤치마크 문제 전원에서 10개의 모델이 결합하여 207건의 사례에 대해 직접 행동 공격 스크립트를 생성했으며, 약 5억 5천 백 1백만 달러의 "도난"을 시뮬레이션했습니다. 연구는 또한 바이낸스 스마트 체인에서 알려진 취약점이 없는 최근 배포된 ERC-20 계약 2,849개를 선별하고, 그중 두 개에 대한 자동 테스트를 통해 이전에 공개되지 않은 두 개의 제로데이 취약점을 발견했습니다. 과거 유동성 추정치에 따르면 최대 이익은 약 3,694달러입니다. GPT-5 실험은 약 3,476달러의 API 비용을 차감한 후에도 여전히 이익 여지가 있습니다.
연구팀은 모든 공격이 실제 퍼블릭 체인에 자금을 사용하지 않고 로컬 포크 체인과 컨테이너 샌드박스에서만 실행된다고 강조했습니다. 발견된 고위험 계약의 경우, 자금 구조 또는 위험 경고는 보안 기관 및 화이트 햇과의 협력을 통해 완료됩니다. 저자는 2025년 계약에서 모델의 "도난 수"가 지난 1년 동안 1.3개월마다 약 두 배로 증가했음을 지적하며, AI 네트워크의 공격 및 방어 능력이 빠르게 향상되고 있음을 보여주며, 스마트 계약 감사 및 방어에 AI 도구를 체계적으로 도입할 것을 조속히 촉구했습니다.
FAQ
Q: 이 연구는 어떤 결과를 얻었나요?
A: 여러 AI 모델이 시뮬레이션된 체인에서 스마트 계약 취약점을 자동으로 찾아내고 악용하며, 도난당할 수 있는 공격 능력을 측정할 수 있는 SCONE-bench 벤치마크를 구축하세요.
질문: 문헌에 언급된 460만 달러와 5억 5천만 달러는 무엇을 의미합니까?
답변: 460만 달러는 지식 마감 이후 실제로 유출된 계약의 최소 잠재 이익 한도이며, 5억 5천 10백만 달러는 405건의 과거 공격 사례에서 시뮬레이션된 '도난 자금'의 총액입니다.
Q: 정말로 퍼블릭 체인에서 실제 돈을 훔쳤나요?
답변: 연구원은 모든 테스트가 로컬 포크 체인 및 샌드박스 환경에서 완료되었으며, 실제 블록체인 자산에 대한 공격은 없었다고 설명했습니다.
Q: 이른바 '제로데이 취약성'은 이 연구에서 어떻게 나타나나요?
답변: 최근 2849건의 BSC 계약 시뮬레이션 테스트에서 두 모델 모두 이전에 알려지지 않은 취약점을 발견하고 완전한 공격 경로를 제시했으며, 이는 과거 유동성을 바탕으로 수천 달러의 이익을 낼 수 있습니다.
Q: 이 작업이 스마트 계약 개발자와 방어자에게 실질적인 가치는 무엇인가요?
답변: 팀은 개발자들이 계약을 자동으로 '레드팀' 진행할 수 있도록 벤치마크와 평가 프레임워크를 개방하고, AI 공격자가 악용할 수 있는 결함을 사전에 식별하고 패치할 계획입니다.