AI 스타트업 앤스로픽은 화요일, 12개의 기술 및 금융 거물들과 연합하여 미공개 '클로드 미토스 프리뷰(Claude Mythos Preview)' 모델을 배치해 핵심 소프트웨어 취약점을 찾고 패치하는 '프로젝트 글래스윙(Project Glasswing)'을 시작했습니다. 이 이니셔티브는 구글과 마이크로소프트 같은 경쟁자들은 물론, 크라우드스트라이크(CrowdStrike)와 팔로알토 네트웍스(Palo Alto Networks) 같은 기존 사이버 보안 업체들을 결집시켜 AI 기반 위협보다 한발 앞서 나가는 것을 목표로 합니다.
앤스로픽의 프런티어 레드 팀 사이버 리드인 뉴턴 쳉(Newton Cheng)은 인터뷰에서 "AI의 발전 속도를 고려할 때, 이러한 능력이 확산되는 것은 시간 문제입니다... 경제, 공공 안전, 국가 안보에 미치는 여파는 심각할 수 있습니다"라고 말했습니다.
회사 발표에 따르면, 이 모델은 이미 수천 개의 결함을 식별했으며, 여기에는 보안이 강화된 OpenBSD 운영체제의 27년 된 취약점과 FFmpeg 비디오 라이브러리의 16년 된 버그가 포함됩니다. 사이버짐(CyberGym) 평가 벤치마크에서 미토스 프리뷰는 83.1%를 기록하여, 앤스로픽의 차선책 모델인 클로드 오퍼스 4.6(Claude Opus 4.6)의 66.6%를 크게 앞질렀습니다.
이 프로젝트는 앤스로픽의 연간 매출이 300억 달러를 돌파하고 2026년 10월 IPO 가능성이 보고되는 가운데 방어자들에게 선제권을 주는 것을 목표로 합니다. 팔로알토 네트웍스와 크라우드스트라이크와 같은 파트너들에게 이 이니셔티브는 AI 기반 공격이 사이버 보안 섹터를 재편하고 있는 상황에서 AI의 방어 능력을 검증하는 중요한 시험대입니다. 지난달 이 모델의 성능에 대한 소식이 전해지자 두 회사의 주가는 하락한 바 있습니다.
공개하기에 너무 위험한 모델
앤스로픽은 클로드 미토스 프리뷰의 고급 사이버 보안 능력 때문에 일반에 공개하지 않을 것이라고 밝혔습니다. 회사의 내부 테스트 결과, 이 모델은 리눅스 커널에서 여러 취약점을 자율적으로 찾아내고 연결하여 일반 사용자 권한에서 머신 전체 제어 권한으로 상승시킬 수 있는 것으로 나타났습니다. 코딩 벤치마크 성적은 능력의 격차를 보여주는데, SWE-벤치 베리파이드(SWE-bench Verified)에서 93.9%를 기록한 반면 오퍼스 4.6은 80.8%에 그쳤습니다.
앤스로픽은 파트너들에게 최대 1억 달러의 사용 크레딧을 약속하고, 공개 프로세스를 관리하기 위해 리눅스 재단(Linux Foundation)과 아파치 소프트웨어 재단(Apache Software Foundation)을 포함한 오픈 소스 보안 기관에 400만 달러를 기부하고 있습니다. 리눅스 재단의 CEO 짐 제믈린(Jim Zemlin)은 "과거에 보안 전문 지식은 사치였습니다. 프로젝트 글래스윙은 그 공식을 바꿀 수 있는 확실한 길을 제시합니다"라고 말했습니다.
보안 사고 속에서 투명성에 건 도박
이번 발표는 3월 내부 문서를 노출시킨 CMS 설정 오류와 클로드 코드(Claude Code) 도구의 소스 코드를 잠시 유출시킨 패키징 오류 등 앤스로픽에 발생한 몇 차례 당혹스러운 보안 사고 이후에 나온 것입니다. 회사는 이것들이 배포 도구의 인적 오류이며 핵심 보안 아키텍처의 침해는 아니라고 밝혔지만, 파트너들에게 가장 강력한 모델에 의존하라고 요구하는 시점에서 신뢰에 대한 의문이 제기되고 있습니다.
앤스로픽은 이 프로젝트가 필요한 도박이라고 주장합니다. 회사는 미토스 프리뷰와 같은 모델의 능력이 몇 년이 아닌 몇 달 안에 널리 퍼질 것이라고 믿고 있으며, 유일하게 책임감 있는 조치는 방어자들을 먼저 무장시키는 것이라고 생각합니다. 이는 유사한 공격 도구가 부주의한 자들의 손에 들어가기 전에, 지금 파트너들에게 제한된 접근 권한을 제공함으로써 더 강력한 방어를 구축할 수 있다는 도박입니다.
이 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.