인간의 개입 없이 스스로 후속 세대를 설계하고 구축할 수 있는 능력에 AI 시스템이 근접하고 있다고 Anthropic이 밝히며, 기술이 사회의 통제 역량을 앞지르기 전에 조정된 안전장치가 시급하다고 촉구했다.
인간의 개입 없이 스스로 후속 세대를 설계하고 구축할 수 있는 능력에 AI 시스템이 근접하고 있다고 Anthropic이 밝히며, 기술이 사회의 통제 역량을 앞지르기 전에 조정된 안전장치가 시급하다고 촉구했다.

인간의 개입 없이 AI 시스템이 스스로 후속 세대를 설계하고 구축할 수 있는 능력에 근접하고 있다고 Anthropic이 밝혔다. 이는 기술이 사회의 통제 능력을 앞지르기 전에 조정된 안전장치가 필요하다는 경고다.
Anthropic은 AI 개발이 예상보다 빠르게 가속화되고 있다고 경고했다. 자사의 Claude 모델이 현재 회사 프로덕션 코드베이스에 병합된 코드의 80% 이상을 작성하고 있는데, 이는 AI 시스템이 자율적으로 스스로를 발전시키는 '순환적 자기개선(recursive self-improvement)'을 향한 중대한 이정표다.
"우리는 항상 가장 좋은 방법은 개념을 사회화하고 사람들에게 다가올 일에 대한 감각을 주는 것임을 깨달았습니다"라고 Anthropic 공동창업자 잭 클라크(Jack Clark)는 인터뷰에서 말했다. "여기서 큰 이야기는 일부 대중적 의견과 달리 AI 발전이 앞으로 수년간 정체되거나 감소하는 것이 아니라 오히려 가속화될 것이라는 징후를 우리가 목격하고 있다는 점입니다."
이러한 변화로 인해 엔지니어 1인당 분기별로 배포되는 코드량이 회사의 20212025년 기준 대비 8배 증가했다고 마리나 파바로(Marina Favaro, Anthropic Institute 책임자)와 클라크가 목요일 게시한 블로그 게시물에서 밝혔다. 명확한 사양이 없는 복잡한 엔지니어링 문제에서 Claude의 성공률은 2026년 5월 기준 76%까지 상승했으며, 이는 6개월 만에 50포인트 상승한 수치다. 회사 내부의 Mythos Preview 모델은 AI 모델 학습 코드 최적화에서 숙련된 인간 개발자가 48시간의 수동 리팩토링을 통해 달성하는 일반적인 4배 개선과 비교해 52배의 속도 향상을 기록했다.
Anthropic은 "순환적 자기개선"이 대부분의 기관이 준비된 것보다 더 빨리 도래할 수 있다고 밝혔다. 회사는 위험이 확대될 경우 개발 속도를 늦추거나 일시 중단할 수 있는 프론티어 AI 연구소 간의 조정된 메커니즘을 촉구했다. 단일 기업의 일방적 행동은 글로벌 안전을 개선하기보다 리더십만 이전할 뿐이라고 경고했다. 파바로와 클라크는 "글로벌 조정 메커니즘이 없으면 기업과 정부는 경쟁 및 지정학적 압력 속에서 안전에 관한 어려운 결정을 내려야 할 것"이라고 적었다.
코딩 병목현상, 작성에서 검토로 이동
Anthropic의 내부 데이터에 따르면 AI 모델 개선 속도는 이전에 관찰된 7개월이 아닌 약 4개월마다 두 배로 증가하고 있다. 각 단계에서 인간의 역할은 점차 축소되고 있다. 인간과 AI가 작성한 코드 품질이 동등해지면(Anthropic은 올해 안에 이를 예상) 인간은 코드 작성을 완전히 중단하고 검토만 수행하게 된다. 그러나 검토자가 Claude의 생성 속도를 따라잡지 못하면 인간의 검토가 병목현상이 된다.
이를 해결하기 위해 Anthropic은 자동화된 Claude 검토자를 개발 파이프라인에 배포하여 모든 풀 리퀘스트(Pull Request)를 아키텍처 결함, 보안 취약점 및 회귀 버그(regression bug)에 대해 분석하도록 했다. 사후 분석 결과, 이 자동화된 계층이 claude.ai 웹사이트에서 과거 장애를 초래했던 프로덕션 버그의 약 3분의 1을 포착한 것으로 나타났다.
2026년 4월의 한 사례에서, Anthropic 엔지니어는 Claude를 배포하여 지속적인 API 오류 문제를 해결했다. 모델은 자율적으로 운영되며 800건이 넘는 개별 수정을 배포했고, 오류율을 1,000분의 1 수준으로 줄였다. 감독 엔지니어는 인간 개발자가 동일한 작업을 수행하는 데 4년이 걸렸을 것으로 추정했다.
거버넌스 격차와 향후 과제
OpenAI는 순환적 자기개선에 관한 자체 연구 결과를 발표했으며, 2025년 12월 블로그에서 연구자들이 이에 관한 정보를 공유하지 않을 경우 잠재적으로 위험한 현상이 될 수 있다고 설명했다. OpenAI는 안전 연구팀(Safety Research team)의 일환으로 순환적 자기개선 대비를 위한 연구원을 채용 중이다.
Anthropic은 향후 수개월 내에 정책 입안자, 연구자, 시민사회 단체 및 기타 AI 기업과의 논의를 소집하여 위험 관리 및 조정 메커니즘 개선 방안을 검토할 계획이다. 회사의 연구 부서인 Anthropic Institute는 잠재적 개발 둔화를 지원하는 데 필요한 시스템을 연구할 예정이다.
이러한 영향은 AI 연구소를 넘어 확장된다. 9650억 달러의 기업가치로 평가받은 투자 유치 라운드 이후 월요일에 미국 기업공개(IPO)를 비밀리에 신청한 Anthropic은 완전한 순환적 자기개선이 "인간이 AI 시스템에 대한 통제력을 상실할 위험을 증가시킬 수 있다"고 밝혔다. 투자자들에게 이러한 가속화는 경쟁 우위에 관한 의문을 제기한다. AI가 더 나은 AI를 구축할 수 있다면, 경쟁 우위는 독점적 훈련 데이터와 인간 엔지니어 인재에서 컴퓨팅 접근성 및 정렬 연구(alignment research)로 이동하게 되며, 이는 Anthropic, OpenAI, Google과 같은 자본력 있는 플레이어가 구조적 우위를 점하고 있는 분야다.
본 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.