백악관, Anthropic에 두 AI 모델의 모든 탈옥 차단 요구…기술적으로 불가능한 규제 대치

트럼프 행정부가 Anthropic에 가장 진보된 AI 모델의 모든 탈옥 가능성을 차단하라고 요구하고 있다. 이는 기술적으로 불가능한 요청으로, 양측을 AI 규제의 미래를 둘러싼 교착 상태로 몰아넣었다.

백악관 고위 관료와 이 문제에 정통한 행정부 관료에 따르면, 백악관은 Anthropic의 Fable 5 및 Mythos 5 모델에서 모든 가능한 보안 취약점을 제거할 것을 요구하고 있다. 이는 기술적으로 달성 불가능한 기준으로, AI 규제의 미래를 둘러싼 대치 국면으로 확대되었다.

"문제는 백악관이 극도로 반규제적인 입장을 취해왔다는 점인데, 이제 사람들이 수년간 예측해온 실제 AI 역량과 직면하게 됐다는 것입니다,"라고 익명을 요구한 전 백악관 기술 관료는 말했다. "혜택과 위험을 관리하며 이를 체계적으로 처리할 준비와 정책이 있었어야 했는데, 대신 즉흥적인 접근 방식으로 AI 업계를 진퇴양난에 빠뜨렸습니다."

이 분쟁은 지난 6월 13일 백악관이 Anthropic에 수출 통제를 부과하면서 촉발됐다. 이로 인해 회사는 모든 사용자에 대해 두 모델의 접근을 중단해야 했다. 앤디 재시 아마존 CEO는 스콧 베센트 재무장관에게 연구원들이 가드레일 우회 증거를 발견했다고 경고했다. Anthropic은 해당 취약점이 제한적이며 의미 있는 보안 결함이 아니라고 주장했지만, 행정부는 외국 사용자의 모델 접근을 차단하는 방식으로 대응했다. 결국 Anthropic은 수출 통제를 준수하는 유일한 방법이라며 모델을 완전히 철회하기로 결정했다.

이번 대치에는 상당한 경제적 이해관계가 걸려 있다. Apple, Meta 및 포춘 500 대다수를 포함한 Anthropic의 기업 고객들은 회사의 가장 진보된 시스템에 접근하지 못하고 있다. 이 분쟁은 또한 회사의 신규 모델 배포 능력을 마비시켜, 매출 성장과 경쟁사인 OpenAI 및 구글 딥마인드 대비 경쟁력을 약화시킬 가능성이 있다.

분쟁의 핵심에 있는 기술적 불가능성

보안 연구원들과 AI 임원들은 백악관의 요구가 현행 기술로는 충족될 수 없다고 말한다. 대규모 언어 모델은 결정론적이 아닌 확률론적이기 때문에, 기업들은 특정 프롬프트에 무엇을 생성할지 보장할 수 없다. 모든 모델은 어느 정도 탈옥될 수 있으며, 기존 방법으로 문제를 완전히 해결하는 것은 불가능하다.

Anthropic과 독립 사이버보안 연구원들은 탈옥이 패치로 해결될 수 있는 고립된 문제가 아니라고 주장한다. Anthropic의 초기 방어 논리는 어떤 AI 모델도 해킹에 완전히 면역일 수 없다는 것이었는데, 이는 수년간 AI 재앙 가능성을 경고해온 Anthropic에 대해 백악관 관료들의 불쾌감을 샀다.

백악관과 Anthropic 간의 협상 — 회사 측에서는 사라 헥 공공정책 총괄과 공동 창업자 톰 브라운이 주도 — 은 향후 탈옥을 평가하기 위한 공통 벤치마크 세트 개발 쪽으로 방향을 전환하고 있다. 여기에는 가드레일이 우회된 정도, 노출된 역량, 위반의 실질적 결과 등이 포함된다. 수출 통제가 아직 해제되지는 않았지만, 기술 표준 설정 작업으로의 전환은 협상이 진전되고 있음을 시사한다.

사실상의 라이선싱 체제 등장

트럼프 행정부는 이전까지 의무적 AI 라이선싱을 반대해왔다. 트럼프 대통령은 지난달 행정명령을 통해 AI 연구소들이 조기 정부 테스트를 위해 모델을 제출하는 '자발적' 시스템을 만들었으며, 이것이 의무화되지 않을 것임을 명시하는 예외 조항을 포함시켰다. 그러나 Anthropic 분쟁은 사실상 그러한 체제의 임시 버전을 만들어냈다.

OpenAI, 구글, 메타를 포함한 다른 주요 AI 연구소들도 이 분쟁을 예의주시하고 있다. 많은 AI 리더들은 이제 백악관에 최신 모델에 대한 조기 접근 권한을 제공하고, 출시 예정 제품에 대한 정보를 극도로 적극적으로 공유해야 할 것이라고 믿고 있다. 당국을 놀라게 할 위험이 너무 크다는 것이다.

"사전 통보, 사전 접근. 그것이 미국뿐만 아니라 전 세계로부터 우리가 들어온 주요 요청사항이라고 생각합니다,"라고 캐나다 AI 연구소 코히어의 CEO 에이던 고메즈는 이번 주 초 인터뷰에서 말했다. "여러 측면에서 그것은 좋은 것입니다. 매우 중요한 기술에 대해 당국이 강력한 관여와 고려를 보여주는 것입니다."

이번 분쟁은 이번 주 프랑스에서 열린 G7 정상회의에서도 주요 의제로 부상했다. 트럼프 대통령은 Anthropic과의 대화가 "잘 진행되고 있다"고 말했지만 구체적인 내용은 밝히지 않았다. 다리오 아모데이 Anthropic CEO는 세계 지도자들에게 AI 규제 접근 방식이 분열되는 유혹에 저항할 것을 촉구했다.

본 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.