AI가 신규 코드의 75%를 작성하지만 기술 부채 위기를 초래하고 있다

소프트웨어 개발에 인공지능을 도입하려는 서두름이 장기적인 기술 부채 위기를 초래하고 있습니다. 단기적인 생산성 향상에만 집중한 결과, 기업 시스템에 저품질의 버그가 많고 잠재적으로 위험한 코드가 범람하고 있기 때문입니다. 알파벳은 구글의 모든 신규 코드 중 75%를 현재 AI가 생성한다고 보고했지만, 오늘날 가장 인기 있는 AI 에이전트를 구축한 바로 그 엔지니어들 중 일부는 그들이 소위 '바이브 슬롭(vibe slop)'이라 부르는 것에 대한 심판이 다가오고 있다고 경고합니다.

인기 있는 OpenClaw AI 에이전트의 주요 개발자인 마리오 제크너(Mario Zechner)는 최근 인터뷰에서 "인프라는 무너지고 있으며, 소프트웨어는 이전보다 훨씬 더 많은 버그를 갖게 되었습니다"라고 말했습니다. "우리는 이 게임을 몇 달, 어쩌면 몇 년 더 할 수 있을지 모르지만, 결국 그것은 우리를 따라잡을 것입니다."

이러한 긴장은 업계 전반에서 나타나고 있습니다. 앤스로픽(Anthropic)의 AI 코딩 도구인 클로드 코드(Claude Code)는 지난 한 해 동안 중앙값 일일 사용 시간이 주당 20분에서 20시간으로 급증하며 엄청난 도입률을 보였습니다. 그러나 제크너는 이 도구 자체의 AI 주도 개발 프로세스 때문에 발생하는 문제들을 언급하며 이를 "내가 사용해 본 소프트웨어 중 가장 망가진 조각 중 하나"라고 부릅니다. OpenAI와 앤스로픽 두 거대 기업이 기업 공개(IPO)를 준비하고 있는 가운데 AI 생성 코드에 대한 추진력은 더욱 거세지고 있습니다.

속도와 품질 사이의 갈등은 투자자들에게 숨겨진 부외 리스크(off-balance-sheet risk)를 안겨줍니다. AI 기능을 출시해야 한다는 압박으로 인해 기업들은 단기적인 생산성을 대가로 서비스 중단, 보안 취약점, 비용과 시간이 많이 드는 수정 작업을 필요로 하는 산더미 같은 기술 부채 등 장기적인 골칫거리를 떠안고 있습니다. 오늘날 AI가 부추긴 속도에 대한 청구서는 결국 날아올 것입니다.

## 에이전트형 쐐기(Agentic Wedge) 전략이 만든 부채의 덫

많은 AI 기업의 전략적 플레이북은 제품이 하나의 워크플로우에 안착하여 가치를 증명한 뒤 조직 전체로 확장하는 '에이전트형 쐐기'입니다. 예를 들어 팔란티어(Palantir)의 AIP 플랫폼은 200시간이 걸리던 제조 승인 프로세스를 단 15초로 단축했습니다. 문제는 이 쐐기가 소프트웨어 개발 자체에 적용될 때 부채의 덫이 된다는 점입니다. 업무를 자동화하는 바로 그 시스템이 차세대 제품 생성을 가속화하고 있지만, 충분한 품질 관리 없이 진행되는 경우가 많습니다.

이는 역설을 만들어냅니다. 쇼피파이(Shopify)와 같은 기업은 코드의 50% 이상을 AI가 작성한다고 보고하고, 구글의 순다르 피차이는 75%라는 수치를 내세우고 있지만, 이러한 도구를 만든 사람들은 경고의 목소리를 높이고 있습니다. 제크너와 그의 파트너 아르민 로나허(Armin Ronacher)에 따르면, 문제는 AI 에이전트가 새로운 코드를 생성하는 데는 능숙하지만 대기업을 움직이는 방대하고 복잡한 레거시 시스템을 평가하고 업그레이드하는 데는 서투르다는 점입니다. '바이브 코딩'으로 구축된 스타트업은 처음에는 빠르게 확장할 수 있지만, 결국 AI 도구가 탐색하기 힘든 복잡성과 취약성의 벽에 부딪히게 됩니다.

## 평가와 '감각(Taste)'이라는 마지막 단계

'바이브 슬롭' 문제의 근본 원인은 기업용 AI에서 가장 어려운 부분이 지능이 아니라 평가, 즉 시스템이 충분히 좋은지 결정하는 구조화된 인간의 판단일 수 있다는 점입니다. Micro1의 CEO 알리 안사리(Ali Ansari)는 정확성을 넘어 시스템이 준수해야 하는 불문율인 '감각'의 영역이 있다고 주장합니다. AI는 기술적으로 작동은 하지만 판단력이 부족하고 브랜드에 어울리지 않으며 유지 관리가 불가능한 코드를 생성할 수 있습니다. 이는 경험을 통해 배우는 기술이지만, 현재 AI로 대체되고 있는 주니어 엔지니어 세대에게는 그 경험의 기회조차 박탈되고 있습니다.

판단력의 공백은 시스템적 리스크가 축적되는 지점입니다. 컴퓨터 과학자 티모시 B. 리(Timothy B. Lee)가 언급했듯이, 숙련된 프로그래머의 '암묵적 지식' 없이는 AI 모델이 "매우 쉽게 잘못된 방향으로 갈 수 있습니다." 이는 벤치마크로 쉽게 해결할 수 있는 문제가 아닙니다. 이는 버그, 보안 구멍, 취약한 아키텍처로 나타나는 정성적 결함입니다. 앤스로픽이 스테인리스(Stainless)를 3억 달러에 인수한 사실은 코드를 신뢰할 수 있는 제품으로 변환하는 기본 툴링의 중요성을 강조하며, 이는 코드를 생성하려는 열풍 속에서 종종 간과되는 레이어입니다.

## 소프트웨어 품질에 대한 심판

AI 주도 개발의 추진은 지난 20년간의 소프트웨어 관행과 정면 충돌하고 있습니다. 팔란티어의 알렉스 카프(Alex Karp)와 같은 이들은 AI를 '레거시 소프트웨어의 죽음'으로 보지만, '바이브 슬롭' 현상은 복잡한 시스템을 교체하는 것이 생각보다 훨씬 어렵다는 것을 시사합니다. 투자자들에게 리스크는 주요 기술 기업들이 보고한 생산성 향상이 신기루일 수 있으며, 결국 성장을 둔화시키고 비용을 부풀릴 기술 부채의 급격한 축적을 은폐하고 있을 수 있다는 점입니다.

문제는 이 부채가 대규모 가동 중단, 데이터 유출 또는 제품 실패를 유발하기 전까지는 대체로 보이지 않는다는 것입니다. 깃허브(GitHub)는 이미 저품질의 AI 생성 기여물들의 물결에 대응하기 위해 새로운 정책을 도입해야 했습니다. 제크너가 믿는 것처럼, 기업들이 AI가 생산한 코드에 대한 과도한 강조가 비용을 높이고 수준 이하의 소프트웨어로 이어지고 있음을 깨닫게 될 심판의 날이 다가오고 있습니다. 투자자들에게 질문은 AI가 코드를 작성할 수 있느냐가 아니라, AI에 의존하는 기업들이 견고한 기반 위에 구축되고 있는지 아니면 '슬롭'의 산 위에 구축되고 있는지입니다.

본 기사는 정보 제공만을 목적으로 하며 투자 조언을 구성하지 않습니다.