로봇 스타트업 피지컬 인텔리전스(Physical Intelligence)가 새로운 AI 모델이 훈련받지 않은 작업을 수행하도록 로봇을 지시하는 연구 돌파구를 마련함에 따라, 기업 가치를 이전의 거의 두 배인 110억 달러로 평가하는 새로운 펀딩 라운드를 논의 중입니다. 설립 2년 차인 이 회사의 새로운 모델 π0.7은 서로 다른 맥락에서 배운 기술을 결합하여 새로운 문제를 해결할 수 있게 하는 '조합 일반화(compositional generalization)' 능력을 보여주었으며, 이는 범용 로봇 두뇌를 향한 중요한 단계입니다.
피지컬 인텔리전스의 공동 창립자이자 UC 버클리 교수인 세르게이 레빈(Sergey Levine)은 "데이터를 수집한 작업만 정확히 수행하는 단계에서 벗어나 새로운 방식으로 요소들을 재조합하는 임계값을 넘어서면, 데이터의 양에 따라 능력이 선형 그 이상으로 향상됩니다"라고 말했습니다. 그는 이러한 확장 특성이 언어 및 시각과 같은 다른 AI 분야에서도 관찰되었으며, 로봇 공학 분야도 유사한 변곡점에 와 있을 수 있음을 시사했습니다.
핵심 주장은 파편화된 정보를 합성하는 모델의 능력에 집중되어 있습니다. 주요 시연에서 π0.7은 훈련 데이터에 해당 기기와 관련된 짧고 무관한 에피소드 두 개만 포함되었음에도 불구하고 로봇이 에어프라이어를 사용해 고구마를 요리할 수 있도록 했습니다. 이 모델은 커피 만들기, 빨래 개기 등 복잡한 잡무에서 특화된 단일 작업 모델의 성능과 일치했습니다. 피지컬 인텔리전스는 현재까지 10억 달러 이상의 자금을 조달했으며, 마지막 기업 가치는 56억 달러였습니다.
이러한 기술적 진보는 범용 로봇의 상용화를 가속화하여 제조에서 물류에 이르는 산업을 잠재적으로 변화시킬 수 있습니다. 투자자들에게 이는 더 많은 투자와 M&A 활동을 유도할 수 있는 AI 및 로봇 분야의 주요 발전 신호입니다. 그러나 이 회사는 상용화 일정을 밝히기를 거부했으며, 이러한 입장에도 불구하고 피그마(Figma)와 노션(Notion) 같은 기업에 투자한 저명한 엔젤 투자자 출신 공동 창립자 래치 그룸(Lachy Groom)의 명성 덕분에 투자자들의 관심은 여전히 높습니다.
단순 암기에서 '페루의 유니콘'으로
π0.7의 돌파구는 모든 특정 작업에 대해 방대한 데이터 세트를 수집하는 표준 로봇 훈련 패러다임(일종의 단순 암기)에서의 이탈을 의미합니다. 조합 일반화를 달성함으로써 모델은 이전에 습득한, 겉보기에 무관한 지식을 결합하여 새로운 작업을 수행하는 방법을 추론할 수 있습니다. 레빈은 이 놀라운 결과를 연구자들이 GPT-2 언어 모델이 명시적으로 배우지 않은 안데스 산맥의 유니콘에 대한 이야기를 생성하는 것을 처음 보았을 때와 비교했습니다.
피지컬 인텔리전스의 연구원 애쉬윈 발라크리슈나(Ashwin Balakrishna)는 "데이터에 무엇이 들어 있는지 깊이 알면 모델이 무엇을 할 수 있을지 짐작할 수 있다는 것이 저의 항상된 경험이었습니다"라며, "놀라는 일은 드물었지만, 지난 몇 달은 제가 진심으로 놀란 첫 번째 시기였습니다"라고 말했습니다.
연구팀은 모델의 현재 한계에 대해서도 솔직합니다. 아직 '토스트 좀 만들어 줘'와 같은 단일 고수준 명령으로 복잡한 다단계 작업을 실행할 수는 없습니다. 그러나 단계별 구두 지시를 통한 코칭을 받을 때는 뛰어난 성능을 보이며, 이는 로봇이 새로운 환경에 배치되어 재훈련 없이 인간 작업자에 의해 현장에서 교육받을 수 있음을 시사합니다. 한 실험에서 연구원들이 프롬프트를 정교화하는 데 30분을 투자한 후 에어프라이어 작업의 성공률은 5%에서 95%로 급증했습니다.
110억 달러의 질문
연구 결과가 일반화의 '초기 징후'라고 조심스럽게 제시되고 있지만, 재무적 영향은 즉각적입니다. 피지컬 인텔리전스의 가치를 110억 달러에 육박하게 평가하는 새로운 라운드에 대한 보고는 AI 분야의 근본적인 진보를 보여주는 기업에 대한 투자자들의 강렬한 욕구를 강조합니다. 이러한 가치 평가는 제품 배포 일정을 약속하지 않은 기업으로서는 특히 주목할 만합니다.
레빈은 공중제비를 도는 로봇의 바이럴 영상에 비해 시연된 작업들이 '지루하다'는 잠재적 비판에 반박했습니다. 그는 일반화가 세심하게 연출된 묘기보다 덜 극적으로 보일지 모르지만, 훨씬 더 유용하며 진정한 최전선을 상징한다고 주장했습니다. 명확한 수익 경로 없이도 최고의 기관 자본을 유치할 수 있는 회사의 능력은 로봇 일반화 문제를 해결하는 것이 승자독식의 보상이 될 것이라는 믿음에 근거합니다.
실제 배포 일정에 대해 묻는 질문에 레빈은 추측을 거부하면서도 진전이 "몇 년 전 예상했던 것보다 빠르다"고 말했습니다. 투자자들에게 이번 베팅은 특정 제품이 아니라, 언젠가 경제 전반의 방대한 로봇 시스템을 구동할 수 있는 근본적인 '두뇌'를 피지컬 인텔리전스가 구축하고 있다는 아이디어에 대한 것입니다.
이 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.