주요 요점:
- 구글 딥마인드가 로봇의 자율성과 추론 능력을 향상시키는 AI 모델인 Gemini Robotics-ER 1.6을 출시했습니다.
- 이 모델은 산업용 계기 판독에서 93%의 성공률을 기록하며 이전 모델 대비 3배의 성능 향상을 보였습니다.
- 보스턴 다이내믹스는 고급 자율 점검 작업을 위해 이 새로운 모델을 자사의 Spot 로봇에 통합했습니다.
주요 요점:

(P1) 구글 딥마인드가 새로운 Gemini Robotics-ER 1.6 모델을 통해 자율 산업 시스템 추진을 강화하고 있습니다. 이 모델은 복잡한 추론 작업에서 이전 모델보다 성공률을 3배 높였습니다. 4월 14일에 출시된 이 모델은 로봇에게 고급 공간 이해력과 의사 결정 능력을 제공하며, 효율성과 자율성이 가장 중요한 2,000억 달러 규모의 산업용 로봇 시장을 직접적으로 공략하고 있습니다.
(P2) 보스턴 다이내믹스의 Spot 부문 부사장 겸 총괄 매니저인 마르코 다 실바는 "Gemini Robotics ER 1.6과 같은 발전은 물리적 세계를 더 잘 이해하고 운영할 수 있는 로봇을 향한 중요한 단계"라고 말했습니다. "계기 판독 및 더 신뢰할 수 있는 작업 추론과 같은 기능은 Spot이 현실 세계의 도전에 완전히 자율적으로 보고, 이해하고, 반응할 수 있게 해줄 것입니다."
(P3) 구글 딥마인드에 따르면, 새 모델은 계기 판독 작업에서 93%의 성공률을 보여 이전 ER 1.5 버전보다 3배 향상되었습니다. 또한 공간 및 물리적 추론 벤치마크에서 범용 Gemini 3.0 Flash 모델을 능가합니다. 주요 핵심 향상 기능은 다중 시점 추론으로, 시스템이 여러 카메라 피드의 정보를 동시에 처리하고 합성하여 일관된 3D 세계관을 생성할 수 있도록 합니다.
(P4) 이러한 발전은 구글의 모회사인 알파벳이 산업 자동화 지출에서 더 큰 점유율을 확보할 수 있게 하며, 기존 업체 및 이 분야에 진입하는 다른 기술 기업들에 도전장을 내밀고 있습니다. 보스턴 다이내믹스와 같은 기업에 있어 더 진보된 AI의 통합은 고부가가치 점검 및 모니터링 서비스로 이어지며, 업계 전반은 이러한 새로운 기능이 통제된 벤치마크 외부에서 얼마나 안정적으로 작동할지 주목하고 있습니다.
Gemini Robotics-ER 1.6의 돋보이는 기능은 제조 공장 및 정유소의 장비 모니터링에 중요한 작업인 아날로그 및 디지털 계기를 판독하는 능력입니다. 이 기능은 실제 산업적 요구를 해결하기 위해 보스턴 다이내믹스와의 협력을 통해 탄생했습니다. 이 모델은 눈금, 단위 라벨을 해석하고 카메라 왜곡까지 고려하여 시각 데이터를 분석하는 코드를 생성하는데, 딥마인드는 이를 '에이전틱 비전(agentic vision)'이라고 부릅니다.
이는 공간 추론의 대폭적인 업그레이드와 결합됩니다. 로봇의 오버헤드 카메라와 손목 장착 카메라와 같은 다중 시점 데이터를 융합함으로써 모델은 물체를 정확하게 추적하고 작업 완료 여부를 판단할 수 있습니다. 이는 작업을 다시 시도할지 다음 단계로 이동할지를 결정하는 데 필수적이며 자율 운영의 핵심 요소입니다. 적대적 공간 추론 작업에 대한 모델의 안전 준수 능력도 이전 버전보다 10% 향상되었습니다.
보스턴 다이내믹스는 오빗(Orbit) 소프트웨어 플랫폼을 통해 ER 1.6을 자사의 Spot 로봇에 통합하여 AI 시각 점검(AIVI) 시스템을 강화했습니다. 이제 Spot은 자율적으로 게이지를 모니터링하고, 누출을 감지하며, 안전 감사를 수행할 수 있습니다. 이번 통합에는 운영자에게 AI의 의사 결정 과정을 보여주는 '투명한 추론' 기능이 포함되어 산업 현장의 책임성 문제를 해결합니다.
이번 출시는 대형 AI 모델을 물리적 로봇과 결합하는 광범위한 산업 트렌드인 '피지컬 AI' 또는 '具身智能(Embodied AI)'를 반영합니다.
이러한 AI와 로봇공학의 융합은 프로그래밍된 자동화를 넘어 동적 환경을 인식하고 추론하며 적응할 수 있는 시스템으로 나아가는 것을 목표로 합니다. 경쟁 상대는 기존의 산업 자동화 기업뿐만 아니라 Figure AI와 같은 AI 중심 스타트업을 포함합니다.
투자자들에게 Gemini Robotics-ER 1.6의 출시는 지능형 자동화 배포 경쟁의 가속화를 의미합니다. 구글이 AI '두뇌'를 제공하는 반면, 그 가치는 보스턴 다이내믹스와 애자일 로봇과 같은 하드웨어 파트너를 통해 실현됩니다. Gemini API를 통해 모델을 사용할 수 있게 됨에 따라 소규모 개발자들도 이 플랫폼 위에서 앱을 구축할 수 있어 물류, 의료, 소매업 전반에 걸친 채택 속도가 빨라질 가능성이 있습니다. 핵심 시험대는 실제 성능과 신뢰성이 될 것이며, 이는 궁극적으로 기술의 상업적 견인력을 결정할 것입니다.
이 기사는 정보 제공만을 목적으로 하며 투자 조언을 구성하지 않습니다.