도시락 싸는 휴머노이드 나왔다…구글 '제미나이 로보틱스' 공개

멀티모달 '제미나이 2.0' 기반 '피지컬 AI' 참전
현실과 상호작용…사전훈련 없이 덩크슛 등 자율판단 갖춰

본문 이미지 - 구글 딥마인드 제미나이 로보틱스(유튜브 영상 캡처)
구글 딥마인드 제미나이 로보틱스(유튜브 영상 캡처)

(서울=뉴스1) 김민석 기자 = 구글 딥마인드가 인공지능(AI) 기반 휴머노이드 로봇 '제미나이 로보틱스'(Gemini Robotics)와 '제미나이 로보틱스-ER'을 12일(현지시간) 공개했다.

구글의 휴머노이드 로봇 모델은 '제미나이 2.0' 아키텍처를 로봇 공학에 적용했다.

제미나이 로보틱스는 시각-언어-행동(Vision-Language-Action·VLA) 모델을 통해 텍스트·이미지·동영상 입력을 실시간으로 해석해 물리적 행동으로 변환하는 능력을 갖췄다.

구글 측은 기존 AI 모델이 디지털 공간에 머물렀다면 제미나이 로보틱스 기술은 3차원 현실 세계와 보다 정교하게 상호 작용을 한다고 설명했다.

카니슈카 라오 구글 딥마인드 엔지니어는 "로봇이 주변 환경을 인식하고 추론해 자율적 판단을 내리는 과정에 제미나이 2.0의 멀티모달을 적용했다"며 "공간 관계 이해와 물체 조작 정밀도를 크게 높였다"고 말했다.

시연 영상에서 제미나이 로보틱스는 소풍 도시락 싸기, 알파벳 블록으로 단어 만들기, 미니 농구 게임 등 과제를 수행했다.

알파벳 블록으로 'GOOGLE' 단어를 조합하는 작업에서는 물리적 간섭(블록 넘어짐) 발생 시 스스로 다시 세웠다. 도시락을 포장할 땐 내용물 크기에 맞춰 포장지 접기 방식을 변경했다.

개발팀에 따르면 제미나이 로보틱스는 기존 VLA 모델 대비 특정 작업에서 2배 이상 성능 향상을 나타냈다. 블록으로 단어 조합 시 정확도는 85%, 복잡한 물체 조작 작업 성공률은 78%에 달한다.

또 미니 농구 게임에서의 덩크슛 등과 같이 사전에 훈련하지 않은 과제도 개념 이해를 바탕으로 해결할 수 있다.

본문 이미지 - 구글 딥마인드 제미나이 로보틱스(유튜브 영상 캡처)
구글 딥마인드 제미나이 로보틱스(유튜브 영상 캡처)

구글은 최근 휴머노이드 로봇 개발사 앱트로닉의 3억 5000만 달러(약 5080억 원) 규모 시리즈A 투자에 참여하며 휴머노이드 로봇 시장에 본격 참전했다.

앱트로닉은 2016년 텍사스대학교 오스틴캠퍼스에서 설립된 스타트업으로 기존 휴머노이드 로봇 '아폴로'는 테슬라 '옵티머스' 등의 경쟁모델로 꼽혔다.

양사는 추가 테스트를 거쳐 제미나이 로보틱스를 탑재한 프로토타입을 2026년 상반기 출시한다는 목표다. 상용화 첫 발은 물류창고 자동화 분야에 초점을 맞출 방침으로 전해졌다.

ideaed@news1.kr

대표이사/발행인 : 이영섭

|

편집인 : 채원배

|

편집국장 : 김기성

|

주소 : 서울시 종로구 종로 47 (공평동,SC빌딩17층)

|

사업자등록번호 : 101-86-62870

|

고충처리인 : 김성환

|

청소년보호책임자 : 안병길

|

통신판매업신고 : 서울종로 0676호

|

등록일 : 2011. 05. 26

|

제호 : 뉴스1코리아(읽기: 뉴스원코리아)

|

대표 전화 : 02-397-7000

|

대표 이메일 : webmaster@news1.kr

Copyright ⓒ 뉴스1. All rights reserved. 무단 사용 및 재배포, AI학습 활용 금지.