구글 딥마인드, 로봇과 AI를 하나로 합쳤다? 피지컬 인텔리전스(PI)의 실체 공개

루크2025.07.0310218

구글 / 딥마인드 /  AI / 제미나이로보틱스 / 온디바이스



딥마인드의 ‘제미나이 로보틱스 온디바이스’ 공개


이제 AI가 클라우드에서 로봇 안으로 ‘이사’를 시작했습니다.

 구글 딥마인드(DeepMind)가 공개한 새로운 로봇 AI,

 ‘제미나이 로보틱스 온디바이스(Gemini Robotics On-Device)’ 이야기예요.

말 그대로 로봇 안에서 직접 작동하는 AI 모델로

 로봇이 더 똑똑하고, 민첩하고, 독립적으로 움직일 수 있게 만들어줍니다.



딥마인드의 ‘제미나이 로보틱스 온디바이스

Gemini Robotics On-Device는 강력한 로봇 모델을 더욱 접근성 있고 적응력 있게 만들기 위해 고안되었습니다. | 출처: Google DeepMind


🤔 AI가 ‘로봇 안에서’ 직접 작동한다고요?


그동안 대부분의 로봇 AI는

 인터넷으로 연결된 서버에서 판단을 내리고,

 그 명령을 로봇이 따르는 구조였어요.

하지만 제미나이 로보틱스 온디바이스는

 ‘온디바이스(On-device)’,

즉 로봇 자체 안에서 판단하고 움직입니다.


✅ 인터넷 연결 없이도 빠르고 안정적으로 작동

 ✅ 외부 서버가 없어도, 스스로 판단하고 학습

 ✅ 연결이 불안정한 환경(산속, 재난 현장 등)에서도 문제 없이 작동

이제 로봇은 명령을 받기만 하는 수동적인 기계가 아니라,

 상황을 스스로 이해하고 판단하는 능동적인 파트너가 되는 거죠.


딥마인드의 ‘제미나이 로보틱스 온디바이스

🔍 Gemini 2.0의 두뇌를 로봇에 이식하다


이 온디바이스 모델은

 딥마인드의 멀티모달 AI

‘제미나이 2.0’ 기반의 VLA 모델이에요.

 VLA란 Vision(시각) + Language(언어) + Action(행동)의 약자인데요.

즉, 로봇이 보면서 이해하고,

 사람 말을 알아듣고,

 스스로 행동을 결정할 수 있게 됩니다.

🧠 “그 상자에서 카드 하나 꺼내줘”

 🤖 “오케이” → 시각 인식 → 의미 분석 → 행동 판단 → 실행!


딥마인드의 ‘제미나이 로보틱스 온디바이스


🛠️ 단 100번의 시연으로 새 작업도 척척

딥마인드는 이 모델이

 단 50~100번 정도의 시연만으로도

 새로운 작업을 학습한다고 밝혔어요.

또한 개발자를 위한 SDK(소프트웨어 개발 키트)도

함께 출시했는데요.


 이 SDK를 통해 VLA 모델을 테스트하고,

 딥마인드의 시뮬레이터 MuJoCo에서 실험하며

 실제 로봇 환경에 빠르게 적용할 수 있답니다.

현재는 ‘신뢰할 수 있는 테스터’만 사용 가능하지만,

 앞으로 점차 공개될 예정이라고 해요.


딥마인드의 ‘제미나이 로보틱스 온디바이스


🧤 옷 접고, 지퍼 열고, 샐러드 드레싱까지?

이 AI, 얼마나 똑똑하냐고요?

 딥마인드가 공개한 테스트 결과에 따르면…

도시락 가방 지퍼 열기

옷 정리해 접기

카드 뽑기

샐러드 드레싱 붓기

다양한 장면에서 정밀한 조작 수행



딥마인드의 ‘제미나이 로보틱스 온디바이스


심지어, 처음 보는 물체나

 한 번도 본 적 없는 장면에서도

 적절한 행동을 ‘스스로’ 결정할 수 있다고 해요.

이건 단순한 로봇 자동화를 넘어

 진짜 ‘로봇 두뇌’라고 부를만 하죠.



딥마인드의 ‘제미나이 로보틱스 온디바이스, 피지컬 인텔리전스

🤖 특정 로봇 전용? No! 

다양한 로봇에 적용 OK


이번에 공개된

제미나이 로보틱스 온디바이스 모델은

처음엔 ALOHA라는 양팔 로봇을 위해 개발됐지만,

그 활용 범위는 훨씬 넓습니다.

이후 딥마인드는 이 모델을

다양한 형태의 로봇에 적용하며

그 범용성을 검증했어요.


딥마인드의 ‘제미나이 로보틱스 온디바이스, 피지컬 인텔리전스

구글 딥마인드가 25일(현지시간) 인터넷 연결 없이 로컬 환경에서 로봇을 제어할 수 있는 새로운 인공지능 언어모델 '제미나이 로보틱스 온디바이스'를 공개했다. 사진=구글 딥마인드 영상 캡처


예를 들어, Franka FR3 로봇에 적용했을 때는

산업용 조립 작업부터

드레스를 접는 섬세한 동작까지,

시각 인식과 언어 명령 해석,

그리고 정밀한 조작 능력을 모두 매끄럽게 수행했죠.


딥마인드의 ‘제미나이 로보틱스 온디바이스, 피지컬 인텔리전스

또 다른 사례인 Apptronik의

Apollo 휴머노이드는

사람처럼 생긴 형태의 로봇인데요.

자연어로 전달된 지시를 이해하고

스스로 물체를 조작하는 능력을 보여줬어요.

환경이 달라져도 유연하게 적응하며,

이전에 보지 못한 상황에도 일반화된 판단을

내리는 모습이 인상적이었습니다.


딥마인드의 ‘제미나이 로보틱스 온디바이스, 피지컬 인텔리전스

이처럼 제미나이 로보틱스 온디바이스는

특정 로봇에 국한되지 않고,

다양한 플랫폼에 두루 적용 가능한 범용 AI입니다.

덕분에 로봇 개발자 입장에서는

'AI 하나로 여러 로봇을 업그레이드할 수 있는'

새로운 가능성이 열린 셈이죠.



딥마인드의 ‘제미나이 로보틱스 온디바이스, 피지컬 인텔리전스


🧠 로봇이 사람처럼 반응하는 시대, 정말 올까요?


요즘 로봇은 단순히 반복 작업만 하는 게 아니에요.

휴머노이드나 ROS 기반 로봇은

교육, 연구, 브랜딩 같은 산업 외 분야에서도

주목받는 기술로 빠르게 자리 잡고 있습니다.


특히 최근엔 AI 기술의 발전으로

새로운 로봇 유형에 대한 개념 검증(POC)도

활발히 이루어지고 있어요.

이제는 단순히 “이걸 반복해줘”가 아니라,

“새로운 환경에서도 알아서 잘해줘!”가

요구되는 시대인 거죠.



딥마인드의 ‘제미나이 로보틱스 온디바이스, 피지컬 인텔리전스


그리고 요즘 뜨고 있는 개념, 들어보셨나요?

바로 ‘피지컬 인텔리전스(Physical Intelligence, PI)’!


이건 로봇이 실제 물리 환경에서 민첩하게,

사람처럼 유연하게 반응하는 능력을 의미하는데요.

딥마인드의 온디바이스 제미나이처럼

AI를 접목한 로봇이

이런 능력을 점점 갖추기 시작했다는 뜻이에요.



딥마인드의 ‘제미나이 로보틱스 온디바이스, 피지컬 인텔리전스


🤖 AI를 로봇에 100% 적용하고 싶다면?

마로솔에 물어보세요!


휴머노이드부터 산업용·협동로봇까지,

AI 기술을 어떻게 접목하고 실무에 활용할 수 있을지

막막하셨다면 지금이 딱 좋은 타이밍이에요.


📌 새로운 프로젝트 기획 단계

📌 연구/교육용 로봇 테스트

📌 현장 자동화를 AI로 업그레이드하고 싶다면?


👉 마로솔에서 기술 컨설팅부터 도입까지

한 번에 도와드립니다!


지금, 여러분의 로봇에 ‘AI’를 더해보세요. 💡


딥마인드의 ‘제미나이 로보틱스 온디바이스, 피지컬 인텔리전스