
파쿠르와 공중제비를 수행하는 로봇의 바이럴 비디오가 소셜 미디어를 장악하고 있는 반면, 업계 전문가들은 이러한 곡예적인 업적이 진행 상황을 오해하게 만드는 지표라고 말합니다. 12월 초 샌프란시스코에서 열린 Fortune Brainstorm AI 컨퍼런스에서 업계 임원들은 로봇 공학의 진정한 혁명은 물리적 민첩성이 아니라 로봇이 스스로 “생각”하는 능력, 즉 문을 열거나 계단을 오르는 평범하면서도 믿을 수 없을 정도로 어려운 작업을 마침내 정복하는 데 더 가까워지는 능력이라고 주장했습니다.
지난 70년 동안 로봇 공학은 특정 패러다임, 즉 지능적인 인간이 특정 작업을 실행하기 위해 복잡한 수학으로 기계를 미리 프로그래밍하는 특정 패러다임을 기반으로 했습니다. Sequoia Capital의 파트너인 Stephanie Zhan과 Skild AI CEO Deepak Pathak은 Fortune의 Allie Garfinkle과의 대화에서 이러한 접근 방식은 이제 시대에 뒤떨어졌다고 주장했습니다. 업계는 ChatGPT와 같은 도구 뒤에 있는 LLM(대형 언어 모델)과 같은 로봇이 엄격한 코드를 따르기보다는 데이터와 경험에서 직접 학습하는 대규모 변화를 겪고 있습니다.
Pathak은 “변화는 로봇 공학의 사물이 인간 지능에 의해 더 많이 주도되었다는 것”이라고 말하면서 새로운 물결은 일반화하고 학습할 수 있는 모델에 의해 정의된다고 지적했습니다. “이제 달라진 점은 이러한 모델이나 로봇이 이제 데이터로부터 학습할 수 있다는 것입니다.”
2024년 7월, Zhan은 Sequoia의 블로그에 Pathak의 우주 분야에서의 깊은 자격과 그를 로봇 공학 CEO로서 차별화시키는 요소, 즉 그의 컴퓨터 비전과 딥 러닝 기술에 대해 글을 썼습니다. 이에 비해 기존 로봇공학은 특정 작업을 위해 로봇을 훈련시키기 위해 특정 데이터를 수집하는 데 중점을 두었습니다. Pathak과 그의 파트너인 Abhinav Gupta는 대규모 데이터를 활용하여 기본 모델을 구축했습니다. 원래 인도의 작은 마을 출신인 Pathak은 시골 고향을 떠나지 않고도 인도 칸푸르 공과대학(Indian Institute of Technology Kanpur)에 합격하여 전국적인 헤드라인을 장식했다고 Zhan은 썼습니다. 그는 집에서 손으로 코드를 작성하여 프로그래밍하는 법을 배웠고, 지역 커피숍에서 제한된 시간 동안 프로그램을 실행했습니다. 그는 나중에 박사 학위를 마쳤습니다. Berkeley에서 AI를 전공하고 Facebook AI Research에 합류하여 Skild를 공동 창립하는 중입니다.
Zhan과 Pathak과 Garfinkle의 대화는 Moravec의 역설로 알려진 인공 지능의 역설을 다루었습니다. 어려운 것처럼 보이는 것은 종종 쉽고, 쉬워 보이는 것은 엄청나게 어렵습니다.
백플립이 게이트보다 쉬운 이유
공중제비를 하는 로봇은 본질적으로 자유 공간에서 자신의 몸을 제어해야 하는데, 이는 컴퓨터가 수십 년 동안 잘 해결해 온 물리학 문제입니다. “사실 계단을 오르는 것보다 뒤로 재주넘기를 하도록 로봇을 프로그래밍하는 것이 훨씬 쉽습니다.”라고 Garfinkle은 말했습니다. 그의 두 패널리스트도 동의했습니다.
진정한 도전(그리고 “물리적 지능”의 성배)은 혼란스러운 현실 세계와 상호 작용하는 데 있습니다. 계단을 오르거나 유리잔을 집으려면 로봇이 변화하는 환경에 반응하여 움직임을 수정하기 위해 지속적으로 시각을 사용해야 합니다. 이 “감각 운동 상식”은 인간 일반 지능의 뿌리이자 새로운 “뇌” 소프트웨어가 무너뜨리려는 장벽입니다.
투자자와 경영진은 이것을 최근 생성 AI의 폭발적인 증가와 비교할 수 있는 시장 기회로 보고 있습니다. Zhan은 OpenAI가 디지털 지식 작업 시장을 열었듯이 Pathak’s Skild와 같은 회사는 모든 실제 작업 시장을 여는 것을 목표로 한다고 말했습니다. 목표는 모든 로봇 하드웨어의 두뇌 역할을 할 수 있는 “일반적으로 지능적인 소프트웨어”를 만들어 비용을 몇 배나 줄이는 것입니다.
그러나 소프트웨어 세계와는 달리 로봇공학은 데이터 부족이라는 독특한 장애물에 직면해 있습니다. LLM은 인터넷을 통해 교육을 받았지만 로봇의 물리적 상호 작용에 대한 동등한 데이터베이스는 없습니다. Pathak은 필드 로봇이 시스템을 더 스마트하게 만드는 데 필요한 데이터를 생성하는 “데이터 플라이휠”을 만들어 먼저 구현하는 회사가 승리할 것이라고 주장했습니다.
로봇이 언제 빨래를 할 것인지 궁금해하는 소비자들에게 타임라인은 여전히 정체되어 있습니다. Pathak과 Zhan은 로봇이 개인 주택과 같은 보다 혼란스러운 환경에 들어가기 전에 산업 환경과 호텔, 병원과 같은 “반구조화된” 환경에서 먼저 확산될 것이라고 예측했습니다.
일자리 상실에 대한 두려움에도 불구하고 그들은 미래의 “3S”인 보안, 희소성 및 사회 진화를 해결하려면 기술이 필요하다고 주장했습니다. 로봇은 현재 인간이 생명이나 건강을 위험에 빠뜨리는 작업을 수행할 준비가 되어 있습니다. 또한 현재 노동력 부족으로 인해 채워지지 않은 수백만 개의 공석이 있는 상황에서 로봇은 필수 행정 업무의 공백을 메울 수 있습니다. 궁극적으로 희망은 위험하거나 고된 일이 선택 사항이 되어 인간이 자신이 즐기는 일에 집중할 수 있게 되는 사회적 변화에 대한 것입니다.

