Eye on AI에 오신 것을 환영합니다. 이번 판에서… 트럼프 대통령은 새로운 행정 명령으로 주 AI 규정을 겨냥합니다… OpenAI는 Google의 Nano Banana를 따라잡기 위해 새로운 이미저를 공개합니다… Google DeepMind는 가상 세계를 위해 더 유능한 에이전트를 훈련하고… AI 안전 등급 보고서는 그다지 편안함을 제공하지 않습니다.
안녕하세요. 2025년은 AI 에이전트의 해가 될 예정이었다. 그러나 올해가 저물어가면서 기술 공급업체의 이러한 예측이 지나치게 낙관적이라는 것이 분명해졌습니다. 예, 일부 회사에서는 AI 에이전트를 사용하기 시작했습니다. 그러나 대부분은 아직 이를 수행하지 않고 있으며, 특히 전사적 배포에서는 더욱 그렇습니다.
지난달 McKinsey의 “AI 현황” 조사에 따르면 대부분의 기업은 아직 AI 에이전트 사용을 시작하지 않은 반면 40%는 실험 중이라고 답했습니다. 적어도 하나의 사용 사례에서 대규모로 AI 에이전트를 배포했다고 답한 사람은 4분의 1 미만이었습니다. 컨설팅 회사가 사람들에게 마케팅, 영업, 인사 등 특정 기능에 AI를 사용하고 있는지 물었을 때 결과는 더욱 나빴습니다. 응답자의 10% 미만이 AI 에이전트를 “완전히 확장”했거나 이러한 영역에서 “확장 과정에 있다”고 답했습니다. 에스컬레이션된 에이전트를 가장 많이 사용하는 기능은 IT(서비스 티켓을 자동으로 해결하거나 직원을 위한 소프트웨어를 설치하는 데 에이전트가 자주 사용되는 경우)였으며, 여기서도 “완전히 확장된” 에이전트가 있다고 보고한 비율은 2%에 불과했으며 추가로 8%는 “에스컬레이션 중”이라고 답했습니다.
문제의 가장 큰 부분은 AI 에이전트가 신뢰할 수 있는 결과를 생성할 수 있는 워크플로를 설계하기 어렵다는 것입니다. 오늘날 가장 유능한 AI 모델조차도 이상한 한계에 직면해 있습니다. 워크플로에서 인간과 마찬가지로 특정 작업을 수행할 수 있지만 다른 작업은 수행할 수 없습니다. 여러 소스에서 데이터를 수집하고 여러 단계에서 소프트웨어 도구를 사용하는 복잡한 작업은 특별한 과제를 나타냅니다. 워크플로우가 길어질수록 프로세스의 첫 번째 단계 중 하나에서 오류가 발생하여 결과가 실패할 위험이 커집니다. 또한 더 유능한 AI 모델을 대규모로 사용하려면 비용이 많이 들 수 있습니다. 특히 워크플로에서 에이전트가 많은 계획과 추론을 수행해야 하는 경우에는 더욱 그렇습니다.
많은 회사에서는 서로 다른 에이전트가 활성화되고 각 에이전트에 워크플로의 개별 단계 하나만 할당되는 “다중 에이전트 워크플로”를 설계하여 이러한 문제를 해결하려고 노력해 왔습니다. 때로는 한 에이전트를 사용하여 다른 에이전트의 작업을 확인하는 것도 포함됩니다. 이렇게 하면 성능이 향상될 수 있지만 비용이 많이 들 수도 있고 때로는 작업 흐름을 자동화할 가치가 없을 정도로 비용이 너무 많이 들 수도 있습니다.
두 개의 AI 에이전트가 항상 하나보다 낫습니까?
이제 Google 팀은 다중 에이전트 워크플로를 만드는 대신 단일 에이전트를 사용하는 것이 가장 좋은 시기와 특정 작업에 가장 적합한 다중 에이전트 워크플로 유형을 결정하는 데 유용한 기준을 기업에 제공하기 위한 연구를 수행했습니다.
작년에는 다중 에이전트 워크플로가 더 안정적인 결과를 낳는다는 것이 합의되었습니다. (저는 이전에 Eye on AI에서 Prosus와 같은 일부 회사의 경험을 통해 뒷받침되는 이 견해에 대해 글을 쓴 적이 있습니다.) 그러나 Google 연구자들은 그 대신에 전통적인 통념이 유지되는지 여부는 주로 작업이 정확히 무엇인지에 달려 있음을 발견했습니다.
개별 에이전트의 성능은 순차적 단계에서 더 좋고, 병렬 단계에서는 성능이 떨어집니다.
Minecraft의 많은 벤치마크 작업과 마찬가지로 작업이 순차적인 경우 단일 AI 에이전트가 작업의 45% 이상을 정확하게 수행할 수 있는 한(제 생각에는 꽤 낮은 기준임) 에이전트를 하나만 배포하는 것이 더 낫다는 것이 밝혀졌습니다. 어떤 구성에서든 여러 에이전트를 사용하면 전체 성능이 39%에서 70%까지 크게 감소합니다. 연구원에 따르면 그 이유는 회사가 전체 작업을 완료하는 데 제한된 토큰 예산을 가지고 있는 경우 다양한 도구를 사용하는 방법을 알아내려는 여러 에이전트의 요구가 예산을 빠르게 압도할 수 있기 때문입니다.
그러나 많은 재무 분석 작업의 경우처럼 병렬로 수행할 수 있는 단계가 포함된 작업이라면 다중 에이전트 시스템이 큰 이점을 가집니다. 게다가 연구원들은 에이전트가 서로 작동하도록 구성하는 방식도 큰 차이를 가져온다는 사실을 발견했습니다. 재무 분석 작업의 경우 단일 코디네이터가 여러 하위 에이전트의 활동을 지시하고 감독하며 코디네이터와 주고받는 모든 통신 흐름을 관리하는 중앙 집중식 멀티 에이전트 시스템이 최상의 결과를 얻었습니다. 이 시스템은 단일 에이전트보다 성능이 80% 향상되었습니다. 한편, 코디네이터가 없고 각 에이전트에 제한된 역할만 할당하여 병렬로 수행하는 독립적인 다중 에이전트 시스템은 단일 에이전트보다 성능이 57%만 향상되었습니다.
이와 같은 연구는 기업이 AI 에이전트를 설정하는 최선의 방법을 찾아내고 기술이 마침내 작년의 약속을 이행하기 시작할 수 있도록 도와줄 것입니다. AI 에이전트 기술을 판매하는 사람들에게는 늦는 것이 아예 없는 것보다 낫습니다. AI 에이전트를 활용하는 기업에 근무하는 사람들이라면 AI 에이전트가 노동시장에 어떤 영향을 미치는지 살펴봐야 할 것이다. 이는 2026년이 가까워질수록 우리가 자세히 지켜볼 이야기입니다.
AI의 행운
인기 있는 NIMBY 반란은 AI 데이터 센터의 부상에 반대하는 공화당 거점의 유권자들을 변화시키고 있습니다. – 작성자: Eva Roytburg Accenture 임원은 혁신에 대해 현실적입니다. ‘데이터와 AI 전략은 별도의 전략이 아니라 비즈니스 전략입니다.’ – 작성자: Nick Lichtenberg 데이터와 AI 전략은 여전히 잘 활용되고 있으며 빠르게 가치가 하락하지 않는다고 분석가는 말합니다. – 작성자: Jason Ma
뉴스 속 AI AI 연구에 대한 눈
가상 세계에서 복잡한 계획을 세울 수 있는 Google DeepMind 에이전트입니다. AI 연구소는 다양한 비디오 게임을 포함해 복잡한 3D 디지털 세계를 탐색할 수 있는 SIMA 에이전트의 업데이트된 버전인 SIMA 2를 출시했습니다. 단순한 명령만 따르던 이전 시스템과 달리 SIMA 2는 스스로 더 넓은 목표를 이해하고, 짧은 대화를 나누고, 다단계 계획을 세울 수 있습니다. 테스트에서 이전 제품보다 훨씬 더 나은 성능을 발휘했으며 이전에 본 적이 없는 게임에서도 많은 작업에서 인간 플레이어와 가까워졌습니다. 특히 SIMA 2는 자체적인 과제를 설정하고 시행착오를 통해 학습함으로써 새로운 기술을 배울 수도 있습니다. 이 기사는 단순히 텍스트나 이미지를 분석하는 것이 아니라 환경에서 행동하고, 적응하고, 학습할 수 있는 AI를 향한 진전을 보여줍니다. 강화 학습(에이전트가 목표를 달성하기 위해 시행착오를 통해 학습하는 기술)을 기반으로 하는 이 접근 방식은 더 유능한 가상 비서, 궁극적으로 실제 로봇을 구동하는 데 도움이 될 것입니다. 여기에서 기사를 읽을 수 있습니다.
당신은 달력을 가지고 있습니다
1월 6일: Fortune Brainstorm Tech CES 만찬. 여기에서 참석을 요청하세요.
1월 19~23일: 세계경제포럼, 스위스 다보스.
2월 10~11일: AI Action Summit, 인도 뉴델리.
BRAIN FOOD FORTUNE AIQ: AI의 해와 다가오는 일
기업들은 AI 디렉터를 고용하는 것부터 AI 에이전트를 실험하는 것까지 2025년에 AI를 향한 큰 발걸음을 내디뎠습니다. 좋은 교훈과 나쁜 교훈이 최신 기술 혁신과 결합되어 2026년은 또 하나의 결정적인 해가 될 것입니다. Fortune AIQ 전체를 살펴보고 아래의 최신 플레이북을 읽어보세요.
– 2025년 기업의 AI 출시를 지배한 3가지 트렌드.
– 2025년은 에이전트 AI의 해였습니다. 우리는 어떻게 했나요?
–AI 코딩 도구는 2025년에 폭발적으로 증가했습니다. 초기 보안 공격은 무엇이 잘못될 수 있는지 보여줍니다.
– 2026년 기업을 위한 AI의 위대한 새해 결심: ROI.
– 기업은 AI 정책과 규정의 혼란스러운 패치워크에 직면해 있습니다. 지평선에 명확성이 있습니까?
