케임브리지에서 교육받은 두 명의 신경과학자가 설립한 런던 기반 스타트업인 Callosum은 다양한 유형의 칩을 혼합하여 AI 워크로드를 조율하는 소프트웨어를 만들고 있으며, 동일한 Nvidia GPU 뱅크에서 점점 더 큰 모델을 실행해야 하는 업계의 의존도에 도전하고 있습니다.
또한 회사는 영국 정부로부터 연구 자금을 받을 것이라고 발표했습니다. 영국 정부는 미국 기술 제공업체에 독립적이거나 적어도 독점적으로 의존하지 않는 소위 AI용 “주권 클라우드” 인프라를 구축하는 방법을 모색하고 있습니다.
2019년경 캠브리지에서 박사 과정을 밟는 동안 만난 Callosum 공동 창립자 Danyal Akarca와 Jascha Achterberg는 Nvidia GPU, AMD 프로세서, Trainium 실리콘 및 Amazon Web Services의 맞춤형 Inferentia 또는 Cerebras 및 SambaNova와 같은 스타트업의 최신 디자인 등 다양한 제조업체의 칩에 AI 작업을 분산하여 각각의 성능 이점을 추출할 수 있는 소프트웨어를 보유하고 있습니다.
자금 조달 라운드는 Wise의 Taavet Hinrikus와 영국 AI 안전 연구소의 초대 회장이기도 한 Ian Hogarth가 공동 설립한 유럽 종자 벤처 펀드인 Plural이 주도했습니다. Charlie Songhurst, FiveAI의 Stan Boland, Royal Academy of Engineering의 John Lazar 등 엔젤 투자자도 참여했습니다. 이와 별도로 영국 정부의 ARIA(Advanced Research and Inventions Agency)는 새로운 칩 기술을 플랫폼에 통합하기 위한 연구 개발을 가속화하기 위해 회사에 보조금을 제공하고 있지만 ARIA는 이번 라운드 자체의 투자자는 아니라고 Akarca는 Fortune과의 인터뷰에서 말했습니다.
이 회사의 논문은 신경과학과 컴퓨터 과학의 교차점에서 공동 창업자의 학문적 연구를 기반으로 합니다. 인간의 두뇌는 한 유형의 뉴런을 수십억 번 복사하여 지능을 얻는 것이 아니라 함께 작동하는 다양한 유형의 특수 세포와 회로를 결합하여 지능을 달성합니다. 그들은 AI 컴퓨팅도 동일한 원칙을 따라야 한다고 믿습니다.
Akarca는 “대규모 연구실은 현재 하나의 모델이 모든 것을 지배할 것이라고 확신하고 있습니다. 우리는 그것이 틀렸다고 생각하며 우리의 연구가 그것을 증명하고 있습니다”라고 말했습니다. “자연은 진정한 지능이 함께 작동하는 많은 시스템에서 발생한다는 것을 보여줍니다.”
Callosum은 심각한 구조적 변화를 겪고 있는 시장에 진입했습니다. 동일한 Nvidia GPU 랙에서 대규모 기본 모델을 훈련하는 데 AI 지출이 지배되었던 수년이 지난 후, 업계는 이제 결과를 생성하기 위해 훈련된 모델을 실행하는 프로세스인 추론으로 전환하고 있습니다. 딜로이트는 추론 워크로드가 2023년 1/3에서 2026년 전체 AI 컴퓨팅의 약 2/3를 차지할 것이며, 추론 최적화 칩 시장이 올해 500억 달러 이상으로 성장할 것으로 추정했습니다. 이러한 변화는 다양한 칩 제조업체가 Nvidia의 지배력에 도전할 수 있는 기회를 창출하고 있습니다.
Callosum은 점점 더 파편화되는 하드웨어 환경을 통합하는 소프트웨어 계층이 될 수 있다고 확신합니다. 해당 플랫폼은 AWS, Google Cloud, Microsoft Azure를 포함한 여러 클라우드 제공업체와 작동하며 고객이 이를 사용하기 위해 기존 클라우드 구성을 재설계할 필요가 없도록 설계되었습니다. Akarca는 “이것은 AI 워크로드를 가져와 사용할 수 있는 다양한 멀티 클라우드 구성으로 구성하는 소프트웨어 제품입니다.”라고 말했습니다.
공동 창업자들은 이 접근 방식이 컴퓨터 사용 자동화, 비즈니스 워크플로 처리 등 다양한 유형의 결정을 수반하는 복잡한 실제 작업에서 큰 이점을 제공한다고 주장합니다. 이와 같은 작업의 경우 Callosum은 자사 시스템이 동일한 하드웨어에서 동일한 워크로드를 실행하는 것과 비교하여 2배의 정확성, 7배 빠른 성능, 4배 더 낮은 비용을 제공할 수 있다고 말합니다.
Achterberg는 정밀도의 향상은 해결되는 문제의 성격에서 비롯된다고 설명했습니다. “단순한 문제, 개별 모델은 완벽하게 괜찮습니다”라고 그는 말했습니다. 그러나 복잡한 비즈니스 작업은 다른 문제입니다. Achterberg는 “컴퓨터 사용 자동화, 결제 자동화 등이 우리가 중점을 두고 있는 문제입니다. 본질적으로 이질적입니다”라고 말했습니다. “문제를 해결하는 데는 실제로 수많은 단계가 관련되어 있으며 단일 모델이 항상 최적인 것은 아닙니다.”
복잡한 워크플로우의 각 부분에는 서로 다른 사항이 필요할 수 있습니다. 일부 단계에는 시행착오를 통해 빠르게 반복할 수 있는 매우 빠르고 저렴한 모델이 필요한 반면, 다른 단계에는 더 광범위하고 유능한 추론이 필요합니다. Callosum은 각 하위 작업을 올바른 하드웨어에서 실행되는 올바른 모델과 연결함으로써 전체 문제에 대해 강력한 모델을 제시하는 기존 접근 방식을 극복할 수 있다고 말합니다.
Callosum은 두 가지 유형의 고객, 즉 복잡한 워크플로에서 우수한 성능이 필요한 다중 에이전트 AI 시스템을 구축하는 회사와 규모에 맞게 하드웨어의 기능을 입증하려는 신흥 칩 제조업체를 대상으로 합니다. Achterberg는 “우리가 원하는 것은 놀라운 성능과 놀라운 이점을 지닌 이러한 모든 새로운 칩 기술을 실제로 실현할 수 있는 시장에 진출할 수 있는 방법을 찾는 것”이라고 말했습니다.
이 회사는 또한 전기 펄스 대신 빛을 사용하여 데이터를 전송하는 기술인 포토닉스 기반 네트워크를 개발하는 기업을 포함하여 데이터 센터 내에서 AI 칩 랙을 연결하는 새로운 방법(“상호 연결”이라고 함)을 연구하는 기업과 협력하고 있습니다. 이러한 기술은 데이터 센터 내에서 데이터를 혼합해야 할 때 발생하는 병목 현상을 해결하기 위해 설계되었습니다. 이러한 문제는 다양한 유형의 칩이 서로 통신해야 함에 따라 더욱 복잡해집니다.
공동 창립자들은 앞으로 자금을 사용하여 런던에 기반을 둔 팀을 확장하고 미국으로 확장을 시작하며 자체 보완 하드웨어 인프라 구축을 시작할 계획이라고 말했습니다. 장기적인 야망은 소프트웨어를 넘어 데이터 센터 설계를 근본적으로 재고하는 것까지 확장됩니다.
Achterberg는 “모든 사람들은 칩 다양성이 관리되어야 하는 단점이라고 생각했습니다. 우리는 그 반대, 즉 활용해야 하는 장점을 보았습니다”라고 말했습니다. “우리는 기존 세트 위에 알고리즘을 최적화하지 않습니다. 우리는 소프트웨어를 사용하여 시스템 전체의 모든 레버를 제어하고 다른 사람들이 버리는 다양성에서 이점을 추출하고 있습니다.”
Plural의 파트너인 Ian Hogarth는 성명에서 다음과 같이 말했습니다. “(Callosum의) 다중 모델, 다중 칩 미래에 대한 비전은 혁신적일 수 있으며 세계 최대의 칩 및 모델 제조업체와 경쟁할 수 있는 입지를 마련할 수 있습니다. 이들은 진지한 임무를 수행하는 진지한 창립자들입니다.”
