De Rosen이 지난 주 전화 통화에서 나에게 문제는 다양한 AI 모델이 브랜드의 제품 제공을 특성화하는 방식(일반적으로 제품의 특성, 특징, 해당 기능을 경쟁 제품과 비교하는 방법을 정확하게 보고하고 해당 정보의 출처에 대한 인용 제공)에 있어서 일관된 경향이 있지만 회사의 재무 안정성, 거버넌스 및 기술 인증과 관련된 질문을 받을 때 일관성이 없고 오류가 발생하기 쉽다는 것입니다. 그러나 이 정보는 주요 조달 결정에서 중요한 역할을 할 수 있습니다.
AI 모델은 재무 및 거버넌스 문제에서 신뢰성이 떨어집니다.
한 가지 예에서 AIVO Standard는 빠르게 성장하는 기업 비용 관리 소프트웨어 회사인 Ramp에 대한 질문에 최첨단 AI 모델이 어떻게 대답하는지 평가했습니다. AIVO Standard는 해당 모델이 Ramp의 사이버 보안 인증 및 거버넌스 표준에 대한 질문에 안정적으로 대답할 수 없다는 사실을 발견했습니다. 드 로젠은 어떤 경우에는 AI 모델이 젊은 민간 기업의 거버넌스 및 재정적 적합성에 대한 질문에 정확하게 답할 수 없거나 그들이 제공한 정보의 출처를 인용할 수 없기 때문에 새로운 민간 기업이 동일한 기준을 충족하는 경우에도 기업이 대규모, 공개 거래 및 기존 기업과 관련된 인수 결정을 내리도록 미묘하게 유도할 가능성이 있다고 말했습니다.
또 다른 예로, 경쟁사 체중 감량 약물의 위험 요인에 대해 AI 모델이 말한 내용을 분석했습니다. 그는 AI 모델이 단순히 위험 요인을 나열하는 것이 아니라 어떤 약물이 환자에게 ‘가장 안전한 옵션’인지 권장하고 판단한다는 사실을 발견했습니다. 드 로젠은 “결과는 대체로 객관적이고 측정되었으며 면책조항도 있었지만 여전히 적격성, 위험 인식 및 선호도를 결정했습니다”라고 말했습니다.
AIVO Standard는 이러한 문제가 모든 주요 AI 모델과 다양한 프롬프트에서 발생했으며 모델이 답변을 확인하도록 요청받은 경우에도 지속된다는 사실을 발견했습니다. 실제로 어떤 경우에는 모델이 부정확한 정보에 직면하여 그것이 정확하다고 주장하면서 노력을 두 배로 늘리는 경향이 있습니다.
GEO는 여전히 과학이라기보다 예술에 가깝습니다.
몇 가지 의미가 있습니다. 하나는 GEO 서비스를 판매하는 모든 회사의 경우 GEO가 브랜드 정보의 다양한 측면에서 좋은 성과를 내지 못할 수 있다는 것입니다. 기업은 브랜드가 챗봇 응답에 어떻게 나타나는지 보여줄 수 있다고 말하는 마케팅 기술 회사를 반드시 신뢰해서는 안 되며, 마케팅 기술 회사가 AI 응답을 안정적으로 형성할 수 있는 마법의 공식을 가지고 있다고 믿어서는 안 됩니다. 빠른 결과는 평가되는 브랜드 정보의 유형에 따라 분 단위로 상당히 달라질 수 있습니다. 그리고 제품과 관련되지 않은 정보에 대해 챗봇 응답을 정확하게 전달하는 방법에 대한 증거는 아직 많지 않습니다.
하지만 훨씬 더 큰 문제는 AI가 제공한 정보가 의사 결정의 기초가 되는 시점이 많은 에이전트 워크플로(사람이 참여하는 경우에도)에 있다는 점입니다. 그리고 드 로젠(de Rosen)이 말했듯이 오늘날 대부분의 기업은 정보, 판단, 의사결정 사이의 경계를 실제로 통제하지 못합니다. 그들은 정확히 어떤 메시지가 사용되었는지, 모델이 응답으로 무엇을 반환했는지, 이것이 최종 권장 사항이나 결정에 정확히 어떤 영향을 미쳤는지 추적할 방법이 없습니다. 금융이나 의료 등 규제 대상 산업에서 문제가 발생하면 규제 당국은 정확한 세부 정보를 요구합니다. 그리고 규제 대상 회사가 이 모든 데이터를 캡처하는 시스템을 구현하지 않으면 문제에 직면하게 됩니다.
AI의 행운
Anthropic은 수십 개의 스타트업을 위협할 수 있는 AI 파일 관리 에이전트인 Claude Cowork를 출시했습니다(영국 Beatrice Nolan 작성). 조사
Anthropic, 의료용 Claude 출시, 생명 과학 기능 확장, HealthEx와 제휴하여 사용자가 의료 기록 연결 가능(Jeremy Kahn 작성)
뉴스 속의 AI
Apple은 Siri를 위해 업데이트된 Google AI를 선택합니다. Apple은 오랫동안 기다려온 Siri 업데이트를 포함하여 제품의 주요 인공 지능 기능을 강화하기 위해 Google과 다년간의 파트너십을 체결했다고 월요일 발표했습니다. 이번 거래는 Google의 AI 부활을 강조하고 Google 모회사 Alphabet의 시장 가치를 4조 달러 이상으로 끌어올리는 데 도움이 되었습니다. Apple은 이번 거래가 Siri가 현재 ChatGPT에 일부 쿼리를 전달하는 OpenAI와의 기존 파트너십을 변경하지 않는다고 밝혔습니다. 하지만 Google과의 제휴가 Siri의 미래 AI 통합을 어떻게 형성할지는 확실하지 않습니다. 블룸버그는 이전에 애플이 시리(Siri)용 AI 모델에 접근하기 위해 구글에 연간 최대 10억 달러를 지불하는 것을 고려하고 있다고 보도했지만, 거래의 재정적 조건도 공개되지 않았습니다.
AI 연구에 주목하다
Microsoft, Nvidia 및 영국 스타트업 Basecamp Research는 유전자 편집 분야에서 AI의 도움으로 획기적인 발전을 이루었습니다. Nvidia와 Microsoft의 과학자로 구성된 국제 연구팀은 AI를 사용하여 백만 개 이상의 종에서 진화 데이터를 마이닝하여 잠재적인 새로운 유전자 편집 도구와 약물 치료법을 설계했습니다. 팀은 Basecamp에서 수집한 방대한 미발표 생물학적 데이터 세트를 기반으로 훈련된 Eden이라는 AI 모델 제품군을 개발했습니다. Nvidia의 벤처 캐피털 부서는 Basecamp의 투자자입니다.
당신은 달력을 가지고 있습니다
1월 19~23일: 세계경제포럼, 스위스 다보스.
1월 20~27일: 인공 지능에 관한 AAAI 회의, 싱가포르.
2월 10~11일: AI Action Summit, 인도 뉴델리.
3월 2~5일: 스페인 바르셀로나에서 열리는 모바일 월드 콩그레스(Mobile World Congress).
3월 16~19일: Nvidia GTC, 캘리포니아주 산호세.
두뇌를 위한 음식
사람들이 AI가 쓴 소설을 선호하거나 차이를 구분할 수 없다면 어떻게 될까요? 뉴욕 작가 Vaudhini Vara가 몇 주 전 잡지 웹사이트에 “주말 에세이”로 게재된 도발적인 에세이에서 제기한 질문이 바로 이것입니다. 기성 AI 모델은 계속해서 최고의 MFA 프로그램 졸업생과 노련한 소설가의 스토리만큼 설득력 있는 스토리를 생성하기 위해 고군분투하고 있지만, 이러한 모델이 기존 작가의 작품에 적합하면 원저자가 만든 것과 종종 구별할 수 없는 산문을 생성할 수 있는 것으로 나타났습니다. 놀랍게도 AI 모델의 창의적 글쓰기 기능에 대해 지금까지 최고의 실험을 수행한 Tuhin Chakrabarty 연구원이 실시한 테스트에서 Vara는 이를 약간 다른 방식으로 반복합니다. 심지어 문학적 감수성이 뛰어난 독자(예: MFA 학생)도 사람이 쓴 산문보다 AI로 쓴 버전을 선호합니다. 그렇다면 순정소설이나 장르소설 작가들에게 무슨 희망이 있겠는가? 몇 달 전 저는 저명한 소설가인 친구와 대화를 나누었습니다. 그는 미래 세대가 인간이 쓴 문학을 소중히 여길지 여부에 대해 비관적이었습니다. 나는 독자들이 인간 작가와 소통하고 있다는 생각, 그 말 뒤에는 생생한 경험을 지닌 마음이 있다는 생각에 항상 관심을 가질 것이라고 주장하려고 노력했습니다. 나는 확신하지 못했습니다. 그리고 나는 그의 비관주의가 타당한 근거가 있다는 점에 점점 더 우려하고 있습니다. Vara는 궁극적으로 페이지 전체에 생생한 경험을 전달하는 문학의 아이디어를 보존하는 유일한 방법은 우리가 집단적으로 이를 요구하는 것(그리고 기존 작가의 작품에 AI 모델을 적용하는 것을 금지하는 것조차 가능함)이라고 결론지었습니다. 그게 현실인지 잘 모르겠습니다. 하지만 그것이 우리에게 남은 유일한 선택일 수도 있습니다.
FORTUNE AIQ: AI의 해와 앞으로 다가올 일들
기업들은 AI 디렉터를 고용하는 것부터 AI 에이전트를 실험하는 것까지 2025년에 AI를 향한 큰 발걸음을 내디뎠습니다. 좋은 교훈과 나쁜 교훈이 최신 기술 혁신과 결합되어 2026년은 또 하나의 결정적인 해가 될 것입니다. Fortune AIQ 전체를 살펴보고 아래의 최신 플레이북을 읽어보세요.
– 2025년 기업의 AI 출시를 지배한 3가지 트렌드.
– 2025년은 에이전트 AI의 해였습니다. 우리는 어떻게 했나요?
–AI 코딩 도구는 2025년에 폭발적으로 증가했습니다. 초기 보안 공격은 무엇이 잘못될 수 있는지 보여줍니다.
– 2026년 기업을 위한 AI의 위대한 새해 결심: ROI.
– 기업은 AI 정책과 규정의 혼란스러운 패치워크에 직면해 있습니다. 지평선에 명확성이 있습니까?
