Anthropic은 Claude AI 챗봇의 보고된 성능 문제로 인해 사용자의 반발에 직면해 있습니다

고공행진하는 인공 지능 회사 Anthropic은 Claude AI 모델의 성능 저하로 인해 가장 많은 사용자 중 일부로부터 반발에 직면하고 있습니다.

이 문제로 인해 최근 기업 가치가 3,800억 달러에 달하고 기업공개(IPO)를 앞두고 있는 것으로 알려진 이 회사는 새로운 고객에게 서비스를 제공할 수 있는 동기와 능력에 대한 사용자 반란과 온라인 추측에 대응하기 위해 고군분투하고 있습니다.

많은 개발자와 일반 사용자에 따르면 Anthropic의 인기 있는 Claude AI 모델은 최근 성능이 크게 저하되었으며 모델이 지침을 따르지 못하고 때로는 부적절한 지름길을 선택하며 복잡한 작업 흐름에서 더 많은 오류가 발생하고 있다고 말합니다.

불만 사항은 Anthropic이 Claude의 운영 방식에 조용히 적용한 최근 변경 사항과 관련이 있는 것으로 보이며, 각 요청에 응답하여 모델이 처리하는 토큰 수 또는 데이터 단위를 절약하기 위한 모델의 기본 “노력” 수준을 줄입니다. (Anthropic 대변인은 변경 사항이 사용자에게 제공되는 업데이트 목록인 변경 로그에 나열되어 있다고 공개적으로 밝혔습니다.)

작업당 처리되는 토큰이 많을수록 작업이 소비하는 컴퓨팅 성능도 커집니다. 그리고 일부 경쟁사에 비해 수십억 달러 규모의 데이터 센터 용량 계약을 발표한 Anthropic이 최근 몇 달 동안 자사 제품 채택이 급증한 후 컴퓨팅 리소스가 부족할 수 있다는 추측이 널리 퍼져 있습니다.

Claude의 갑작스러운 실적 저하에 대한 사용자 불만과 Anthropic의 투명성 부족에 대한 분노는 잠재적인 IPO를 위해 투자자를 유치하기를 희망하는 것처럼 잠재적으로 회사의 폭주적인 성장을 방해할 수 있습니다. Anthropic이 Claude의 운영 방식에 적용된 변경 사항이나 변경으로 인해 Claude 사용 비용이 어떻게 증가할 수 있는지에 대해 Anthropic이 진실을 밝히지 않았다는 주장은 다른 어떤 AI 회사보다 Anthropic이 다른 AI 회사보다 더 투명하고 사용자의 이익에 더 부합함으로써 브랜드 평판 구축을 추구했기 때문에 특히 위협적입니다.

Anthropic은 Claude의 사용자 불만 사항에 대한 Fortune의 구체적인 질문에 답변을 거부했습니다. Claude Code 제품을 이끄는 Anthropic 임원인 Boris Cherny는 Claude가 이전에 작업당 너무 많은 토큰을 소비했다는 사용자 피드백에 대응하여 Anthropic이 Claude가 사용자 요청에 응답하는 기본 “노력”을 “중간”으로 줄였다고 말함으로써 온라인 사용자 불만에 응답했습니다. 그러나 많은 사용자들은 회사가 이러한 변경 사항을 사용자에게 강조하지 않았다고 불평했습니다.

이러한 상황은 일부 경쟁사를 포함해 회사가 컴퓨팅 능력 부족으로 고의적으로 성능을 저하시키고 있다는 많은 추측과 비난을 불러일으켰습니다.

업계 전반에 걸쳐 AI 기업은 GPU 비용 상승, 제한된 데이터 센터 확장, “에이전트” AI 시스템에 대한 수요가 인프라 확장보다 더 빠르게 가속화됨에 따라 어떤 제품의 우선순위를 정해야 할지에 대한 어려운 균형에 직면해 있습니다. Anthropic 대변인은 AI 연구소가 수요를 더 잘 충족하기 위해 모델을 다운그레이드하지 않는다고 공개적으로 밝혔지만, 회사가 일부 경쟁사보다 더 심각한 한계에 직면해 있다고 믿을 만한 이유가 있습니다.

Anthropic은 최근 사용량이 증가함에 따라 일련의 중단을 겪었고 피크 시간대에 더 엄격한 사용 제한을 도입하여 일부 사용자의 불만을 불러일으켰습니다. CNBC가 보고한 내부 메모에서 OpenAI의 최고 수익 책임자는 Anthropic이 충분한 컴퓨팅 용량을 확보하지 못해 “전략적 실수”를 저질렀으며 경쟁사보다 “상당히 작은 곡선에서 운영”하고 있다고 주장했습니다. (Anthropic은 이러한 주장에 대한 CNBC의 질문에 답변을 거부했습니다.)

한편, Anthropic은 지난 주 Opus AI 모델보다 훨씬 더 뛰어난 성능을 제공하지만 더 크고 실행 비용이 더 많이 드는 Mythos라는 새로운 아직 출시되지 않은 모델을 훈련했다고 발표했습니다. 이는 이전 모델보다 더 많은 컴퓨팅 성능을 소비할 가능성이 있음을 의미합니다. Anthropic은 보안 문제로 인해 아직 일반 대중에게 모델을 공개하지 않고 있음을 강조했지만 일부에서는 Anthropic이 Mythos의 광범위한 배포를 지원할 만큼 컴퓨팅 성능이 부족한지 의문을 제기했습니다.

자신의 성공의 희생자

Anthropic의 조사는 AI 시장의 급변하는 성격과 무엇이 위태로운지 강조합니다. 지난주 Anthropic은 연환산 반복 수익(ARR)이 2025년 말 90억 달러에서 현재 300억 달러로 증가했다고 발표하여 업계를 놀라게 했습니다. OpenAI는 지난 달 두 회사가 정확히 동일한 방식으로 수익을 보고하지 않아 직접적인 비교가 문제가 되기는 하지만 월 20억 달러, 연간 240억 달러의 수익을 창출하고 있다고 밝혔습니다.

Anthropic은 최근 AI 코딩 도구인 Claude Code의 인기로 인해 새로운 사용자가 급증하고 미국 국방부와의 분쟁에 따른 소비자 지원의 물결로 인해 이익을 얻었습니다. 트럼프 행정부가 Anthropic을 “공급망 위험”으로 지정한 후 많은 사용자가 OpenAI의 ChatGPT와 같은 경쟁사에서 Claude로 전환했습니다. Anthropic은 미국 정부가 회사의 기술을 치명적인 자율 무기나 미국 시민에 대한 대량 감시에 사용하지 않기로 계약에 동의했다는 주장에서 분쟁이 발생했다고 말했습니다.

최근 몇 년 동안 Anthropic은 AI 경쟁에서 상당한 기반을 확보하여 엔터프라이즈 AI 분야의 리더로 부상하고 개발자와 기업 사용자 사이에 상당한 호감을 불러일으켰습니다. 그러나 Claude의 성과 문제에 대한 분노가 지속된다면, 그러한 호의가 일부 침식될 위험이 있으며 회사가 중요한 순간에 비틀거리게 될 수도 있습니다.

최근 Claude의 성능 문제를 둘러싼 일부 논란에 대해 Claude Code의 Cherny 대표는 Claude Opus 4.6(Anthropic의 주력 모델)이 2월 초에 “적응적 사고”를 도입하여 고정된 예산을 사용하는 대신 주어진 작업에 얼마나 많은 추론을 적용할지 모델이 결정할 수 있게 되었다고 말했습니다. 3월 초에 Anthropic은 기본 설정을 “중간 노력” 수준으로 변경했다고 Cherny는 말했습니다. Claude Code 사용자는 도구의 노력 수준을 수동으로 변경할 수 있지만 Cowork Pro 버전 또는 Claude 데스크톱 버전에 대한 비용을 지불하는 사용자는 현재 기본값을 변경할 수 없습니다.

Cherny는 일부 사용자 문제를 해결하기 위해 향후 “추가 토큰 및 대기 시간이 발생하더라도 확장된 사고의 이점을 누릴 수 있도록 기본 Teams 및 Enterprise 사용자를 많은 노력으로 테스트할 것”이라고 말했습니다.

또한 모델이 의도적으로 희석되었다는 추측과 변경 사항이 투명성이 부족하여 구현되었다는 사용자 불만을 거부하고 변경 사항은 사용자 피드백에 따라 이루어졌으며 Claude Code 인터페이스 내의 팝업 창을 통해 사용자의 관심을 끌었다고 주장했습니다.

‘복잡한 엔지니어링 작업에는 사용할 수 없습니다’

대부분의 사용자 불만 사항은 Anthropic의 AI 기반 코딩 도구인 Claude Code에 집중되어 있으며, 이 도구는 회사에서 가장 인기 있고 가장 빠르게 성장하는 제품 중 하나가 되었습니다.

2025년 초에 출시된 Claude Code는 개발자 환경 내에서 자율적으로 코드를 읽고, 쓰고, 실행할 수 있는 명령줄 에이전트로 작동합니다. 데뷔 이후 복잡한 다단계 코딩 작업을 위해 이를 사용하는 개인 개발자와 대규모 엔터프라이즈 엔지니어링 팀이 널리 채택했습니다.

Claude Code의 최근 성능 변화는 AMD AI 수석 이사인 Stella Laurenzo의 GitHub 분석 덕분에 소셜 미디어에서 광범위한 주목을 받았습니다. 널리 공유된 분석에서 Laurenzo는 이러한 변경으로 인해 Claude가 “복잡한 엔지니어링 작업에 사용할 수 없게 되었다”고 말했습니다.

그의 분석에 따르면 Claude는 2월 말부터 3월 초까지 “조사 우선” 접근 방식(여러 파일을 읽고 변경하기 전에 컨텍스트 수집)에서 보다 직접적인 “편집 우선” 스타일로 전환한 것으로 나타났습니다. 분석에 따르면 모델은 행동하기 전에 더 적은 양의 맥락을 읽고 더 많은 오류를 일으키며 훨씬 더 많은 사용자 개입이 필요합니다. 또한, 너무 빨리 멈추거나, 책임을 회피하거나, 불필요한 허락을 구하는 등의 행동이 증가하고, 이는 같은 기간 동안 ‘생각’의 깊이가 감소하는 것으로 분석되었습니다.

“클로드는 복잡한 엔지니어링을 수행하는 것을 신뢰할 수 없을 정도로 퇴보했습니다.”라고 그는 썼습니다.

분석에 대한 답변에서 Anthropic의 Cherny는 분석이 데이터 중 적어도 일부를 잘못 해석할 가능성이 있다고 말하면서 모델의 추론이 감소되지 않았지만 Anthropic이 모델의 전체 “추론 트레일”이 더 이상 사용자에게 표시되지 않도록 변경했다고 밝혔습니다.

그러나 도구에 문제가 있는 사람은 Laurenzo만이 아닙니다.

마이크로소프트의 연구 수석 이사인 디미트리스 파파일리오풀로스(Dimitris Papailiopoulos)는 X에서 “지난 2주 동안 클로드 코드와 엄청나게 실망스러운 세션을 가졌다”고 썼다. “나는 최선을 다했지만 그는 극도로 부주의하고 지시를 무시하고 실수를 반복한다.”

Admin

Website | + posts

Search for an article

Anthropic은 Claude AI 챗봇의 보고된 성능 문제로 인해 사용자의 반발에 직면해 있습니다 | 행운

Admin

최신 기사

월마트의 베스트셀러 메쉬 스니커즈는 3가지 색상으로 단 19달러입니다

Solana (SOL) 구축, $90 이제 주요 전장

헌팅턴은 거의 2주에 한 번씩 지점을 열어 디지털 성장을 주도하고 있다고 CFO | 행운

아마존, 15피스 정리세트를 14달러에 단돈 9달러에 판매

이와 유사한 항목

헌팅턴은 거의 2주에 한 번씩 지점을 열어 디지털 성장을 주도하고 있다고 CFO | 행운

Dow CEO 이전으로 경험이 풍부한 내부 운영자가 향상됨 | 행운

‘확실하다’: 하버드 정책 전문가는 이란 전쟁으로 인해 미국 납세자들이 부담해야 할 실제 비용이 1조 달러를 넘을 것이라고 경고 | 행운