클로드AI Mythos 유출 — CMS 설정 실수로 드러난 차세대 모델과 사이버보안 리스크

며칠 전 Anthropic에서 좀 황당한 일이 벌어졌어요. AI 안전을 그 누구보다 강조하던 회사가, CMS 설정 하나를 잘못 건드려서 미공개 모델 정보를 통째로 흘린 거거든요. 클로드AI를 만드는 회사 Anthropic, 그리고 아직 세상에 나오지 않은 차세대 모델 “Mythos”의 존재가 이렇게 알려지게 됐어요.

클로드AI Mythos, 어쩌다 유출됐나

Fortune이 3월 26일 단독으로 보도한 내용에 따르면, Anthropic이 사용하던 CMS의 업로드 파일이 기본적으로 공개 상태였고, 별도 인증 없이 누구나 쿼리할 수 있었다고 해요. 약 3,000개의 자산이 외부에 노출된 상태였더라고요.

유출된 건 단순히 모델 하나가 아니었어요. CEO 이벤트 관련 자료, 내부 문서, 직원 정보까지 포함돼 있었고요. Fortune 측이 Anthropic에 이 사실을 알렸고, 캠브리지대학교 보안 연구자 Alexandre Pauwels가 유출 자산을 평가하는 과정을 거쳤더라고요.

Anthropic은 이 사고를 “human error in CMS configuration”이라고 인정했어요. 동시에 “AI 코딩 도구나 Cowork, Claude 제품과는 무관한 문제”라고 선을 그었고요. CMS 설정값 하나가 만든 구멍치고는 꽤 큰 파장이었고요.

클로드AI Mythos는 뭐가 다른 모델인가

유출된 내부 문서에 따르면, Mythos(코드명 Capybara)는 기존 Opus 모델 위에 놓이는 새로운 티어예요. Anthropic 스스로도 “larger and more intelligent than our Opus models”라고 적어뒀더라고요.

성능 면에서는 소프트웨어 코딩, 학술 추론, 사이버보안 테스트에서 “dramatically higher scores”를 기록했다고 해요. Anthropic이 Fortune에 직접 확인해 준 표현이 “a step change”와 “the most capable we’ve built to date”였고요. 단순한 업그레이드가 아니라 완전히 다른 급의 모델이라는 뉘앙스가 강했죠.

다만 비용 문제가 만만치 않아 보여요. 내부 문서에는 “very expensive for us to serve, and will be very expensive for our customers to use”라고 적혀 있었거든요. 서빙 비용도 높고, 사용자 요금도 높을 거라는 얘기예요.

그래서인지 출시 전략도 점진적으로 출시할 계획을 세우고 있었어요. 사이버 방어 관련 고객에게 먼저 제공한 뒤, 효율화 작업을 거쳐 일반 공개로 넘어가는 순서더라고요.

사이버보안 능력이 왜 문제가 되나

Mythos에서 가장 논쟁이 될 부분은 사이버보안 능력이에요. 유출 문서에는 이 모델이 “currently far ahead of any other AI model in cyber capabilities”라고 쓰여 있었거든요.

근데 그 다음 문장이 더 쎄요. “presages an upcoming wave of models that can exploit vulnerabilities in ways that far outpace the efforts of defenders.” 방어자가 따라잡을 수 없는 속도로 취약점을 찾아내고 공격할 수 있는 모델 세대가 온다는 뜻이죠.

이 맥락에서 클로드AI 컴퓨터 제어 기능도 다시 떠올릴 필요가 있어요. AI가 화면을 직접 조작하는 시대에, 사이버 공격 능력까지 비약적으로 높아진다면 그 조합이 어떤 결과를 낳을지 쉽게 예측하기 어렵잖아요.

공교롭게도 같은 주에 펜타곤과 관련된 판결도 나왔어요. 미국 판사가 펜타곤이 Anthropic에 붙인 “supply-chain risk” 라벨을 차단하면서, 이를 “Orwellian notion”이라고 표현했더라고요. AI 안전을 둘러싼 정부와 기업 사이의 긴장이 여러 방향에서 동시에 터지고 있는 모양새예요.

방어자 우선 전략이 충분할까

Anthropic이 사이버 방어 고객에게 먼저 Mythos를 제공하겠다는 건, 공격 능력만큼 방어 능력도 키우겠다는 의도로 읽혀요. 그런데 모델이 공개된 뒤에는 그 구분이 의미가 있을지 의문이 남고요. AI 에이전트가 실제로 돈을 벌기 시작한 지금, 사이버보안 분야에서의 AI 활용은 공격과 방어 양쪽 모두에서 빠르게 현실이 되고 있죠.

자주 묻는 질문

Q. Mythos는 언제 출시되나요?

공식 일정은 아직 없어요. 유출된 내부 문서에는 효율화 작업을 거친 뒤 점진적으로 출시한다는 계획만 적혀 있었고, 초기에는 사이버 방어 관련 고객에게 우선 제공될 예정이더라고요.

Q. 가격대는 어느 정도일까요?

구체적인 금액은 나오지 않았지만, 내부적으로도 “서빙 비용이 매우 높고 고객 요금도 매우 비쌀 것”이라고 적혀 있었어요. 현재 Opus가 클로드AI 라인업에서 가장 비싼 모델인데, Mythos는 그 위에 놓이는 티어라서 상당한 프리미엄이 붙을 거로 보여요.

Q. OpenAI 쪽에서도 비슷한 모델을 준비하고 있나요?

The Decoder에 따르면 OpenAI도 “Spud”라는 코드명의 모델 사전훈련을 완료한 상태예요. 두 회사 모두 2026년 IPO를 앞두고 있어서, 하반기에는 차세대 모델 경쟁이 본격화될 거로 보이고요.

Q. 이번 유출로 Anthropic의 AI 서비스 자체가 해킹된 건가요?

아니에요. Anthropic이 직접 해명한 바로는, 이번 사고는 CMS 설정 오류에 따른 것이고 클로드AI 서비스나 Cowork 등 AI 도구와는 무관하다고 밝혔어요. 모델 가중치나 사용자 데이터가 유출된 건 아니고요.

AI 안전의 간판을 걸고 있던 회사가, 정작 CMS 기본 설정 하나를 놓쳐서 차세대 모델의 존재가 세상에 알려졌어요. 기술적으로 대단한 해킹이 아니라 사람의 실수 한 번이 만든 결과라는 게, 오히려 더 오래 생각하게 만들더라고요.

참고 자료

클로드AI Mythos 유출 — 보안 기업이 CMS 설정 하나로 차세대 모델을 흘렸다

클로드AI Mythos, 어쩌다 유출됐나

클로드AI Mythos는 뭐가 다른 모델인가