앤트로픽, 차세대 AI ‘Claude Opus 4.6’ 공개…코딩·장기추론·안전성 모두 끌어올렸다

Photo of author

By 코리안투데이 글로벌

 

AI 안전 연구 기업 앤트로픽(Anthropic)이 2월 5일 차세대 대형언어모델 ‘Claude Opus 4.6’을 공개하며, 프런티어 AI 경쟁에서 다시 한 번 기술적 우위를 강조했다. 이번 업데이트는 단순한 성능 개선을 넘어, 실제 업무 환경에서의 장기 추론·코딩·에이전트 활용·안전성을 전방위로 강화한 것이 특징이다.

 

 [코리안투데이] 보다 향상된 Claude Opus 4.6 대표 이미지 모습  © 최도선 기자

 

Claude Opus 4.6은 전작 대비 코딩 능력이 크게 향상됐다. 대규모 코드베이스에서도 더 신뢰성 있게 작동하며, 스스로 오류를 발견하는 코드 리뷰와 디버깅 능력이 강화됐다. 특히 장시간 에이전트 작업을 유지하면서도 맥락을 잃지 않는 점은 기존 AI 모델의 한계로 지적되던 ‘컨텍스트 부패’ 문제를 실질적으로 개선한 사례로 평가된다.

 

이번 모델의 가장 큰 변화 중 하나는 Opus 계열 최초로 100만 토큰 컨텍스트 창(베타)을 제공한다는 점이다. 이는 수십만 토큰에 달하는 문서, 연구 자료, 코드 기록을 한 번에 이해하고 추론할 수 있음을 의미한다. 실제 평가에서도 Opus 4.6은 방대한 문서 집합에서 숨겨진 정보를 정확히 찾아내는 능력을 보여주며, 장기 맥락 추론 영역에서 질적 도약을 입증했다.

 

성능 평가 결과도 눈에 띈다. 에이전트 코딩 벤치마크인 Terminal-Bench 2.0에서 최고 점수를 기록했으며, 복잡한 다학제 추론 테스트인 Humanity’s Last Exam에서도 다른 프런티어 모델을 앞섰다. 특히 금융·법률·전문 지식 업무의 경제적 가치를 측정하는 GDPval-AA 평가에서는 OpenAI의 차세대 모델로 알려진 GPT-5.2보다 약 144 Elo 포인트 앞선 성능을 기록했다.

 

Opus 4.6은 개발자뿐 아니라 일반 지식 노동자의 업무 환경도 크게 바꿀 것으로 보인다. 재무 분석, 연구, 문서 작성, 스프레드시트와 프레젠테이션 제작 등 일상적인 사무 작업 전반에서 활용도가 높아졌다. Excel에서는 복잡한 데이터 구조를 스스로 파악해 다단계 작업을 수행하고, PowerPoint에서는 브랜드 스타일을 이해해 전체 발표 자료를 자동으로 구성할 수 있다.

 

개발자 플랫폼 측면에서도 변화가 크다. API에는 적응적 사고(adaptive thinking)와 노력 수준 조절(effort control) 기능이 도입돼, 추론 깊이와 비용·속도 간 균형을 개발자가 직접 제어할 수 있게 됐다. 또한 맥락 압축(Context Compact) 기능을 통해 장기 실행 에이전트가 컨텍스트 한계에 도달하기 전 자동 요약을 수행하도록 했다.

 

앤트로픽은 성능 향상이 안전성 저하로 이어지지 않았다는 점도 강조했다. 자동화된 행동 감사와 확장된 안전성 테스트에서 Opus 4.6은 기만, 아첨, 오용 협조 등 부정적 행동 발생률이 낮은 것으로 나타났다. 특히 사이버보안 역량이 강화된 만큼, 새로운 오용 탐지 장치와 방어 중심 활용 전략도 함께 적용됐다.

 

Claude Opus 4.6은 현재 claude.ai, API, 그리고 주요 클라우드 플랫폼에서 이용 가능하며, 가격은 기존과 동일하게 백만 토큰당 5달러(입력)/25달러(출력)로 책정됐다. 전문가들은 이번 업데이트가 단순한 모델 성능 경쟁을 넘어, AI가 실제 업무에서 얼마나 ‘지속적이고 책임 있게’ 일할 수 있는지를 가늠하는 기준이 될 것으로 보고 있다.

 

[ 최도선시민 기자gwanak@thekoreantoday.com ]

 

 

📰 기사 원문 보기

<저작권자 ⓒ 코리안투데이(The Korean Today) 무단전재 및 재배포 금지>

댓글 남기기