“에이전트 시대로 도약” 올림푸스 슬롯사이트 클로드 4 시리즈 공개
올림푸스 슬롯사이트은 새 AI 모델이 기존 경쟁사 모델을 능가하는 코딩 및 장기 과제 성능을 드러냈다.
올림푸스 슬롯사이트은 최근 샌프란시스코에서 열린 첫 개발자 콘퍼런스에서 최첨단 AI 모델 ‘클로드 오퍼스 4(Claude Opus 4)’와 ‘클로드 소넷 4(Claude Sonnet 4)’를 공개했다.
610억 달러 이상의 기업가치를 평가받은이 스타트업은 공식 블로그를 통해 오퍼스 4가 “세계 최고의 코딩 모델”이라며 “집중력과 수천 단계의 작업을 요하는 장기 과제에서도 안정적으로 성능을 발휘한다”고 설명했다. 새 모델을 기반으로 한 AI 에이전트들은 수천 개의 데이터 소스를 분석해 복잡한 작업을 자율적으로 수행할 수 있다.
새 모델의 등장은 소프트웨어 코딩 같은 특정 분야에서 속도와 효율성을 극대화하기 위해 각사가 치열하게 신기술을 경합 중인 현황을 잘 보여준다. 실제로 주요 소프트웨어 엔지니어링 벤치마크에서 올림푸스 슬롯사이트의 두 모델은 오픈AI 최신 모델을 제쳤고, 구글의 최상위 모델보다도 우수한 성능을 기록했다.
초기 테스터들은 이미 오퍼스 4를 실무 프로젝트에 투입해 사용해봤다. 쇼핑 리워드 회사 라쿠텐의 AI 총괄 매니저는 “오퍼스 4가 복잡한 과제에서 거의 일곱 시간 동안 자율적으로 코딩했다”고 전했다.
앤스로픽 기술팀의 다이앤 펜은 올림푸스 슬롯사이트에 “이번 모델들은 단순한 보조하는 역할을 넘어, 사용자를 대신해 자율적으로 일할 수 있는 ‘에이전트’로 도약했다”며 “지시 이행 능력이 한층 정교해졌고, ‘메모리’ 기능으로 장기 과제 인식 능력을 확보했다”고 설명했다. 오퍼스 4는 작업 진행 상황을 파일 시스템처럼 저장하고, 필요할 때마다 해당 메모리를 참조해 계획을 조정하는 방식을 쓴다.
두 모델 모두 추론 모드와 웹 검색 같은 도구를 오가며, 동시에 여러 도구, 웹 검색과 코드 테스트 등을 활용할 수 있다. 올림푸스 슬롯사이트 AI 플랫폼 담당 마이클 거스텐하버는 “이건 정상을 향한 레이스”라면서 “우리는 모두를 위한 AI 개선을 목표로, 연구소들에 안전하게 발전할 압박을 가하고 있다”고 강조했다.
새 모델들은 올림푸스 슬롯사이트이 2023년 9월 처음 공개한 책임 있는 확장 정책(Responsible Scaling Policy, RSP)’에 따라, 종전 모델보다 강화된 AI 안전수준 3(ASL-3) 프로토콜을 적용받는다.
2021년 오픈AI 출신 연구자들이 “속도와 규모보다 안전과 거버넌스를 우선해야 한다”고 창립한 올림푸스 슬롯사이트은 2024년 10월 정책을 한층 정교화한 뒤 “충분한 안전장치가 마련되지 않으면 모델을 훈련·배포하지 않는다”는 원칙을 재확인했다.
ASL-3 등급 모델에는 악용·도난 방지, 해로운 정보 유출 차단, 내부 가중치 보호 등 강화된 보안 조치가 필수이며, 무기 개발 지원이나 AI 연구 자동화 같은 중대 위험 요소를 차단할 수 있어야 한다.
올림푸스 슬롯사이트은 자체 테스트 결과 오퍼스 4가 최상위 ASL-4까지는 필요치 않다고 판단했지만차세대 모델의 빠른 진전을 감안해 선제적으로 ASL-3를 적용했다고 설명했다.
또한 올림푸스 슬롯사이트은 매 출시마다 모델의 성능과 안전 평가를 담은 모델 카드(model card)를 공개해왔으며, 두 모델의 카드도 곧 배포할 계획이다. 최근 오픈AI와 Google이 새 모델 카드 공개를 미루며 “미흡하다”는 비판을 받은 것과 비교된다.
/ Sharon Goldman, Beatrice Nolan & 편집 문상덕 기자 mosadu@fortunekorea.co.kr