오픈AI가 19일(현지시간) 코딩 특화 모델 ‘GPT-5.1 코덱스 맥스(GPT-5.1 Codex Max)’를 출시하며, 구글 제미나이 3를 넘어서는 코딩 성능과 장기 문맥 처리 능력을 앞세워 AI 개발자 시장의 주도권을 다시 잡겠다는 전략을 분명히 했다.

이미지=오픈AI

■ 코딩을 넘어 ‘지속형 개발 에이전트’로 진화… 장기 문맥 AI의 새로운 기준 제시

오픈AI는 GPT-5.1 코덱스 맥스를 “단순 코드 생성기가 아니라 소프트웨어 엔지니어링 전체를 수행하는 지속형 개발 에이전트”라고 규정했다. 모델은 프로젝트 리팩터링, 자율 디버깅, 멀티 컨텍스트 기반의 대형 프로젝트 관리까지 전 과정을 스스로 수행할 수 있도록 설계됐다.

핵심은 ‘컴팩션(compaction)’이라는 장기 문맥 처리 기술이다. 이 기술은 작업 중 중요한 문맥만 압축·보존해 사실상 수백만 토큰 규모의 연속 개발 작업을 처리할 수 있게 한다. 오픈AI는 중간 추론 단계에서 기존 대비 약 30% 적은 토큰 사용이 가능해져 비용과 지연시간 모두 효율화됐다고 설명했다.

비영리 연구 기관 METR은 GPT-5.1 코덱스 맥스의 평균 작업 지속 시간이 2시간 42분에 달한다고 발표했다. 이는 GPT-5보다 25분 증가한 수치이며, 오픈AI 내부 테스트에서는 24시간 이상 끊김 없이 작동한 사례도 확인됐다. 장시간 연속 개발이 필요한 실제 개발 환경에서 의미 있는 변화다.

■ 제미나이 3와의 정면 충돌… “핵심 코딩 벤치마크 전반에서 우리가 우세”

오픈AI는 모델 공개와 함께 제미나이 3 프로와의 비교 데이터를 투명하게 공개하며 자신감을 드러냈다.

구분 GPT-5.1 Codex Max Gemini 3 Pro
SWE-Bench Verified(고난도 코드 추론) 77.9% 76.2%
Terminal-Bench 2.0(터미널 기반 문제 해결) 58.1% 54.2%
LiveCodeBench Pro(실시간 코딩) 2439점 2439점

비교 결과를 종합하면, GPT-5.1 코덱스 맥스는 초고난도 코드 추론과 터미널 환경 문제 해결 능력에서 구글보다 우세하며, 실시간 코딩 능력에서는 동등하거나 일부 지표에서 앞서는 모습을 보였다.

오픈AI는 “엔지니어링 실전 환경에서 가장 중요한 영역에서 최상의 결과를 냈다”고 강조했다.

■ 기존 GPT-5.1 코덱스 대비 성능 ‘점프’… 실사용 개발자 환경까지 개선

기존 모델 대비 성능 향상 폭도 크다. 오픈AI는 여러 실전 중심 벤치마크에서 점수 상승이 일제히 확인됐다고 밝혔다.

▲SWE-Lancer IC SWE: 66.3% → 79.9%

▲SWE-Bench Verified: 73.7% → 77.9%

▲Terminal-Bench 2.0: 52.8% → 58.1%

특히 리팩터링과 테스트 자동화 성능이 크게 증가하며, “테스트 실패를 스스로 수정하고 구현을 반복해 최적의 결과를 도출하는” 지속형 개발 패턴이 더욱 안정화됐다는 평가가 나온다. 이는 단순 코딩 보조 수준에서 벗어나, 실제 개발자의 업무 루틴을 대체하는 단계로 코딩 AI가 진화하고 있음을 의미한다.

■ CLI·IDE·클라우드까지 전방위 지원… API 공개 후 기업 환경 확산 예상

GPT-5.1 코덱스 맥스는 출시 직후부터 CLI, IDE 확장, 클라우드 개발 환경, 코드 리뷰 자동화 등 다양한 개발 도구에서 사용할 수 있다. API 접근성 역시 곧 제공될 예정으로, 기업 개발팀의 대규모 프로젝트 적용도 빠르게 확산될 것으로 전망된다.

오픈AI는 “GPT-5.1 코덱스 맥스는 장기 개발 작업에서 끊김 없이 동작하는 최초의 범용 엔지니어링 모델”이라며 “실제 제품 개발 주기를 단축시키는 방향으로 AI 개발 패러다임이 이동하고 있다”고 강조했다.

■ AI 코딩 패권 경쟁의 본격화… “2025년 개발자 시장, 새로운 변곡점 도래”

구글이 제미나이 3 프로를 발표한 직후, 오픈AI가 곧바로 GPT-5.1 코덱스 맥스로 응수한 것은 AI 개발 시장의 패권 경쟁이 다시 격화되고 있음을 보여주는 지표다.

언어·멀티모달 중심의 경쟁에서 벗어나, 2025년의 경쟁은 “엔지니어링 실무를 얼마나 완전하게 대체할 수 있느냐”로 초점이 이동하고 있다.

신주백 기자  jbshin@kmjournal.net

관련기사
저작권자 © KMJ 무단전재 및 재배포 금지