GPT-5로 ‘챗봇’을 넘어 ‘실전 AI’ 에이전트의 시대로
서울 시간 8월 8일 새벽, 푸시가 떴다. “GPT-5 공개.”
알림 하나로 타임라인이 요동했다. 오픈AI는 말했다. “이젠 모델을 고를 필요가 없다.” 하나의 GPT-5가 질문 난이도를 스스로 판단해, 쉬운 건 바로 답하고, 어려운 건 ‘생각(thinking)’ 시간을 늘려 답한다. 지난 3년의 방향 전환이 이 한 문장에 응축돼 있다.
“인류 전체의 이익”이라는 목표, 그리고 현실 감각
2015년, 오픈AI는 “AI를 인류 전체의 이익을 위해” 쓰겠다고 선언했다. 하지만 초거대 모델 시대엔 이상만으론 못 움직인다.
2019년 ‘캡드 프로핏(capped-profit)’ 구조의 OpenAI LP를 만들며, 비영리의 통제 아래 수익을 제한한 채 자본을 끌어오는 방식으로 방향을 잡았다. 그 선택이 오늘의 규모를 가능하게 했다.
GPT 연대기의 ‘결정적 장면’
GPT-3: “AI가 글을 쓴다”는 인식을 대중어로 만든 순간.
GPT-4: 텍스트를 넘어 이미지까지 이해하는 멀티모달 전환. 지브리풍 이미지 화제로 대중화 계기.
GPT-4o: 실시간 음성·영상 인터랙션으로 ‘대화의 감각’을 살렸다.
GPT-5: 단일 모델 경험으로 정리. 라우터+추론을 내장해, 질문 난이도·도구 필요 여부에 따라 내부적으로 생각의 길이를 조절한다. 무료 이용도 가능하되, 한도를 넘기면 ‘미니’ 자동 전환되는 식이다.
2025년 8월 챗GPT는 ‘주간 활성 사용자(WAU)’가 7억 명에 근접, 소비자 접점에서 사실상 세계 최대 AI 서비스가 됐다.
소비자 규모는 오픈AI, 기업 점유율은 각축
소비자 단에서는 오픈AI가 압도적이지만, 엔터프라이즈 LLM 사용 점유율에선 판이 다르다.
2025년 중반 Menlo Ventures에 따르면 앤트로픽 32%, 오픈AI 25%, 구글 20%. ‘누가 1위인가’는 소비자 규모 vs. 기업 도입이라는 서로 다른 축에서 각기 답이 갈린다.
GPT-5, “말 잘하는 모델”에서 “문제를 푸는 동료”로 변신 중
오픈AI가 GPT-5로 밀어붙이는 메시지는 단순하다.
문제의 난이도를 스스로 파악하고, 필요한 만큼만 생각한다. 모델 고르는 번거로움은 라우터가 가져간다. 여기에 환각(사실 오류)을 줄이고, 모호하면 모른다고 하는 AI를 목표로 한다.
라우팅 내장: 쉬운 질의는 빠르게, 복잡한 과제는 내부적으로 “생각” 단계를 늘려 깊게 푼다. 우리는 모델을 고르지 않는다. 질문만 던진다.
접근성: 무료 이용자도 기본 접근이 가능하지만, 사용 한도를 넘기면 ‘미니’ 버전으로 자동 전환된다.
안전성: 오픈AI가 강조한 건 ‘세이프 컴플리션’이다. 쉽게 말하면 모호할 땐 모른다고 말하고, 위험하면 답을 멈추는 방향으로 훈련했다. 덜 그럴듯하더라도 더 성실한 답변을 지향한다는 뜻이다.
벤치마크로 보는 챗GPT
오픈AI는 GPT-5의 성능 수치를 여럿 내놨다. 하지만 벤치마크는 ‘현실 업무의 완벽한 대리인’이 아니라, 특정 능력을 겨냥한 시험이라는 점부터 짚자.
SWE-bench Verified
깃허브의 실제 이슈를 코드 수정으로 해결해, 테스트를 실제로 통과시키는가를 보는 지표로 '말 잘하는 모델'이 아니라 코드를 ‘고치는’ 능력이 어느 정도인지 보는 지표다.
GPT-5는 74.9%를 기록했다.
Aider Polyglot(멀티언어 코드 편집)
다양한 언어의 기존 코드에 정확히 패치할 수 있는가를 본다. 현실에서 개발은 ‘제로부터 생성’보다 기존 코드 유지·보수가 더 많기 때문이다.
GPT-5는 ‘생각 모드’에서 약 88%를 기록했다.
AIME 2025(수학)
올림피아드 유형의 문제에서 정확한 해법을 내놓는가를 보는 것으로 수학의 정답을 찾는 것을 물론이고, 논리 전개를 어떻게 하는지 확인할 수 있다.
GPT-5는 94.6%를 기록했다.
HealthBench(의료)
의료·건강 문맥에서 정확한 정보 선택과 판단을 보는 것이다. 하지만 수치가 높아도 현실에서는 책임이 따르기 때문에 전문가 검증이 추가로 필요하다.
GPT-5는 이전 모델 대비 개선되었지만 의료 현장 투입은 별도 검증이 필요하다.
모델이 아니라 “문제를 어떻게 풀게 하느냐”의 경쟁
오픈AI의 핵심은 처음부터 지금까지 “사람에게 실제로 도움이 되는 AI”였다.
그 믿음은 비영리의 통제와 자본의 현실을 묶은 독특한 구조에서 출발해, 사용자가 모델이 아닌 ‘문제’에 집중하도록 만드는 GPT-5로 이어졌다.
세계 최대 규모의 사용자 기반 위에서, 오픈AI는 속도와 안전 사이의 줄타기를 계속할 것이다. 그리고 다음 승부는 여기서 갈린다.
“GPT-5 이후의 싸움은 모델이 아니라 ‘문제를 어떻게 풀게 하느냐’에 달려 있다.”
신주백 기자 jbshin@kmjournal.net