싱킹 모드 주당 200회 제한 배경과 전략
오픈AI가 GPT-5를 중심으로 모델 라인업을 전격 통합했다.
다양한 버전이 난립하던 ‘모델 스프롤’을 정리하고, 일반·미니·프로·싱킹(추론) 모드를 자동 라우팅 방식으로 GPT-5 안에 묶었다. 특히 고비용 모드인 ‘싱킹’에는 주당 200회 사용 제한을 두며 운영 효율을 높였다.
매출은 빠르게 늘고 있지만, 데이터센터 확장과 전력·칩 비용이 급등하는 상황에서 이번 변화는 단순한 브랜딩 조정이 아니라 비용과 성능 사이의 균형을 찾기 위한 전략적 선택으로 해석된다.
모델 선택창 사라지고 ‘자동 스위칭’ 도입
오픈AI는 GPT-5를 기본 모델로 두고 모든 하위 모델을 통합 운영하기 시작했다.
기존에는 GPT-4, 4.5, 4o, o 시리즈, 미니 버전까지 여러 모델을 직접 고를 수 있었지만, 이제는 일반·미니·프로·싱킹 네 가지 모드로만 자동 라우팅된다. 싱킹과 프로 모드는 일정 횟수만 선택 가능하다.
초기에는 이용자 반발과 혼선이 커서 구형 모델 선택 옵션을 잠시 복구했지만, 오픈AI의 방향은 뚜렷하다. “하나의 시스템에서 자동으로 최적 모델로 연결”하는 것이 기본 전략이다.
공식 문서에도 GPT-4.1, 4.5, 4o, o3, o4-mini 등은 순차적으로 단종되며, 기존 대화 내용은 성능이 비슷한 GPT-5 계열로 자동 승계된다고 명시돼 있다.
‘싱킹 모드’ 주당 200회 제한… 왜?
싱킹(Thinking) 모드는 복잡한 문제를 풀 때 AI가 더 길고 깊게 추론하는 방식이다.
정확도는 높지만, 처리에 필요한 토큰·시간·전력이 크게 늘어난다. 최근 연구에서도 “문제 난이도에 맞춰 생각의 길이를 조절해야 효율적”이라는 결론이 나왔다.
오픈AI가 싱킹 모드에 주당 200회 제한을 둔 것은, 고비용 모드의 남용을 막고 전체 이용자에게 자원을 공정하게 배분하기 위해서다.
자동 라우팅으로 GPT-5가 알아서 싱킹 모드로 전환되는 경우는 이 제한에 포함되지 않는다.
돈 버는 속도보다 빠른 비용 증가
겉으로 보면 오픈AI는 빠르게 성장하고 있다. 2025년 연환산 매출은 약 120억 달러(약 15조6천억 원)에 이를 전망이다.
하지만 같은 해 현금 소진 규모가 약 80억 달러(약 10조4천억 원)에 달할 것으로 예상된다는 보도가 나왔다.
쉽게 말해, 버는 돈보다 쓰는 돈이 더 많다는 얘기다.
데이터센터 확장… 4.5GW 계약과 ‘스타게이트 프로젝트’
오픈AI는 오라클과 연간 300억 달러(약 39조 원) 규모의 클라우드·데이터센터 계약을 체결했다. 여기에 포함된 신규 설비 규모만 4.5GW다. 텍사스 애빌린에 건설 중인 초대형 데이터센터 단지 ‘스타게이트 프로젝트’까지 포함하면 총 5GW 이상의 전력 용량과 2백만 개 이상의 AI 전용 칩이 투입된다.
‘스타게이트 프로젝트’는 오픈AI와 마이크로소프트, 오라클이 협력해 추진하는 차세대 AI 데이터센터 허브로, 완공 시 세계 최대 규모 중 하나가 될 전망이다. 그러나 전력과 입지, 정책 리스크가 크다. 텍사스는 2021년 대정전 이후 전력 위기 시 데이터센터 전원을 강제로 차단할 수 있는 법을 도입했고, 관세·정책 변수로 인해 공정 속도가 예상보다 더디다는 보도도 있다.
모델 통합 = UX 단순화 + 운영비 절감
모델 난립은 이용자에게 선택 피로를 주고, 서버 운영 측면에서도 비효율을 만든다.
모델을 단일화하면 UX가 단순해질 뿐 아니라 서버 스택·캐시·스케줄러를 하나로 통합해 GPU 활용률을 높이고 운영비를 줄일 수 있다.
오픈AI는 모델 선택창 제거와 자동 라우팅으로 전환했지만, 초기에 품질 편차와 라우터 오류가 발생했다. 구형 모델 선택 기능을 잠시 복원했고, 대규모 롤아웃 하루 만에 API 트래픽이 두 배로 급증하면서 플랫폼이 흔들리기도 했다.
경쟁사도 같은 길로
앤트로픽(Anthropic), 구글, xAI 등 주요 경쟁사들도 하나의 모델 안에서 필요할 때만 깊게 추론하는 방향으로 전환하고 있다.
오픈AI의 통합 전략은 제품 복잡도를 줄이고 인프라 비용을 관리하는 ‘두 마리 토끼’를 잡으려는 현실적 해법이다.
GPT-5, 브랜딩이 아닌 운영 체질 개선
GPT-5 통합은 단순한 모델명 변경이 아니다. 사용 편의성을 높이는 자동화 UX, 고비용 모드 관리 정책, 초대형 인프라 확장 전략이 동시에 작동하는 전사적 변화다.
단기적으로는 라우팅 품질과 사용자 신뢰 회복이, 중장기적으로는 전력·칩·설비 투자라는 삼중 부담 속에서 단위 경제성을 개선하는 것이 관건이다.
오픈AI가 언제 깊게 생각하고, 언제 빠르게 답할지를 스스로 최적화할 수 있을지가 ‘원팀 전략’의 성패를 가를 것이다.
신주백 기자 jbshin@kmjournal.net
- GPT-5 출시, AI 결정판 나왔다
- 샘 올트먼 “GPT-5, 속도·지능 모두 폭발적… 나조차 두렵다”
- “말투만 문제 아니다” GPT-5 성능 논란…오픈AI, Plus 한정 GPT-4o 옵션 부활
- 오픈AI GPT-5 발표, ‘차트 범죄’ 논란…샘 올트먼 “메가 차트 스크루업” 인정
- ‘코딩이 승부처’…오픈AI GPT-5, B2B 시장 1위 탈환 시동
- GPT-5, 환각 현상 여전해...이미지·자기 인식 오류
- 오픈AI, 최신 AI 모델 'GPT-5' 공개…"박사급 수준"
- [테크 칼럼] AI 챗봇의 과잉 공감, 정신 건강에 해로울 수 있다?
- 샘 올트먼 “AI 버블 현실화 우려… 닷컴 붕괴 전철 밟을 수도”
- 오픈AI, 월 매출 10억 달러 첫 돌파
- 구글, 제미나이 프롬프트당 에너지 사용량 첫 공개