오픈AI가 GPT-5를 전격 공개한 라이브 행사에서 데이터 시각화 왜곡 논란이 불거졌다. 시연 중 공개된 성능 비교 그래프가 실제 수치와 불일치하는 비율로 표시돼, AI 신뢰성 논의의 중심에 섰다.

올트먼(OpenAI CEO)은 이를 “메가 차트 스크루업(mega chart screwup)”이라 인정하며 수정본을 공개했다.

성능 수치보다 짧게 그려진 GPT-5, 비례 깨진 그래프에 관객 ‘갸우뚱’

기존 o3 모델의 69.1과 GPT-5의 74.9의 차이를 강조하기 위해 GPT-4o의 수치인 30.8과 같은 높이로 표시돼 비례가 무너진 그래프의 모습.  이미지=오픈AI 유튜브
기존 o3 모델의 69.1과 GPT-5의 74.9의 차이를 강조하기 위해 GPT-4o의 수치인 30.8과 같은 높이로 표시돼 비례가 무너진 그래프의 모습.  이미지=오픈AI 유튜브

발표 중 제시된 ‘코딩 속임수(coding deception) 비율’ 그래프는 GPT-5의 수치가 50%로 o3 모델(47.4%)보다 근소하게 높음에도 불구하고, 막대 길이가 오히려 더 짧게 표시됐다. 이후 오픈AI 측은 그래프가 아니라 수치가 잘못 기입됐으며, 16.5%라고 수정 공지했다.

하지만 또 다른 비교 차트에서는 GPT-5(69.1%), o3(52.8%), GPT-4o(30.8%) 간 점수 차이가 컸음에도 o3의 막대가 GPT-5와 비슷한 길이로 표현돼 시각적 비례가 무너졌다.

기존 o3모델의 69.1과 GPT-5의 74.9의 차이를 강조하기 위해 GPT-4o의 수치인 30.8과 같은 높이로 표시되어 비례가 무너진 그래프의 모습.  이미지=오픈AI
기존 o3모델의 69.1과 GPT-5의 74.9의 차이를 강조하기 위해 GPT-4o의 수치인 30.8과 같은 높이로 표시되어 비례가 무너진 그래프의 모습.  이미지=오픈AI

“투명성 강조하더니…” 글로벌 테크 매체·SNS, 즉각 비판

더 버지(The Verge)는 이를 “전형적인 ‘차트 범죄’ 사례”로 규정했고, 비즈니스 인사이더(Business Insider)는 “데이터 투명성을 강조하던 OpenAI의 발표에서 발생한 아이러니”라고 평가했다. SNS에서는 ‘부풀리기 그래프(Vibe Graphing)’라는 조롱 섞인 신조어까지 등장했다.

올트먼 “마감 압박이 만든 대형 실수”…수정 그래프 전면 공개

올트먼 CEO는 발표 다음 날 X(옛 트위터)를 통해 “인간적 실수와 마감 압박이 빚어낸 대형 그래프 오류”라고 사과했다. 오픈AI는 “의도치 않은 차트 범죄”였다고 해명하며, 정확한 수치를 반영한 수정 그래프를 블로그에 재게시했다.

신주백 기자  jbshin@kmjournal.net

관련기사
저작권자 © KMJ 무단전재 및 재배포 금지