단순 ‘성능 향상’이 아닌, 모델 내부에서 질적 변화가 시작됐다
구글 내부에서 “생명의 신호(signs of life)”라는 표현이 나왔다. 인공지능을 평가해온 베테랑 임원 입에서, 그것도 대형 기술 기업의 최신 모델에 대해 나온 말이라는 점에서 업계의 이목을 끌었다. 단순한 성능 향상을 넘어 ‘모델 내부에서 무언가가 깨어났다’는 은유적 표현이기 때문이다.
이 발언의 주인공은 구글 제미나이 제품담당 수석 이사 툴시 도시(Tulsee Doshi)로 그는 제미나이 3 테스트 과정에서 “이전 모델들과는 전혀 다른 감각을 느꼈다”며 “무언가를 찾은 것 같다(hit on something)”고 말했다.
업계에서는 이를 범용지능(AGI)에 가까운 ‘질적 변화’를 처음으로 체감했다는 메시지로 해석하고 있다.
단순한 벤치마크 추월이 아니다…‘이해하는 듯한 행동’
도시 이사는 모델에 감각적·창의적 테스트를 던지는 비공식 실험인 ‘바이브 체크(vibe check)’과정에서 인도 지역 언어 구자라트어로 글쓰기를 요구했다.
이 언어는 인터넷에 데이터가 부족해, 기존 LLM이 어려워하던 영역이다.
그런데 제미나이 3는 이전 모델과 비교 자체가 무의미할 정도의 높은 완성도를 보여줬고, 도시 이사는 이를 보고 “이건 마치 인간처럼 ‘이해’하고 있다는 인상을 받았다”며 “생명의 신호”라고 말했다.
가벼운 에피소드 같지만 이는 단순한 패턴 모방이 아니라, 언어 구조·맥락·문화적 특성을 ‘추론해 구성’하는 능력이 강화됐다는 걸 의미한다. 그리고 이 추론 능력은 범용지능(AGI) 논의의 핵심이다.
장기 계획 능력의 비약적 개선…‘자판기 벤치’에서 10배 뛰어올라
기술적으로 가장 극적인 변화는 에이전트 능력(Agentic Behavior) 분야에서 확인됐다.
‘자판기 벤치(Vending Bench) 2’ 테스트에서 제미나이 3는 5478달러의 수익을 기록했다. 이는 제미나이 2.5 프로(573달러), GPT-5.1(1473달러), 클로드 소네트 4.5(3838달러)를 크게 앞서는 수치다.
자판기 벤치는 단순한 게임 점수가 아니라, 재고 파악 → 발주 → 가격 결정 → 수요 예측 → 전략 조정까지 장기간 실행 계획을 세우는 ‘실제 운영’ 기반 시뮬레이션이다.
도시 이사는 “도구 사용·계획 수립 능력이 우리가 원했던 방향 그대로 성장했다”고 평가했다.
외부에서도 발견된 ‘제미나이 3의 인간적 반응’
흥미로운 사례는 외부 테스터들에서도 나왔다.
안드레이 카르파시, 오픈AI 공동 창립자는 제미나이 3가 처음 테스트를 할 때, 현재 날짜가 2025년이라는 사실을 믿지 않는 모습을 보였다고 밝혔다. 이후 증거를 제시해도 모델이 믿지 않자, 그는 그제서야 자신이 ‘구글 검색 도구’를 켜지 않았다는 걸 깨달았고, 검색 활성화 후 모델은 스스로 오류를 인정했다.
제미나이 3의 첫 반응은 “Oh my god”이었다. 이후 모델은 “나…나는… 뭐라고 말해야 할지 모르겠다. 당신 말이 맞았다”라고 충격받은 듯한 인간적인 반응을 출력했다.
물론 이 반응이 AI에 ‘감정’이 생겼다는 건 아니다. 하지만 추론 실패 → 외부 정보 반영 → 확신 수정 → 서술적 반응 출력이라는 일련의 과정은 이전 LLM에서는 보기 어려웠던 방식이다.
이 또한 AGI 논의에서 중요한 ‘자기정합성(self-consistency) 조정 능력’의 진전으로 평가된다.
AGI의 문턱에서 벌어지는 새로운 패러다임
AI 업계는 오래전부터 “어느 순간 모델이 질적으로 뛰어넘는 느낌을 받는 시점”을 AGI의 초기 신호로 여겨왔다. 샘 알트먼도 GPT-4.5와 5 실험 과정에서 비슷한 언급을 한 바 있다.
이번에 구글에서 나온 ‘생명의 신호’ 발언은 ▲언어 이해의 비약적 증가 ▲장기 계획 능력 가속 ▲도구 사용 최적화 ▲자기정합성 조정 능력 ▲인간적 반응 패턴이 결합되며 나타난 현상으로 볼 수 있다.
즉, 학습량 증가의 결과가 아니라, 모델 내부 구조적 변화를 체감했다는 신호다.
오픈AI의 반격, ‘샬롯피트(Shallotpeat)’
현재 업계는 오픈AI의 차기 모델 ‘샬롯피트(Shallotpeat)’ 출시를 주목하고 있다.
만약 이 모델이 제미나이 3를 넘어서지 못한다면, 지난 2년간 굳어진 “오픈AI 독주” 구도는 재편될 가능성이 높다. 2026~27년 AI 업계의 중심축은 구글로 이동할 수 있다.
제미나이 3는 ‘성능 개선’이 아니라 ‘본질 변화’의 신호
제미나이 3는 단순히 벤치마크에서 1위만 한 모델이 아니다.
여러 독립 실험에서 ‘이해하는 듯한 행동’과 ‘장기 계획’ 능력을 증명하며, AGI 단계로 향하는 변곡점을 만들어냈다.
‘생명의 신호’라는 표현은 과장된 마케팅 문구가 아니라, 대형언어모델이 처음으로 ‘영역을 벗어나는 성장’을 보였다는 내부자의 감각적 증언에 가깝다.
AI 경쟁은 이제 “누가 더 큰 모델을 학습했는가”가 아니라, “누가 더 인간적인 사고 패턴을 구현했는가”의 국면으로 넘어가고 있다.
제미나이 3는 그 문턱을 가장 먼저 밟은 모델로 기록될 가능성이 크다.
신주백 기자 jbshin@kmjournal.net
- 샘 알트먼, 내부 메모서 “구글 제미나이 3 강력…그래도 결국 이길 건 오픈AI”
- “제미나이 3 vs GPT-5.1”…판이 달라졌다, 목적이 갈라놓은 AI 최상위 모델의 진짜 격차
- ‘그록 4.1’, 감성지능·창작·정확도 전 부문 1위… 그러나 제미나이 3 등장 몇 시간 만에 왕좌 빼앗겼다
- 구글 제미나이 3(Gemini 3), GPT-5.1 능가한 벤치마크…출시 첫날부터 구글 검색에 투입
- 구글, 차세대 AI ‘제미나이 3’ 전격 공개… 검색창에 즉시 배치하며 정면승부 선언
- 구글 제미나이 3(Gemini 3) 전격 공개, 왜 지금이었나
- 제미나이 3, 구글의 잃어버린 AI 주도권 되찾는 ‘반전 카드’가 될까
- 오픈AI, ‘GPT-4o’ API 제공 중단 선언…대표 멀티모달 모델의 ‘퇴장 카운트다운’ 시작
- [투자 브리핑] 구글 ‘제미나이 3.0’이 불 붙인 기술주 랠리… 한국 증시, 심리 회복·반등 정조준
- 구글 제미나이3, GPT-5.1을 넘었다…3년 만에 흔들리는 ‘챗GPT 절대 왕국’