‘삼각형 바퀴 자전거’ '고래 포스터' 등 복잡한 요청도 소화

새로운 AI모델이 생성한 이미지 '삼각형 바퀴 자전거' (사진=오픈AI)
새로운 AI모델이 생성한 이미지 '삼각형 바퀴 자전거' (사진=오픈AI)

오픈AI는 25일(현지시간), 자사의 멀티모달 AI 모델인 GPT-4o에 이미지 생성 기능을 도입했다고 밝혔다.

GPT-4o 이미지 생성은 텍스트와 이미지를 함께 처리하는 기능으로, 기존 이미지 생성 모델보다 사용자의 의도를 더 정확히 반영하는 것이 특징이다.

오픈AI에 따르면, 새 이미지 생성 AI 모델은 사용자가 복잡한 프롬프트 없이도 자연어만으로 이미지를 만들 수 있으며 단순한 묘사부터 복잡한 요청까지 폭넓게 대응할 수 있다.

예를 들어 ‘여러 종류의 고래를 보여주는 포스터’를 요청하면, 고래의 종류와 이름이 일치한 이미지가 생성된다. 또한 ‘삼각형 바퀴를 가진 자전거’처럼 기존 AI가 어려워하던 상상 기반 요청에도 대응할 수 있다.

텍스트 삽입 기능도 개선돼 메뉴판, 과학 실험, 수학 공식, 만화 등 다양한 용도의 복합 이미지 생성이 가능하다. 투명 배경 이미지도 지원한다.

오픈AI는 이번 모델이 기존 ‘달리(DALL-E)’ 이미지 생성기와는 기술적으로 다른 기반을 사용하고 여러 기능이 개선됐다고 밝혔다.

GPT-4o 이미지 생성 기능은 현재 ChatGPT에서 사용할 수 있으며 무료 및 유료 사용자 모두에게 제공된다.

고한빛 기자 bitta@kmjournal.net

저작권자 © KMJ 무단전재 및 재배포 금지