전문가 시험 통과·온디바이스 구현…LG AI연구원, 글로벌 벤치마크서 최고 성능 입증

LG AI연구원이 15일, 국내 최초의 하이브리드 인공지능(AI) 모델 ‘엑사원(EXAONE) 4.0’을 공개했다. 대형언어모델(LLM)과 추론형 AI를 결합한 이 모델은 미국, 중국, 프랑스의 오픈 웨이트 모델을 능가하는 벤치마크 성능을 기록하며 세계적 수준의 기술력을 입증했다.

이미지=LG AI연구원
이미지=LG AI연구원

LLM과 추론형 AI가 결합한 하이브리드 AI '엑사원 4.0'

‘엑사원 4.0’은 자연어 이해와 생성 능력을 갖춘 LLM과 스스로 가설을 세우고 이를 검증하는 문제 해결형 AI를 통합한 하이브리드 구조다. 이러한 구성은 단순 정보 회신을 넘어서 복합 추론과 논리적 사고, 전문성 기반 답변까지 가능케 한다.

LG AI연구원에 따르면, 현재 하이브리드 AI를 공개한 곳은 미국 앤트로픽의 ‘클로드(Claude)’, 중국 알리바바의 ‘큐원(Qwen)’ 정도이며, 오픈AI의 GPT-5도 해당 구조로 개발 중이다. ‘엑사원 4.0’은 이들과 어깨를 나란히 하며 글로벌 기술 트렌드 선도에 본격적으로 진입한 셈이다.

세계 최고 수준의 벤치마크 결과

엑사원 4.0은 주요 AI 성능 평가 지표에서 글로벌 오픈 웨이트 모델을 압도했다. 세부 벤치마크는 다음과 같다.

EXAONE 4.0의 1.2B 온디바이스 모델은 비교 대상인 Qwen, Gemma, SmoLM3 등과 견주어 매우 높은 성능을 기록했습니다. 특히 소형 모델(1~3B) 중 글로벌 최상위 수준임이 수치로 입증되었다. 특히, MMLU-Pro, KMMLU-Pro 등 다국어 및 한국어 지식 테스트에서 동급 대비 높은 성능을 보였다.  수학, 과학, 코딩 모든 부문에서 SOTA 달성. 일부 벤치마크에서 GPT-4o Mini보다 높은 성능을 보였으며, 사용자 지시 수행 및 장문 맥락 유지 능력에서 대다수 모델 압도했다. 이미지=LG AI연구원
EXAONE 4.0의 1.2B 온디바이스 모델은 비교 대상인 Qwen, Gemma, SmoLM3 등과 견주어 매우 높은 성능을 기록했습니다. 특히 소형 모델(1~3B) 중 글로벌 최상위 수준임이 수치로 입증되었다. 특히, MMLU-Pro, KMMLU-Pro 등 다국어 및 한국어 지식 테스트에서 동급 대비 높은 성능을 보였다.  수학, 과학, 코딩 모든 부문에서 SOTA 달성. 일부 벤치마크에서 GPT-4o Mini보다 높은 성능을 보였으며, 사용자 지시 수행 및 장문 맥락 유지 능력에서 대다수 모델 압도했다. 이미지=LG AI연구원
EXAONE 4.0 32B 모델은 기존의 글로벌 프론티어급 오픈 웨이트 모델을 상회하는 범용성과 전문성 모두에 강한 고성능 모델이다. 이미지=LG AI연구원
EXAONE 4.0 32B 모델은 기존의 글로벌 프론티어급 오픈 웨이트 모델을 상회하는 범용성과 전문성 모두에 강한 고성능 모델이다. 이미지=LG AI연구원

이러한 수치는 미국 오픈AI, 프랑스 미스트랄, 중국 알리바바 등 대표 LLM 대비 우수한 결과로, 엑사원이 글로벌 최상위 오픈 웨이트 모델과의 비교에서 경쟁력을 입증했다.

전문가 모델, 6대 국가 전문자격시험 필기 통과

엑사원 4.0의 32B 전문가 모델은 실제 국내 국가 공인 자격시험 필기 문제를 풀 수 있는 수준의 성능을 갖췄다. 통과한 시험은 의사, 치과의사, 한약사, 관세사, 감정평가사, 손해사정사 등 총 6종. 이는 단순 정보 회신을 넘어, 도메인 전문성까지 AI가 구현 가능함을 보여주는 지표다.

온디바이스 모델, 작지만 강한 ‘1.2B’

엑사원 4.0의 또 다른 축은 온디바이스 모델(1.2B)이다. 기존 엑사원 3.5(2.4B)보다 모델 크기를 절반으로 줄였지만, 오픈AI의 GPT-4o Mini보다 높은 성능을 기록했다. 이는 전장, 스마트폰, 가전 등 다양한 디바이스에 직접 탑재 가능한 실용성과 보안성을 갖춘 모델로, 온디바이스 AI 시장 확대 전략과도 맞닿는다.

개방과 생태계 확장, API·허깅페이스 공개

LG AI연구원은 엑사원 4.0을 글로벌 오픈소스 플랫폼 허깅 페이스(Hugging Face)에 오픈 웨이트 모델로 공개했다. 오픈 웨이트 모델은 학습데이터는 비공개지만, AI 가중치를 통해 성능 재현 및 수정이 가능하다.

또한, 프렌들리AI와 협력해 API 서비스도 상용화했다. 개발자는 고성능 GPU 없이도 엑사원을 활용할 수 있으며, 이는 연구·교육·서비스 개발 전반의 진입 장벽을 낮추는 조치다.

하이브리드 AI 시장에서의 존재감 확보

불과 4개월 전 ‘엑사원 딥(EXAONE Deep)’으로 국내 첫 추론 AI 모델을 선보인 데 이어, 하이브리드 AI까지 공개한 LG AI연구원의 행보는 연속적이고 전략적인 기술 진화로 평가된다. 전문성과 실용성을 아우르는 엑사원 4.0은 향후 글로벌 AI 플랫폼 경쟁에서 한국 기술의 존재감을 각인시킬 수 있는 대표 사례가 될 것으로 기대된다.

신주백 기자  jbshin@kmjournal.net

관련기사
저작권자 © KMJ 무단전재 및 재배포 금지