KT가 한국어와 한국 문화에 특화된 인공지능(AI) 모델 라인업을 올해 안에 추가로 출시할 예정이다.
25일 KT에 따르면 회사는 최근 독자 모델, 협력 모델, 오픈소스 기반 모델, 특화 모델 등 네 가지 카테고리로 구성된 AI 모델 구상을 홈페이지에 밝혔다. 이는 지난 7월 독자 기술로 개발해 선보인 '믿:음 2.0'에 이어 본격적으로 한국어 특화 AI 생태계를 확장하려는 시도다.
KT는 올해 3분기 안에 'GPT K'(가칭)을 선보일 계획이다. 마이크로소프트(MS)와 협력해 개발 중인 이 모델은 오픈AI의 GPT-4o에 KT 자체 데이터를 학습해 한국어와 한국의 역사·문화·정서에 특화된 모델이다.
글로벌 최고 수준의 GPT-4o 성능을 유지하면서 한국어 성능을 전반적으로 개선한 것이 특징으로 KT는 자체 확보한 데이터를 활용해 학습하고 미세조정 등을 거쳐 한국 고유 지식을 정교화했다.
전문기관과 산학연구기관과 함께 개발한 한국 특화 성능 벤치마크를 적용해 한국적 AI 적합도를 향상했다고 설명했다고 KT는 설명했다.
산업별 요구에 유연하게 대응할 수 있는 오픈소스 기반 모델인 'Llama K'도 올해 3분기 출시할 계획이다. 이는 메타의 'Llama 3.x'를 기반으로 하지만 원본 모델이 충분히 지원하지 못하는 한국어 기능을 KT의 데이터와 학습 노하우로 보강한 버전이다.
Llama K는 비용 효율성을 유지하면서도 한국어 처리 능력을 크게 높인 것이 강점이다. 특히 높임법, 종결어미 등 한국어 고유 표현과 공공분야에서 요구되는 포맷 이행 능력을 강화했다.
Llama K는 파라미터 규모에 따라 11B와 74B 모델 두 종류로 제공된다. 각각 일반적인 성능의 기본 모델과 검색증강생성(RAG) 등 엔터프라이즈급 성능 요구에 적합한 고성능 모델이다.
KT는 법률, 금융, 교육, 의료 등 특정 전문 분야에 맞춰 학습된 AI 모델도 추후 출시할 예정이다.
권상민 기자 smkwon@kmjournal.net