AI 검색 특화 스타트업 라이너(LINER)가 자체 개발한 검색 특화 LLM이 OpenAI의 GPT-4.1 대비 전반적인 성능 우위를 입증했다고 3일 밝혔다.

라이너 검색 LLM 평가 결과.  사진=라이너 제공
라이너 검색 LLM 평가 결과.  사진=라이너 제공

8대 핵심 컴포넌트 평가서 GPT-4.1 압도

라이너는 검색 질문 처리에 필요한 8가지 핵심 컴포넌트를 기준으로 자사 모델과 GPT-4.1을 비교 평가했다. 평가는 정확도(accuracy), 처리 속도(latency), 토큰당 비용(token cost) 세 항목을 중심으로, 실제 서비스 환경에서의 재현성과 신뢰성 확보를 강조한 체계적 내부 검증 방식으로 수행됐다.

결과적으로 라이너 LLM은 8개 중 4개 핵심 컴포넌트에서 성능, 속도, 비용 모든 면에서 GPT-4.1을 상회했으며, 나머지 4개 컴포넌트에서도 최소 2개 항목 이상에서 경쟁 우위를 확보했다고 밝혔다.

비용 효율성과 정확도 강조…검색 특화 구조가 관건

라이너 LLM의 강점은 기존 오픈 소스 모델 기반 위에, 10년 이상 축적된 사용자 행동 데이터를 사후 학습(fine-tuning)해 검색 중심 구조로 최적화한 데 있다. 이 과정은 단순 응답 생성이 아닌, 검색 문서 탐색, 질문 분해, 출처 포함 응답 생성 등 실제 검색 환경에 필수적인 기능을 중심으로 이루어졌다.

특히 토큰당 비용이 GPT-4.1 대비 평균 30~50% 낮다는 점은, 대규모 사용자 트래픽이 발생하는 AI 서비스에서 상당한 비용 절감 및 수익성 확보 요소로 작용할 수 있다.

"정확한 리서치 응답 위한 구조 설계"

라이너 테크 리드 조현석 씨는 “단순 모델 성능이 아닌, 어떤 데이터를 학습하고 어떤 구조로 질문을 처리하느냐가 AI 답변 정확도에 결정적”이라며, “라이너는 검색과 리서치 환경에 최적화된 정확한 응답 경험을 제공하며 글로벌 AI 검색 시장을 선도해 나갈 것”이라고 밝혔다.

다만 이번 평가가 자체 검증에 기반한 만큼, 제3자 기관 또는 벤치마크 대회의 검증 결과가 병행되어야 업계 전반의 신뢰를 확보할 수 있을 것으로 보인다.

신주백 기자  jbshin@kmjournal.net

관련기사
저작권자 © KMJ 무단전재 및 재배포 금지