자연어처리 학회 EMNLP서 논문 채택
소형언어모델(sLLM) 효율·품질 동시 향상

EMNLP(Empirical Methods in Natural Language Processing)는 ACL(Association for Computational Linguistics, 국제언어학회) 산하에서 주관하는 세계 3대 자연어처리 학회 중 하나로, 글로벌 빅테크 기업과 주요 연구기관의 최신 AI 연구 성과를 심사·평가한다.
LG유플러스가 제출한 논문은 '익시젠: 도메인 특화 학습을 통한 산업 특화 소형 언어모델 고도화'로, 소형 언어모델(sLLM)의 효율과 품질을 동시에 높이는 새로운 접근법, 산업 데이터를 지속적으로 학습하면서 범용 언어 능력을 유지할 수 있는 '도메인 특화 학습(DACP)' 기법을 활용했다.
기존 sLLM 모델은 특정 산업 환경에 맞춰 학습할 경우 일반 언어에 대한 이해력이 떨어지고, 반대로 범용 성능을 유지할 경우 산업 적합도가 낮아지는 한계가 있다.
LG유플러스는 DACP를 통해 산업 데이터와 일반 데이터를 고르게 학습하는 방법을 고안했다. 기술 적용 결과 통신·금융 분야에서 기존 모델 대비 성능이 크게 향상됐고, 초거대 AI 모델이 아니더라도 소형 모델로 실제 산업 환경에서 즉시 활용 가능한 품질을 확보할 수 있음을 입증했다.

데이터앤리서치에 따르면 3분기(2025.07.01~2025.09.30) LG유플러스 포스팅 수는 총 37만2934건으로 집계됐다.
직전 2분기(2024.04.01~2024.06.30) 총 17만250건에 비해 20만2684건 119.05% 증가했다.
데이터앤리서치 관계자는 "LG유플러스는 올해 3분기 AI 기반 품질관리 시스템과 차세대 통신기술 연구·고객경험 중심 서비스를 전개했다"며 "데이터 분석과 예측형 AI를 활용한 서비스 안정화 전략이 시장의 긍정적 평가를 이끌었다"고 말했다.
정혜영 빅데이터뉴스 기자 news@thebigdata.co.kr
<저작권자 © 빅데이터뉴스, 무단 전재 및 재배포 금지>
