
특히, 이번에는 네이버의 초 대규모 AI인 하이퍼클로바의 핵심 연구 논문이 메인 컨퍼런스 발표에 채택되는 성과를 거뒀다. 하이퍼클로바는 네이버가 지난 5월 국내 기업 최초로 공개한 초대규모 AI이자, GPT-3보다 한국어 데이터를 6,500배 이상 학습한, 현재 공개된 단일 모델 중 전세계에서 가장 큰 한국어 초 대규모 언어모델이라고 네이버는 설명했다.
해당 연구는 한국어 초 대규모 언어모델인 ‘하이퍼클로바’와 그 학습에 사용된 데이터를 소개하고, 다양한 크기의 모델들이 갖는 성능을 검증하는 내용이다. 논문에서는 하이퍼클로바가 다양한 한국어 과제(task)에 대해 제한된 예제만으로도 뛰어난 학습(in-context learning) 성능을 보인다는 것을 증명했다. 이와 더불어, 초거대 언어모델에서의 프롬프트 최적화(prompt optimization), 데이터 토큰화(tokenization) 등에 대한 논의를 발전시키고, ‘하이퍼클로바 스튜디오’를 통해 ‘노 코드 AI’(No Code AI) 등 초대규모 AI가 가져올 AI 서비스 개발 방법론의 변화에 대해서도 설명한다. 해당 연구에는 네이버의 클로바 및 AI랩의 연구진 뿐만 아니라, 소프트웨어 플랫폼 엔지니어, 검색 엔지니어 등 다양한 팀에 걸쳐 총 37명이 저자로 참여했다.
하정우 네이버 AI랩 소장은 “작년 하반기부터 초대규모 AI 기술에 집중적으로 투자하고 연구 역량을 결집시킨 결과, 국내 최초로 ‘하이퍼클로바’ 기술을 공개하고 성공적으로 상용화한 데 이어 세계 최고 권위의 학회에서 그 기술력을 인정받는 쾌거를 거뒀다”면서, “이번 논문은 영어 중심이었던 기존의 언어모델 연구를 넘어, 한국어 AI의 가치를 글로벌 자연어처리 학계가 인정했다는 점에서도 매우 의미 있는 성과”라고 강조했다.
심준보 빅데이터뉴스 기자 news@thebigdata.co.kr
<저작권자 © 빅데이터뉴스, 무단 전재 및 재배포 금지>
