카카오브레인, ‘GPT-3’ 모델 한국어 특화 AI 언어모델 오픈소스 공개

심준보 기자

2021-11-16 10:02:33

카카오브레인, ‘GPT-3’ 모델 한국어 특화 AI 언어모델 오픈소스 공개
[빅데이터뉴스 심준보 기자] 카카오브레인(대표 김일두)이 16일 ‘GPT-3’ 모델의 한국어 특화 AI 언어모델 ‘KoGPT’를 세계 최초로 최대 오픈소스 커뮤니티 깃허브(github)에 공개했다고 밝혔다.

GPT 모델을 적용하면, 추가 학습 없이 스스로 판단해 감정 분석을 할 수 있다. 예를 들어 영화 리뷰 댓글을 보고 댓글이 영화에 대한 긍정적인지 부정적인지 판별할 수 있고, 글의 내용을 짧게 요약 가능하다. ‘3주 동안 식물에게 물을 주었다’ 라는 글을 입력하면 ‘식물이 꽃을 피웠다’ 처럼 인과 관계를 예측해 보여주고 다음 이야기도 스스로 적을 수 있다.

카카오브레인의 ‘KoGPT’는 이같은 ‘GPT-3’ 모델의 한국어 특화 버전이다. 60억개의 매개변수와 2000억개 토큰(token)의 한국어 데이터를 바탕으로 구축했다.

‘KoGPT’는 한국어를 사전적, 문맥적으로 이해하고 이용자가 원하는 결과값을 보여 준다. △ 주어진 문장의 긍정과 부정 판단 △ 긴 문장 한줄 요약 △ 문장을 추론해 결론 예측 △ 질문을 하면 문맥 이해해 답변하는 등 언어를 가지고 활용할 수 있는 모든 과제를 수행한다. 맥락에 따라 자동으로 글쓰기가 가능해지기 때문에 상품 소개글 작성, 감정 분석, 기계 독해, 기계 번역 등 높은 수준의 언어 과제를 해결하고 다양한 분야에서 활용할 수 있다.

심준보 빅데이터뉴스 기자 news@thebigdata.co.kr
<저작권자 © 빅데이터뉴스, 무단 전재 및 재배포 금지>