엔씨소프트, 고려대 연구팀과 'AI 대화 데이터셋' 글로벌 공개

[빅데이터뉴스 심준보 기자] ㈜엔씨소프트(대표 김택진, 이하 엔씨(NC))가 고려대학교 임희석 교수 연구팀과 AI 대화 데이터 ‘FoCus Dataset(For Customized conversation dataset)’을 공개했다고 14일 밝혔다.

‘FoCus Dataset’은 사용자 개인의 페르소나(Persona)와 외부 지식을 모두 활용하는 AI 대화 데이터셋이다. 약 8천여 개의 광범위한 주제를 다룬 1만 5천개 이상의 대화로 구성되어 있다.

‘FoCus Dataset’을 적용한 AI는 대화하고 있는 사용자의 경험, 선호, 소유, 흥미 등을 파악하고 위키피디아에서 이야기 주제에 대한 최신 지식을 실시간으로 습득해 대화가 가능하다.

‘FoCus Dataset’은 초거대 언어 모델을 사용하지 않고도 같은 성능의 대화 기술 구현이 가능한 것이 특징이다.

공동연구팀은 지난 2월 세계 최고 권위의 인공지능 학회 ‘AAAI 2022’에서 해당 연구 논문을 게재 및 발표했다. 오는 10월에는 세계 전산언어학회인 ‘COLING 2022’에서 데이터 활용 경진 대회(Shared Tasks)를 비롯한 연구 성과를 공유하는 워크샵(The 1st Workshop on Customized Chat Grounding Persona and Knowledge)을 고려대와 공동 개최한다.

심준보 빅데이터뉴스 기자 news@thebigdata.co.kr

심준보 기자의 다른 기사 보러 가기

엔씨소프트, 고려대 연구팀과 'AI 대화 데이터셋' 글로벌 공개

헤드라인뉴스

재계뉴스

빅데이터 라이프

칼럼·인사동정

기업집단 빅데이터