[AI 프로젝트] 인공지능 선생님, 자유발화 인터페이스

한승균 기자 / 전자공학 박사

2017-12-11 07:30:00

자유발화 인터페이스 과제는 인간의 자연스러운 말을 인식하고 의미를 이해하여 주제와 문맥에 맞는 자연스러운 대화가 가능하도록 하는 음성지능SW 개발을 목표로 하는 인공지능 국가전략프로젝트 R&D 과제이다. 2015년부터 시작되어 활발하게 연구를 수행하고 있는 자유발화 인터페이스 과제를 소개한다.

자유발화를 이해하고 자연스럽게 대화하는 음성지능

인간은 음성언어를 통해 서로 생각이나 느낌을 전달하고 공유한다. 자유발화 인터페이스 과제는 인간의 가장 중요한 정보전달 및 의사소통 수단인 언어를 다루는 기술과 서비스를 개발한다. 특히 단순한 패턴이나 시나리오 형태의 고정된 대화에서 벗어나, 인간과 기계간의 자연스 러운 대화를 가능하게 하는 자유발화형 음성대화처리 기술을 핵심으로 한다.
자료: 인공지능 국가전략프로젝트 사업단, 지능정보산업협회
자료: 인공지능 국가전략프로젝트 사업단, 지능정보산업협회

자유발화 인터페이스 과제는 1차년도에는 언어학습을 위한 자유발화형 음성대화처리 기술을 설계하고, 2차년도에는 통합 베이스 라인 시스템 개발을 진행했다. 3차년도에는 성능 향상 및 파일럿 시스템을 개발한다. 다가오는 4/5차년도에는 시스템 평가 및 최적화에 집중할 계획이다.

자유발화 인터페이스 과제의 주요 기술

자유발화 인터페이스 과제의 주요 연구개발 내용은 비정형 자연어* 음성인식 기술, 자유 대화 처리 기술, 언어학습 기술이다.

▷비정형 자연어 음성인식 기술
자연스러운 발화에는 감탄사, 더듬거림 등의 비정형 발화 현상이 포함된다. 이를 정확히 인식하기 위해서는 고정밀 음성분석 기술에 기반한 비정형 자연어 음성 지식 모델링 기술 개발이 필수적이다.

▷ 자유 대화 처리 기술
현실세계의 대화 상황처럼 동적으로 변하는 대화 문맥을 처리하고 응답하기 위해서는 자유발화형 대화 이해/관리 기술, 대화지식 자동학습 기술 등의 핵심 기술 개발이 필요하다.

▷언어학습 기술
자유발화형 음성지능 기술을 언어학습에 적용하기 위해서는 음성인식 및 대화처리 핵심 기술 외에 발음 유창성 평가, 문법 오류교정, 외국어 학습용 콘텐츠 저작도구, 다국어 영어발음 최적화 기술 등의 개발이 요구된다.
비정형 자연어 : 일상대화 및 구어체의 전형적인 어구반복, 머뭇거림, 감탄사/관용어 삽입, 자기수정, 도치 등 비문접적 발성 특징이 반영됨. 특히 모국어에 비해 유창성이 현저히 떨어지는 외국어 구사 시 더욱 두드러지게 나타남.
비정형 자연어 : 일상대화 및 구어체의 전형적인 어구반복, 머뭇거림, 감탄사/관용어 삽입, 자기수정, 도치 등 비문접적 발성 특징이 반영됨. 특히 모국어에 비해 유창성이 현저히 떨어지는 외국어 구사 시 더욱 두드러지게 나타남.


자유발화형 언어학습 플랫폼

음성대화처리 기술은 자동차, 문화, 교육, 의료 등 다양한 분야에 적용되어 차량 정보 서비스, 콜센터 녹취및 고객응대 서비스, 노인 말벗 서비스, 개인비서 서비스 등과 같은 새로운 서비스를 창출할 수 있다.
음성언어 기반 SW의 국가미래전략으로서의 중요성
음성언어 기반 SW의 국가미래전략으로서의 중요성

자유발화 인터페이스 과제는 자유발화형 언어학습 플랫폼을 개발하여 한국어, 영어 등 언어학습 전문기관에 핵심 원천기술을 제공하는 것을 목표로 한다.

이 플랫폼을 통해 한국어/영어의 발음 교육에서부터 문법및 표현, 회화 등 다양한 형태의 언어교육 서비스를 구현할 수 있다.
더불어 이러한 서비스를 통해 국내 도서 산간 지역의 부족한 외국어 교사를 대체하거나 다문화 가정 및 국내 취업 외국인을 위한 한국어 교육 서비 스로 활용이 가능하며 일본, 중국, 동남아 등에 영어/한국어 교육 서비스를 수출함으로써 관련 산업 육성 및국제 교류 활성화에 기여할 수 있을 것이다.

한승균 기자 / 전자공학 박사
<저작권자 © 빅데이터뉴스, 무단 전재 및 재배포 금지>