
루게릭병은 운동 세포가 파괴돼 신체 근육이 약화됨에 따라 여러 증상이 나타날 수 있는데, 혀의 근육이 약해질 경우 분명한 발음이 점차 어려워지며 마비가 진행돼 기도를 절개해야 하는 상황에 이르게 되면 결국 완전히 목소리를 잃게 된다.
이에 많은 루게릭병 환우들이 갑작스럽게 목소리를 잃게 될 것을 대비해 사전에 개인의 음성을 남겨놓을 수 있기를 희망한다.
이들의 목소리 복원에는 KT가 보유한 개인화 음성합성기술(P-TTS)이 활용됐다. 이 기술은 적은 양의 음성 샘플만으로도 딥러닝 기반 AI 학습을 통해 사람의 음색, 어조, 말투 등을 반영한 목소리를 그대로 구현해낼 수 있다. KT는 환우들이 스마트폰으로 500개의 대화체 문장을 녹음해 전달한 오디오 파일을 바탕으로 이들의 음성 샘플 데이터를 교정하고 목소리를 생성했다.
루게릭병 환우들이 KT의 마음톡 앱에 텍스트를 입력하면 이 앱이 해당 환우의 목소리로 읽어준다. 텍스트를 음성으로 변환하는 과정에서 수천만 번의 연산을 거치는데 연산 시간은 1초 내외로 체감 지연이 없어 타인과 실시간으로 대화할 수 있다. 음성 및 영상통화도 가능하며, 음성통화 도중 끊김 없이 영상통화로 전환할 수도 있다.
<저작권자 © 빅데이터뉴스, 무단 전재 및 재배포 금지>
