음성합성
-
네이버, 음성합성 만들기 위한 음성 녹음 시간 4시간으로 단축기타 2018. 7. 4. 13:45
네이버가 특정인의 목소리를 음성합성 (P-TTS, Personalized-Text To Speech) 하는 기술을 개발했다고 4일 밝혔습니다. 음성합성 기술이란 특정인의 음성을 녹음한 뒤 음성을 재구성하여 특정인의 말투와 음색을 기계가 따라할 수 있도록 하는 기술입니다. 보통 음성합성을 하기 위해서는 특정인의 음성을 구글 같은 업체도 최소 40시간 정도 녹음해야 하며 많게는 100시간의 음성 녹음이 필요하다고 합니다. 이를 네이버는 자체 개발한 하이브리드 음성합성 엔진으로 4시간의 음성 녹음만으로 가능케 했다는 것입니다. 녹음 시간을 1/10 로 줄인것 입니다. 특정인의 음석을 몇시간의 녹음으로 완벽하게 만들어낼 수 있다면 신기하기도 하지만, 이에 따른 우려나 문제들이 생길 수도 있을 것 같습니다. 사랑..