지난 10일 네이버가 일반인들의 목소리를 음성합성하는 이벤트를 시작했다.
네이버는 이벤트의 응모단계에서 응모자들의 음성을 AI 기술개발과 학습데이터로 사용한다는 동의를 받고 있다.
이에 업계에서는 이 이벤트를 통해 네이버가 음성합성 개발을 위한 다양한 데이터를 확보할 것으로 예측했다.
또한, AI 음성합성에 대한 대중의 관심을 높이는 효과도 얻을 것으로 보고있다.
한편, 한달 간 진행될 '네이버의 목소리를 찾아라'(https://campaign.naver.com/voice_event/)는 자신의 음성을 전화로 녹음하는 방식으로 진행된다.
응모자들 중, 남자 10명과 여자 10명을 선발하여 스튜디오 녹음을 진행한다. 이들 중 남녀 각각 1명씩을 우승자로 뽑아 네이버의 목소리로 채택할 예정이다.
응모자는 전화로 "런치타임 할인 메뉴가 있나요?", ''주말 런치 언제부터 에요?" 등 예약과 관련된 10개의 문장을 읽는다. 네티즌들은 이 스크립트들을 공유하면서 네이버가 우선 일상생활과 관련된 데이터를 수집할 것으로 예상하고 있다.
음성합성은 사람의 실제 목소리를 기반으로 인공음성을 만드는 기술이다. 주어진 데이터로 톤과 악센트를 조정하고 매끄러운 문장으로 다듬어 자연스러운 음성을 만드는 것이 핵심 역량이다.
네이버는 홍콩에 AI 연구소를 세우는 등 다양한 투자를 하면서, 세계 최고수준의 음성합성 기술을 가지고 있다.
네이버는 지난해 11월 4시간 녹음으로 배우 유인나의 목소리를 합성해서 제공하는 기술을 선보였다. 구글 음성 합성 기술이 비슷한 결과물을 내놓기 위해 40시간의 녹음이 필요한 것과 큰 차이를 보인다.
올해 4월에는 네이버는 이를 더 단축하여 약 40분간 500문장을 녹음하고 이 문장을 합성한 음성정보를 발표했다.
업계에서는 네이버의 기술력과 일반인의 음성 데이터가 결합되어 "짧은 녹음으로 목소리를 합성할 정도로 기술과 서비스완성도가 높아질 것"이라고 전망했다.
이번 이벤트를 지켜본 네티즌들은 연인이나 부모님의 목소리로 길안내나 모닝콜을 받을 날이 가까워졌다는 기대감을 나타내고 있다.