В Google создали компьютерную программу Tacotron 2, которая способна в точности имитировать человеческий голос. Она служит для преобразования текста в речь.
Система состоит из двух нейросетей глубокого обучения, сообщает Quartz. Первая преобразует текст в спектрограмму и передаёт алгоритму WaveNet, который озвучивает её, генерируя соответствующие звуковые элементы.
Tacotron 2 «умеет» произносить предложения с правильной интонацией, ставить ударения и делать паузы. У неё легко получается произносить длинные названия и выделять голосом слова, на которых делается акцент в предложении.
Пока Tacotron 2 может озвучивать тексты только на английском языке и только женским голосом. В будущем программа будет внедрена в сервисы Google, например Google Assistant или фирменный онлайн-переводчик.
Фото: flickr.com