28 декабря 2017 в 15:26 Наука

Создан генератор речи, неотличимый от голоса человека

В Google создали компьютерную программу Tacotron 2, которая способна в точности имитировать человеческий голос. Она служит для преобразования текста в речь.

Система состоит из двух нейросетей глубокого обучения, сообщает Quartz. Первая преобразует текст в спектрограмму и передаёт алгоритму WaveNet, который озвучивает её, генерируя соответствующие звуковые элементы.

Tacotron 2 «умеет» произносить предложения с правильной интонацией, ставить ударения и делать паузы. У неё легко получается произносить длинные названия и выделять голосом слова, на которых делается акцент в предложении.

Пока Tacotron 2 может озвучивать тексты только на английском языке и только женским голосом. В будущем программа будет внедрена в сервисы Google, например Google Assistant или фирменный онлайн-переводчик.

Фото: flickr.com

Ещё материалы по теме

Подпишитесь на оперативные новости в удобном формате:

Читайте далее
билайн бизнес представил решения для улучшения мобильного покрытия на Третьем российском угольном саммите
Яндекс.Метрика