Компания Google разработала специальный алгоритм, способный переводить речь с одного языка на другой, не используя текст и сохраняя голос говорящего. Нейросеть будет обрабатывать голосовой ввод как спектрограмму, после чего генерировать на этой основе новую спектрограмму на заданном языке.
Об этом сообщается в блоге компании.
– Translatotron исключает разделение задачи на отдельные этапы, что даёт несколько преимуществ перед каскадными системами, — говорится в сообщении.
Translatotron дает более точный перевод, чем базовая каскадная модель, а также лучше обрабатывает имена собственные.
Фото: архив A42.RU