Google AI представила первый алгоритм для прямого перевода устной речи с одного языка на другой

Исследователи из Google AI создали алгоритм Translatotron, который переводит устную речь с одного языка на другой. При этом он не использует текстовую расшифровку, как классические алгоритмы.

Затем, что он умеет кое-что, чего не умеют предшественники. Обычно перевод устной речи строится так:

Поскольку исходная и конечная фразы напрямую не связаны, теряются очень важные составляющие речи: интонация и паузы. Новый алгоритм сохраняет при переводе звуковые особенности оригинала.

Translatotron работает со спектрограммами. Алгоритм состоит из трёх модулей:

По качеству Translatotron уступает классическим решениям. Но, как говорит Google AI, он первый и пока единственный в своём роде. Раньше учёные исследовали саму возможность прямого перевода, поэтому использовали набор данных из ста слов. Translatotron обучали на полноценных языковых корпусах.

Источник: tproger.ru

Share with:


Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *