«Google» презентовал «Translatotron»

Технологии >> 18.05.2019, 06:31

Бренд «Google» представил аудитории инновационную технологию, обеспечивающую перевод устной речи. Она получила наименование «Translatotron». Информация подтверждена корпоративным сообщением и представлена порталом «The Verge».

Сообщается, что в уже созданных технологических продуктах для перевода устной речи с одного языка на иной используется, так называемая, каскадная модель. Ее суть состоит в том, что изначально система автоматически идентифицирует речь для ее функциональной транскрипции. Далее, идет фаза машинного перевода полученной текстовки. И, наконец, преобразование текста в конечную аудиозапись. Подобная технология, к примеру, используется в продукте «Google Translate».

Новый технологический алгоритм IT-гиганта исключает фазу расшифровки устной речи в текст. Созданная специалистами компании нейросеть принимает исходную спектрограмму голосовой аудиозаписи и сразу синтезирует аналогичную речевую спектрограмму, но на ином языке. Затем образуется аудиофайл.

Вместе с этим, «Translatotron» может сохранять паузы и общие интонации в речи, а также непосредственно голос говорящего. Однако пока, при сохранении исходного голоса, перевод может несколько отличаться. Это обусловлено тем, что новая нейросеть обучена на меньшем количестве исходных данных.

После тестирования продукт технологический продукт будет усовершенствован.