6c248c0d

Google сообщила о собственной нейронной технологии передвижения

За прошедшие двадцать лет распространенный сервис Google Translate прошёл серьёзный вторичный маршрут. Начиналось с помощи всего нескольких языков, сейчас данный сервис может работать со 103 языками, но ежедневно благодаря ему переводится не менее 140 миллионов слов. Чтобы сделать это вероятным, Google понадобилось возвести и сохранять множество распределённых систем. При этом вычисляемые траты были достаточно огромными.

Новая система сохраняет изучение вида Zero-shot

Новая система сохраняет изучение вида Zero-shot

Чтобы решить появляющиеся неприятности и увеличить качество передвижения Google активно действует над новой технологией нейронного механического передвижения (GNMT, Google Network Machine Translation). В первый раз она была анонсирована в начале сентября 2014 г, но на прошедшей неделе было оглашено о тестовом запуске GNMT для 8 языков. Тогда никаких компонентов Google не открыла, однако с статьей публикации «Google’с Multilingual Neural Machine Translation Систем: Enabling Zero-Shot Translation» обнародованы свежие интересные детали.

В GNMT применяется трёхмерная показ данных

В GNMT применяется трёхмерная показ данных

Как сообщают создатели, переход на GNMT на самом деле осязаемо повысил качество передвижения между языками, которые применялись для испытания. Однако масштабирование до помощи всех 103 языков считается реальным вызовом. Обновлённая GNMT-технология дает возможность одной системе производить перевод между некоторыми языками. Представленная архитектура не требует внесения перемен в ядро GNMT, однако включает особый токен, вставляющийся в начало предложения. Данный токен устанавливает, на какой язык необходимо осуществить перевод. В отдельности подчеркивается так называемый способ Zero-shot Translation, который дает возможность переводить некоторые фразы между языковыми парами, никогда в жизни раньше не встречающиеся. Zero-shot предполагает такое изучение, когда устанавливается цель без присутствия образцов решения похожих неприятностей. К примеру, стоит цель отыскать кота на фото. При этом фото с иными котами не демонстрируются, но только даётся подробное описание того, как должен смотреться кот.

Google показывает это на примере GNMT с помощью трёх языков. Предположим, система проходит изучение для четырёх пар — с японского на британский, с британского на японский, с корейского на британский и с британского на корейский. В способе Zero-shot приобретенный опыт при передвижении между данными парами применяется для выполнения передвижения таких же фраз между японским и корейским языками. По заявлению Google, такой вид изучения в первый раз применен в системах механического передвижения.

Вместо классического попарного передвижения фраз (когда пары просто запоминаются в информационной базе), Google применяет так именуемую трёхмерную репрезентацию данных. Нейронная сеть шифрует данные семантически. На различных языках такие смысловые следы будут смотреться весьма похоже, но сконструированная сеть именуется интерлингвистической.

По словам Google, итоги изучения будут любопытны не только лишь специалистам механического изучения, но также и языковедам.  

Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий