Microsoft Translator

Материал из Wikibrand
Microsoft Translator
Тип Переводчик
Владелец Microsoft
Регистрация необязательно
Языки 179
Текущий статус активен
Сайт microsoft.com/translator; bing.com/translator

Microsoft Translator или Bing Translator — многоязычный облачный сервис машинного перевода, а также веб-служба, предоставляемая корпорацией Microsoft. Microsoft Translator является частью Microsoft Cognitive Services и интегрирован в различные продукты для потребителей, разработчиков и предприятий, включая Bing, Microsoft Office, SharePoint, Microsoft Edge, Microsoft Lync, Yammer, Skype Translator, Visual Studio и приложения Microsoft Translator для Windows, Windows Phone, IPhone, Apple Watch, Android и Android Wear.

Microsoft Translator также предлагает услуги перевода текста и речи через облачные сервисы для бизнеса. Сервис перевода текста через Translator Text API доступен в различных вариантах: от бесплатного, поддерживающего два миллиона символов в месяц, до платных, поддерживающих миллиарды символов в месяцСервис поддерживает перевод текста между многими языками и их вариантами.. Услуги перевода речи через сервисы Microsoft Speech предоставляются с учётом времени аудиопотока. Он также поддерживает несколько систем речевого перевода, которые сейчас используются в функции живого общения Microsoft Translator, Skype Translator и Skype для настольного компьютера Windows, а также в приложениях Microsoft Translator для IOS и Android.

История

Первая версия системы машинного перевода Microsoft была разработана в 1999–2000 годах в рамках исследовательского центра Microsoft Research. Эта система основывалась на семантических предикатно-аргументных структурах, популярных как логические формы (LF), и была разработана на основе функции исправления грамматики, разработанной для Microsoft Word. В конечном итоге эта система была использована для перевода всей базы знаний Microsoft на испанский, французский, немецкий и японский языки.

Сайт-переводчик для потребителей Bing Translator (ранее широко известный как Windows Live Translator и Live Search Translator) был запущен в 2007 году и предлагает бесплатный перевод текстов и веб-сайтов в интернете. В 2011 году сервис был расширен и теперь содержит множество продуктов Microsoft Translator через облачный API, который поддерживает продукты, доступные как частным, так и корпоративным пользователям. В марте 2016 года была добавлена ​​дополнительная возможность речевого перевода.

В мае 2018 года было представлено обновление API. В новой версии нейронный машинный перевод был выбран в качестве метода перевода по умолчанию. Помимо перевода, новая версия включает транслитерацию и двуязычный словарь для поиска слов, поиска альтернативных переводов и просмотра примеров в предложениях.

Методология перевода и исследования

Microsoft Translator использует машинный перевод для мгновенного перевода с одного естественного языка на другой. Эта система основана на четырёх различных областях исследований компьютерного обучения, представленных ниже:

Тип обучения Влияние на перевод
Нейронные сети
Нейронные сети пытаются имитировать работу мозга при переводе между языками. Во-первых, на первом этапе моделируется слово, которое необходимо перевести, на основе контекста этого слова (и его возможных переводов) в полном предложении. На высоком уровне нейросетевой перевод работает в два этапа. Во-вторых, нейронная сеть переводит эту модель слова (не само слово, а модель, построенную нейронной сетью) в контексте предложения на другой язык. Нейронный машинный перевод — это метод перевода по умолчанию для API Microsoft Translator.
SMT на основе синтаксиса
Перевод на основе синтаксиса основан на идее перевода синтаксических единиц, а не отдельных слов или цепочек слов. Компания Microsoft использовала SMT на основе синтаксиса для перевода значительной части своих компьютерных текстов с английского на несколько целевых языков. Продолжающиеся исследования в этой области привели к улучшению склонений и порядка слов.
SMT на основе фраз В SMT, основанном на фразах, машина изучает соответствие между языками на основе параллельных текстов без привлечения лингвистических знаний. Это позволяет получать более качественные переводы за меньшее время, чем другие системы.
Выравнивание слов по битексту Системы SMT используют существующие данные перевода для обучения автоматическому переводу с одного языка на другой. Для обучения систем критически важно определить соответствия слов (или выравнивание слов). Microsoft разработала как дискриминационный, так и генеративный подходы к выравниванию слов, что приводит к ускорению алгоритмов и повышению качества переводов.
Моделирование языка Моделирование языка использует модели N-грамм для построения понятных переводов на целевой язык. Это гарантирует, что перевод будет плавным и читабельным.

Точность

Качество результатов машинного перевода Microsoft Translator оценивается с помощью метода, называемого BLEU.

BLEU (Bilingual Evaluation Understudy) — это алгоритм оценки качества текста, переведённого с одного естественного языка на другой. Качество определяется соответствием между результатом работы машины и результатом работы человека. BLEU стала одной из первых метрик, достигших высокой корреляции с человеческими оценками качества, и остаётся одной из самых популярных автоматизированных и недорогих метрик. Microsoft Translator внедрил в свои продукты различные функции обратной связи, такие как Collaborative Translation Framework, позволяющие пользователям предлагать альтернативные варианты перевода. Поскольку машинный перевод основан на статистических алгоритмах, а не на переводчиках-людях, автоматические переводы не всегда абсолютно точны. Эти альтернативные варианты затем интегрируются в алгоритмы Microsoft Translator для улучшения будущих переводов. В ноябре 2016 года Microsoft Translator показал перевод с использованием глубоких нейронных сетей на девяти наиболее популярных языках, включая все языки с речью и японский. Нейронные сети обеспечивают более качественный перевод, чем стандартное статистическое машинное обучение.

Поддерживаемые языки

Список поддерживаемых языков доступен на веб-сайте Microsoft Translator, а также может быть получен программным способом через облачные сервисы.

По состоянию на года Microsoft Translator поддерживает 179 языков и языковых вариантов:

Азербайджанский Албанский Амхарский Английский Английский (Великобритания) Арабский Арабский (Египетский) Арабский (Марокканский) Арабский (Романизированный) Армянский Ассамский Астурийский Африкаанс Ачехский (Латиница) Балийский Баскский Батак-тоба Башкирский Белорусский Бенгальский Бикольский Бирманский Бодо Болгарский Боснийский Бходжпури Валлийский Варайский Венгерский Венетский Верхнелужицкий Вьетнамский Гаитянский Галисийский Ганда Греческий Грузинский Гуджарати Дари Датский Догри Зулу Ибанский Иврит Игбо Идиш (Восточный) Илокано Индонезийский Инуиннактун Инуктитут Инуктитут (Латиница) Ирландский Исландский Испанский Итальянский Йоруба Кабувердьяну Казахский Каннада Кантонский (Традиционная Китайская) Капампанган Каталанский Кашмири Киньяруанда Киргизский Китайский (Классический) Китайский (Традиционная Китайская) Китайский (Упрощенная Китайская) Клингонский (Латиница) Конкани Корейский Корсиканский Коса Крио Курдский (Северная) Курдский (Центральная) Кхмерский Лаосский Латинский Латышский Лигурский (Генуэзский) Лимбургский Лингала Литовский Ломбардский Люксембургский Маврикийский Креольский Майтхили Македонский Малагасийский Малайский Малаялам Мальдивский Мальтийский Маори Маратхи Марвари Минангкабау (Латиница) Монгольский (Кириллица) Монгольский (Традиционный) Немецкий Непальский Нидерландский Нижнелужицкий Норвежский Букмол Норвежский Нюнорск Ньянджа Окситанский Ория Отоми (Керетаро) Панджаби (Гурмукхи) Панджаби (Шахмукхи) Папьяменто Персидский Польский Португальский (Бразилия) Португальский (Португалия) Пушту Румынский Рунди Русский Самоанский Санскрит Сардинский Себуано Северный сото Сейшельский Креольский Сербский (Кириллица) Сербский (Латиница) Сесото Сетсвана Сингальский Синдхи Сицилийский Словацкий Словенский Сомали Суахили Сунданский Таджикский Таитянский Тайский Тамильский Татарский Телугу Тетум Тибетский Тигринья Ток-писин Тонганский Турецкий Туркменский Узбекский (Латиница) Уйгурский Украинский Урду Фарерский Фиджи Филиппинский Финский Французский Французский (Канада) Фризский Фриульский Хауса Хилигайнон Хинди Хмонг Хорватский Чешский Чхаттисгархи Шведский Шона Эсперанто Эстонский Юкатекский Майя Яванский Ямайский Креольский Японский

Примечания

Ссылки