Полностью запутался в категориях МТ и влиянии на модель

Я пытаюсь обучить движок в Microsoft Hub, используя преимущества значительно лучшей технологии Neural против SMT. При тестировании на https://translator.microsoft.com/neural/ мне ясно, что Neural - это то, что я хочу.

Тем не менее, документация концентратора по адресу //hub.microsofttranslator.com/Help/Download/Microsoft%20Translator%20Hub%20User%20Guide.pdf вызывает путаницу:

На странице 7, пункт 2.3.1 говорится

Категория определяет домен - общую область терминологии, которую вы хотите использовать - для вашего проекта. Пожалуйста, выберите категорию, которая наиболее подходит и соответствует вашему типу документов.

В некоторых случаях ваш выбор категории напрямую влияет на поведение Hub:

  • Если вы выберете "Технология" и решите использовать модели Microsoft, то концентратор будет использовать другой набор базовых моделей, чем для всех других категорий.
  • Если вы выберете "Речь", концентратор будет использовать модели, оптимизированные для обработки выходных данных систем распознавания речи.
  • Любая другая категория выбора использует "общие" модели Microsoft и используется в качестве идентификатора в вашем идентификаторе категории.

Но затем на странице 51 это полностью противоречит этому утверждению и говорит:

В: Я выбрал категорию "Технологии" при создании проекта. Когда я обучу систему для этого проекта и выберу опцию "Использовать модели Microsoft", будет ли обучение использовать модель технологии Microsoft?

A: Нет. На данный момент выбор "Использовать модели Microsoft" всегда вызывает общие данные обучения, как и Bing Translator. Выбор категории служит только для определения вашей цели, но на данный момент не влияет на поведение во время обучения или перевода. Это изменится в следующем выпуске.

Может кто-нибудь разобраться с этим? Какое сочетание категорий и опции "использовать модель MS" мне нужно выбрать, чтобы получить "хороший" выход Neural MT, который я ищу?

Спасибо!

@Chris_Wendt недавно написал это в другом посте:

Использование параметра &category=generalnn в вызове API приведет к тем же результатам, что и в пользовательском интерфейсе Bing. Будьте осторожны с теговым контентом. Теги обрабатываются лучше со значением категории по умолчанию, пустым или "общим".

Я использую плагин SDL Trados 2017 для переводчика Microsoft. У меня есть способ передать этот параметр?

[ Как выглядит плагин

2 ответа

Вы можете передать "generalnn" или идентификатор своей системы Hub в поле "ID категории" в Trados, или любой другой инструмент TM, который позволяет вам установить значение категории. На этом этапе нейронные системы не настраиваются, но вы можете использовать их так же, как и настраиваемую систему.

Нейронные системы теперь можно настраивать с помощью нового предварительного просмотра Custom Translator. Вам необходимо использовать Microsoft Translator Text API v3, а Custom Translator поддерживает языковые пары, являющиеся языками NMT.

Другие вопросы по тегам