Как перевести статический веб-контент с помощью Google Translate
У нас есть "веб-сайт", состоящий из полностью статического контента на английском языке. Общий объем HTML-файлов для сайта составляет около 300 МБ данных (т. Е. Исключая изображения, только текстовые файлы HTML).
Содержимое обычно используется в автономном режиме в простом устройстве веб-сервера для удаленных школ, где нет доступа к Интернету.
Если я предоставлю тот же контент с веб-сервера в Интернете и предоставлю URL-адрес сайта Google Translate, то получу отличные результаты перевода, и мы сможем обойти сайт по ссылкам, как в оригинале.
Таким образом, мы знаем, что Google Translate сделает хорошую работу по переводу контента, и делает это довольно автоматически через онлайн-сервис Google Translate.
Мой вопрос заключается в том, как лучше всего перевести файлы HTML в больших количествах на несколько других языков, используя сервис Google Translate или другой эквивалент.
Перевод, очевидно, должен распознавать HTML-код и просто переводить фактический контент на английском языке, что прекрасно делает онлайн-переводчик Google.
Кажется, это было бы довольно распространенным требованием, но я не могу найти простой ответ о том, как это сделать.
Буду очень признателен за любые предложения.
Заранее спасибо.
1 ответ
Спасибо за предложения.
Отправка файлов один за другим в Google API будет работать хорошо, если он вернет файлы с неизмененной разметкой и переведенным содержимым.
Но я думаю, что данные за $20 / M chars X 300 МБ составляют около $6000 за каждый языковой перевод. Нам нужны как минимум три языковых перевода. Так близко к 20 тысячам долларов - возможно, немного больше для проекта, основанного исключительно на добровольных началах, основанного на сообществе, даже с некоторым сокращением с некоторым умным кодированием.
Localise.js предлагает "Неограниченные бесплатные машинные переводы" для внутреннего перевода контента. Похоже, что это стоит того, чтобы за ним следить.
Одним из языков, который нам нужен, является кхмерский, поэтому будет интересно посмотреть, включен ли он в их список из 100 языков (которые я еще не обнаружил на их сайте)