Как преобразовать тамильскую строку в английскую строку в Java
Я делаю проект, который включает в себя НЛП. Мне нужно транслитерировать тамильскую строку на английскую строку (в упрощенном виде), например, "இல்லை" на "illai"..
Как я могу сделать это с помощью Java? Помогите мне с примером кода
1 ответ
Поскольку в тамильском блоке всего 72 символа, создайте таблицу перевода, а затем создайте новую строку, проверив каждую из них, можно ли перевести символ перед его добавлением в список.
Например U+0B87
(Becomes) становится i
Если вы более знакомы с Java и / или имеете очень много материала для перевода, вероятно, есть несколько оптимизаций обработки для ускорения процесса, но я подозреваю, что вышеизложенное послужит основой для хорошего решения.
Если у вас есть только небольшое количество материала для перевода или это разовая работа, возможно, имеет смысл просто использовать Google Translate и получить перевод для ввода ниже поля ввода.