Можно ли получить метафоны для этих неанглийских символов?

В Java можно конвертировать не английские символы в их английские символы.

Например, я хочу:

Zdeborová --> Zdeborova    
Krząkała  --> Krzakala   
Sr´amek   --> Sramek

скоро..

Когда я попробую методы ниже

        String t1 = Normalizer.normalize("Krząkała", Normalizer.Form.NFD);
        String t2 = t1.replaceAll("[^\\p{ASCII}]", "");
        String t3 = t2.replaceAll("\\p{M}", "");

ИЛИ ЖЕ

String t4 = org.apache.commons.lang3.StringUtils.stripAccents("Krząkała");

Все они дают Krz? Ka? A в результате?

Я могу сделать этот процесс в оракуле, просто говоря:

select 
REGEXP_REPLACE(replace(convert(trim(upper('Krząkała')), 'us7ascii'), '_', ' '), '[^A-Z ]', '') std

из двойного;

и получите КРЗАКАЛА.

Я думаю, в Java это также должно быть так просто???

0 ответов

Другие вопросы по тегам