Можно ли получить метафоны для этих неанглийских символов?
В Java можно конвертировать не английские символы в их английские символы.
Например, я хочу:
Zdeborová --> Zdeborova
Krząkała --> Krzakala
Sr´amek --> Sramek
скоро..
Когда я попробую методы ниже
String t1 = Normalizer.normalize("Krząkała", Normalizer.Form.NFD);
String t2 = t1.replaceAll("[^\\p{ASCII}]", "");
String t3 = t2.replaceAll("\\p{M}", "");
ИЛИ ЖЕ
String t4 = org.apache.commons.lang3.StringUtils.stripAccents("Krząkała");
Все они дают Krz? Ka? A в результате?
Я могу сделать этот процесс в оракуле, просто говоря:
select
REGEXP_REPLACE(replace(convert(trim(upper('Krząkała')), 'us7ascii'), '_', ' '), '[^A-Z ]', '') std
из двойного;
и получите КРЗАКАЛА.
Я думаю, в Java это также должно быть так просто???