BreakIterator API Java

Документация для BreakIterator.getWordInstance() имеет опции для использования с параметром Locale, предположительно потому, что конечные результаты разных локалей могут отличаться для методов типа (WordInstance, LineInstance, SentenceInstance, CharacterInstance)

Но когда я не использую этот параметр, я все равно получаю те же результаты, что и при вызове его с любым Locale в getAvailableLocales(),

Есть ли какой-нибудь шаблон, строка или локаль, которые на самом деле приводят к тому, что эти методы дают разные результаты?

1 ответ

Я считаю, что все "западные" языки имеют одинаковые правила.

Беглый просмотр показывает, что локаль th (Тайский) имеет свои правила, приведенные в файле /sun/text/resources/th/WordBreakIteratorData_th внутри .../jre/lib/ext/localedata.jar,

Это бинарный файл, поэтому я не знаю, что он говорит, и даже если бы я мог понять файл, не зная тайского языка, я все равно не понял бы его.

Другие вопросы по тегам