BreakIterator API Java
Документация для BreakIterator.getWordInstance()
имеет опции для использования с параметром Locale, предположительно потому, что конечные результаты разных локалей могут отличаться для методов типа (WordInstance
, LineInstance
, SentenceInstance
, CharacterInstance
)
Но когда я не использую этот параметр, я все равно получаю те же результаты, что и при вызове его с любым Locale в getAvailableLocales()
,
Есть ли какой-нибудь шаблон, строка или локаль, которые на самом деле приводят к тому, что эти методы дают разные результаты?
1 ответ
Я считаю, что все "западные" языки имеют одинаковые правила.
Беглый просмотр показывает, что локаль th
(Тайский) имеет свои правила, приведенные в файле /sun/text/resources/th/WordBreakIteratorData_th
внутри .../jre/lib/ext/localedata.jar
,
Это бинарный файл, поэтому я не знаю, что он говорит, и даже если бы я мог понять файл, не зная тайского языка, я все равно не понял бы его.