Как распознать, находится ли данный текст в уценке или в креольском формате
Есть ли какая-нибудь Java-библиотека, которая с большой точностью сообщает, находится ли данный текст в разметке разметки или креольской разметке.
У нас есть несколько внешних поставщиков услуг, которые предоставляют нам данные. Эти данные могут быть в любой разметке. На данный момент это уценка и креольский. Мы хотим преобразовать эти данные, предоставляемые этими услугами, в наш собственный формат.
Есть некоторые конвертеры, такие как pendoc, которые конвертируют из одного формата в другой. Но это не ситуация. Мы не знаем, какую разметку мы получаем.