Дополнительный символ при кодировании и декодировании строки Java UTF-8
Всякий раз, когда мы передаем сообщение на языке каннада, в сообщение добавляется только определенный символ <U+200C>, который в конечном итоге отправляется через SMS. мы используем кодировщик и декодер UTF-8. при тестировании необработанной строки он утверждает одно и то же значение для rawString и decodedString.
Реальная стоимость :
ಕ್<U+200C>ಬ
Ожидаемое значение :
ಕ್ಬ