Определить ASCII-коды для азиатских двухбайтовых / кириллических наборов символов?

Можно ли определить, относится ли символ ascii к азиатским двухбайтовым или кириллическим наборам символов? Возможно, конкретные диапазоны кода? Я гуглил, но ничего не нашел на первый взгляд.

Я использую RSS-канал, в котором локаль установлена ​​как en-gb. Но в самой ленте есть азиатские двухбайтовые символы, которые мне нужно обрабатывать по-разному. Просто не уверен, как его обнаружить, так как данные мета-локали неверны. У меня нет доступа к исправлению общедоступного канала.

2 ответа

Если ваш RSS-канал использует utf-8, что, вероятно, и делает - просто посмотрите, что значение символа больше 255.

Быстрый Google предлагает вам посмотреть на String.charCodeAt

Я не знаю ActionScript, но я ожидаю, что фрагмент кода будет выглядеть примерно так

var stringToTest : String;

for each (var i : Number = 0; i < stringToTest.length; i++) {
    if (stringToTest.charCodeAt(i) > 255) {
        // Do something to your double-byte character here
    } else {
        // You have a plain ASCII character here
    }
}

Надеюсь, это поможет!

Другие вопросы по тегам