Поиск имени персонажа в Юникоде с помощью Javascript
Мне нужно узнать имена для символов Юникода, когда пользователь вводит номер для него. Например, можно ввести 0041 и получить в качестве результата латинскую заглавную букву A.
2 ответа
Насколько я знаю, стандартного способа сделать это не существует. Вы могли бы, вероятно, проанализировать файл UnicodeData.txt, чтобы получить эту информацию.
Здесь должно быть то, что вы ищете. Первый массив просто http://unicode.org/Public/UNIDATA/Index.txt с заменой строк на |
;
// this mess..
var unc = "A WITH ACUTE, LATIN CAPITAL LETTER 00C1| /*... really big array ...*/ |zwsp 200B";
var uncs=unc.split("|");
var final_a = [];
var final_s = "";
for each (var item in uncs) {
var _T=item.split("\t");
//final_a [_T[1]] = _T[0];
final_s += '"' + _T[1] + '"' + ' : ' + '"' + _T[0] + '",';
}
console.log (final_s);
// yields..
var unicode_lookup = { /*really big array*/ }
// which we can use like so ...
alert(unicode_lookup["1D01"]);
// AE, LATIN LETTER SMALL CAPITAL
SO не сохраняет вкладки, поэтому первая часть может не работать, если вы просто скопируете ее. Вы заметите, что некоторые символы являются дубликатами, поэтому вы можете захотеть сделать некоторую очистку.