Забавные странные (юникод) персонажи занимают более одной строки
Я нашел несколько "забавных" персонажей (например, ḓ̵̙͎̖̯̞̜̞̪̠ и •̩̩̩̩̩̩̩̩̩̩) в социальных сетях, которые занимают более одной строки. Сначала я думаю, что это ошибка Firefox. Я попробовал это в Gedit и LibreOffice Writer, они все одинаковые. Итак, что это на самом деле? На самом деле я спрашиваю о кодировке и рендеринге символов.
Я пытался найти персонажа в GNOME Character Map, его не удалось найти.
Я попытался проверить код символов обоих из них в Unicode (вероятно, UTF-8). Кажется, они занимают более одного персонажа. Почему один персонаж - это больше, чем один персонаж? Это результат использования Python.
Персонаж ḓ̵̙͎̖̯̞̜̞̪̠
u'\u2022\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329
\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329'
Символ
u'\u1e13\u0335\u0319\u034e\u0316\u032f\u031e\u031c\u031e\u032a\u0320\u033c\u031e
\u0320\u034e\u033c\u0353\u034b\u036e\u034c\u0346\u0300\u035c\u0345'
1 ответ
U+0329 комбинирует вертикальную линию внизу. Это комбинирующий символ (как и все остальные, кроме U+2022 и U+1E13), что означает, что он сочетается с предыдущим. То, что вы видите здесь, является просто результатом того, что кто-то сложил слишком много комбинирующих персонажей на одной базе.