Является ли множество различных графем бесконечным?

Есть ли ограничение на количество различных графем, которые могут быть представлены в кодировке Unicode, такой как UTF-8? Например, ограничивает ли стандарт Unicode количество последовательных символов объединения?

1 ответ

Множество возможных комбинаций символа и комбинации знаков после него бесконечно (хотя только счетно бесконечно ☺). Стандарт Unicode прямо говорит в пункте 2.1 (в главе 2): "Все комбинирующие символы могут быть применены к любому базовому символу и, в принципе, могут использоваться с любым сценарием". Комбинация буквы и диакритического знака может использоваться как базовый символ для другого диакритика и так далее.

На более высоком уровне протокола, как в спецификации формата данных, вы, конечно, можете наложить ограничение, например, на количество последовательных объединяющих меток. Стандарт Unicode, однако, не устанавливает такие ограничения.

Другие вопросы по тегам