Как составлять слоговые блоки с помощью хангыль джамо
Я работаю над проектом, который потребовал бы ввода старых блоков слогов Hangul (т.е. блоков слогов Hangul, в которых использовались бы устаревшие символы, такие как ㆅ и ㅿ, расположенные в блоке Unicode Jamo совместимости Hangul), но у меня было довольно трудное время отображения блоков в виде целых блоков (например, 룰) вместо строки разделенных глифов (например, ᅘᆇᇈ). Очевидно, что строки ㄱㅏㅁ, 가ㅁ и equivalent эквивалентны друг другу, но "особенности GSUB" шрифтов хангыль связывают их вместе в разной степени. Из того, что я собрал, аналогичный процесс применяется к хангыль-джамо, в котором он догадывается, как должен формироваться блок, согласно которому следует гласная (как разница между ㄱ в 구 и 기) и не имеет ли он последний согласный (как разница между ㄱ в 가 и 갈).
Я полагаю, что это похоже на то, как будет работать объединяющий диакритический знак, в котором он будет угадывать разницу высот заглавной буквы и крошечной. Есть много латинских шрифтов, которые не поддерживают комбинирование символов, и, учитывая, что хотя ㄱㅏㅁ, 가ㅁ и equal равны, в конце 감 является предварительно составленным символом, и вся цель блока юникода Hangul Jamo такова (согласно статья в Википедии, посвященная этой статье), которая "будет использоваться для динамического составления слогов, которые недоступны в качестве заранее составленных слогов хангыльских языков в Юникоде, в частности, архаичных слогов, содержащих звуки, которые с тех пор фонетически сливались с другими звуками в современном произношении". Это заставляет меня задуматься о том, ведет ли себя хангыльский джамо больше как символы, изменяющие пространство, которые должны были бы сочетаться с { EQ \o(X1,X2) } с их соответствующим символом.
Большая часть того, что я прочитал, говорит о дизайне шрифтов и командных строках, из-за чего кажется, что автор делает нечто большее, чем просто ввод устаревших символов в текстовом процессоре, и все же вот: https://github.com/adobe-fonts/source-han-sans/issues/34. Постер и комментаторы пытаются выяснить композицию хангыль-джамо в форме вертикали, однако они уже составили блоки слогов по горизонтали в текстовом редакторе, но как это нигде не видно.
3 ответа
Хотя Юникод содержит кодовые точки для устаревшего или архаичного джамо (например, ㆅ
а также ㅿ
), нет предварительно составленных форм с этими символами, и они исключены из алгоритма нормализации Unicode, который объединяет / разлагает jamo в блоки слогов (хотя у них действительно есть разложения совместимости в обычный блок jamo Hangul, например ㅾ
U+317E к ᄶ
U+1136).
То есть, что касается Unicode, эти архаичные джамо вообще не образуют слогов хангыльских блоков.
Однако шрифты могут реализовывать свои собственные предварительно составленные формы через ccmp
, ljmo
, vjmo
, а также tjmo
Возможности OpenType для разметки Hangul. Поддержка композиции слогов с использованием этих функций зависит от дизайнера шрифтов и может выходить за рамки поддержки Unicode. Поэтому, если вам нужна поддержка слоговых блоков, которые содержат эти jamo, вам нужно будет найти шрифт с такой поддержкой.
Блок Jamo совместимости с хангыль (U+3130–U+318F) не имеет поведения соединения. Чтобы получить совместное поведение, используйте Jamo from:
- Хангыль Джамо: U+1100–U+11FF
- Расширенный хангыль джамо-A: U+A960–U+A97F
- Расширенный хангыль джамо-B: U+D7B0–U+D7FF
В частности, устаревшими символами в вопросе являются:
- U+3185 ‹ㆅ› \N{HANGUL LETTER SSANGHIEUH}, совпадающая версия которого находится по адресу:
- ᅘ U+1158 ХАНГЫЛЬ ЧОСЕОН ССАНХИЕ (ведущий согласный)
- U + 317F ‹ㅿ› \N{HANGUL LETTER PANSIOS}, который имеет совмещенные версии по адресу:
- ᅀ U+1140 ХАНГЫЛЬ ЧОСЕОН ПАНСИОС (ведущий согласный)
- ᇫ U+11EB HANGUL JONGSEONG PANSIOS (конечный согласный)
Все зависит от шрифта. Некоторые шрифты предоставят вам подключенные формы автоматически, большинство — нет. Единственные полезные, которые я нашел до сих пор:
Malgun Gothic (поставляется с Windows 10)
Hayashi-Serif (можно загрузить бесплатно)