Как составлять слоговые блоки с помощью хангыль джамо

Я работаю над проектом, который потребовал бы ввода старых блоков слогов Hangul (т.е. блоков слогов Hangul, в которых использовались бы устаревшие символы, такие как ㆅ и ㅿ, расположенные в блоке Unicode Jamo совместимости Hangul), но у меня было довольно трудное время отображения блоков в виде целых блоков (например, 룰) вместо строки разделенных глифов (например, ᅘᆇᇈ). Очевидно, что строки ㄱㅏㅁ, 가ㅁ и equivalent эквивалентны друг другу, но "особенности GSUB" шрифтов хангыль связывают их вместе в разной степени. Из того, что я собрал, аналогичный процесс применяется к хангыль-джамо, в котором он догадывается, как должен формироваться блок, согласно которому следует гласная (как разница между ㄱ в 구 и 기) и не имеет ли он последний согласный (как разница между ㄱ в 가 и 갈).

Я полагаю, что это похоже на то, как будет работать объединяющий диакритический знак, в котором он будет угадывать разницу высот заглавной буквы и крошечной. Есть много латинских шрифтов, которые не поддерживают комбинирование символов, и, учитывая, что хотя ㄱㅏㅁ, 가ㅁ и equal равны, в конце 감 является предварительно составленным символом, и вся цель блока юникода Hangul Jamo такова (согласно статья в Википедии, посвященная этой статье), которая "будет использоваться для динамического составления слогов, которые недоступны в качестве заранее составленных слогов хангыльских языков в Юникоде, в частности, архаичных слогов, содержащих звуки, которые с тех пор фонетически сливались с другими звуками в современном произношении". Это заставляет меня задуматься о том, ведет ли себя хангыльский джамо больше как символы, изменяющие пространство, которые должны были бы сочетаться с { EQ \o(X1,X2) } с их соответствующим символом.

Большая часть того, что я прочитал, говорит о дизайне шрифтов и командных строках, из-за чего кажется, что автор делает нечто большее, чем просто ввод устаревших символов в текстовом процессоре, и все же вот: https://github.com/adobe-fonts/source-han-sans/issues/34. Постер и комментаторы пытаются выяснить композицию хангыль-джамо в форме вертикали, однако они уже составили блоки слогов по горизонтали в текстовом редакторе, но как это нигде не видно.

3 ответа

Решение

Хотя Юникод содержит кодовые точки для устаревшего или архаичного джамо (например, а также ), нет предварительно составленных форм с этими символами, и они исключены из алгоритма нормализации Unicode, который объединяет / разлагает jamo в блоки слогов (хотя у них действительно есть разложения совместимости в обычный блок jamo Hangul, например U+317E к U+1136).

То есть, что касается Unicode, эти архаичные джамо вообще не образуют слогов хангыльских блоков.

Однако шрифты могут реализовывать свои собственные предварительно составленные формы через ccmp, ljmo, vjmo, а также tjmo Возможности OpenType для разметки Hangul. Поддержка композиции слогов с использованием этих функций зависит от дизайнера шрифтов и может выходить за рамки поддержки Unicode. Поэтому, если вам нужна поддержка слоговых блоков, которые содержат эти jamo, вам нужно будет найти шрифт с такой поддержкой.

Блок Jamo совместимости с хангыль (U+3130–U+318F) не имеет поведения соединения. Чтобы получить совместное поведение, используйте Jamo from:

  • Хангыль Джамо: U+1100–U+11FF
  • Расширенный хангыль джамо-A: U+A960–U+A97F
  • Расширенный хангыль джамо-B: U+D7B0–U+D7FF

В частности, устаревшими символами в вопросе являются:

  • U+3185 ‹ㆅ› \N{HANGUL LETTER SSANGHIEUH}, совпадающая версия которого находится по адресу:
    • ᅘ U+1158 ХАНГЫЛЬ ЧОСЕОН ССАНХИЕ (ведущий согласный)
  • U + 317F ‹ㅿ› \N{HANGUL LETTER PANSIOS}, который имеет совмещенные версии по адресу:
    • ᅀ U+1140 ХАНГЫЛЬ ЧОСЕОН ПАНСИОС (ведущий согласный)
    • ᇫ U+11EB HANGUL JONGSEONG PANSIOS (конечный согласный)

Все зависит от шрифта. Некоторые шрифты предоставят вам подключенные формы автоматически, большинство — нет. Единственные полезные, которые я нашел до сих пор:

Malgun Gothic (поставляется с Windows 10)

Hayashi-Serif (можно загрузить бесплатно)

Другие вопросы по тегам