Как определить упрощенный вариант Unicode семантического варианта традиционного китайского символа?
Как упоминалось в ответе на таблицу упрощенного китайского Unicode, база данных Unihan указывает, имеет ли традиционный символ упрощенный вариант (kSimplifiedVariant). Однако некоторые символы имеют семантические варианты (kSemanticVariant), которые сами имеют упрощенные варианты. Например, U+8216 舖 имеет семантический вариант U+92EA 鋪, который, в свою очередь, имеет упрощенный вариант U+94FA 铺.
- Должны ли традиционные и упрощенные отображения преобразовывать U + 8216 в U+94FA?
- Если да, какой самый простой способ создания или загрузки полного сопоставления, учитывая, что база данных Unihan не перечисляет U + 94FA как kSimplifiedVariant непосредственно для U+8216, только для промежуточной формы U+92EA?