Разбор китайских символов для возможного произношения / индекса CJK?
Я делаю организующую программу (на C#) и пытаюсь создать функцию индексации для индексации CJK (и, по возможности, вьетнамского).
Если есть китайская строка, я хочу проанализировать ее по возможному индексу в китайском пиньинь / чжуинь, штрихах, корейском хангуле, японском хирагане или вьетнамском произношении.
Например, возьмите китайский иероглиф 讀
на странице викисловаря это может быть сделано для:
- Китайский пиньинь
dú
Индекс принадлежитD
- Китайский жуйинь
ㄉㄨˊ
Индекс принадлежитㄉ
- японский язык
よむ
Индекс принадлежитよ
- Корейский индекс
독
- вьетнамский
đọc
Индекс принадлежитĐ
- у него 22 удара.
Я не знаю, что у китайского иероглифа не могло быть однозначного сопоставления, во время аренды я мог бы выбрать возможное / первое сопоставление.
Рекомендуется ли какая-либо существующая библиотека или основа картирования?