Декодирование FST-графа с помощью символов неоднозначности
У меня есть вход FST, который представляет собой последовательность телефонов: /M/ -> /AY/ -> /N/ -> /D/
Предположим, у меня есть два слова в лексиконе:
mind M AY N D
mindful M AY N D F AH L
После того, как kaldi добавляет символы устранения неоднозначности для лексики, это выглядит так:
mind M AY N D #1
mindful M AY N D F AH L
Когда я составлю Input с LG, он сгенерирует пустой график.
Моя композиция отлично работает для уникальных слов, но не подходит для слов, которые являются префиксами других слов.
Как символы неоднозначности обрабатываются таким образом, что мы можем декодировать слова, которые являются префиксом других слов?