CTC: В чем разница между пробелом и пробелом?

В статье 2006 года о темпоральной классификации Connectionist Alex Graves & co. представил модель декодирования речи с 27 метками: 26 для букв алфавита и одна для пустых, что означает отсутствие метки (что я понимаю, как молчание).

Однако я вижу много реализаций CTC, которые используют 28 меток, одна из которых пустая, а другая пробел. До сих пор я не смог найти объяснения необходимости использовать оба этих ярлыка, и для меня они представляют одно и то же.

Не могли бы вы объяснить разницу между пробелом и пробелом в контексте CTC и почему нужны оба этих ярлыка?

0 ответов

В Connectionist Temporal Classification пространство - это просто пробел, а пробел - "-", который мы используем для решения проблемы повторяющегося повторения данных. например, "пицца" будет закодирована как "piz-za".

TL; DR;

ссылка: https://towardsdatascience.com/beam-search-decoding-in-ctc-trained-neural-networks-5a889a3d85a7

В CTC ​​есть проблема, как кодировать повторяющиеся символы. Она решается введением псевдосимвола (называемого пробелом, но не путайте его с "настоящим" пробелом, то есть символом пробела). Этот специальный символ будет обозначен в тексте как "-". Мы используем хитроумную схему кодирования для решения проблемы повторяющихся символов: при кодировании текста мы можем вставить произвольное количество пробелов в любую позицию, которые будут удалены при его декодировании. Однако мы должны вставить пробел между повторяющимися символами, как в "привет". Далее, мы можем повторять каждый символ так часто, как захотим. Давайте рассмотрим несколько примеров: "to" → "--- ttttttooo", или "-to-", или "to", "too" → "--- ttttto-o", или "-too-", или " to-o ", но не" слишком ". Как видите, эта схема также позволяет нам легко создавать различные выравнивания одного и того же текста, например"To", "too" и "-to" представляют один и тот же текст ("to"), но с разным выравниванием изображения. NN обучается выводить закодированный текст (закодированный в выходной матрице NN).

Другие вопросы по тегам